本文へジャンプ

Human Computer Interaction

コンピューターシステムを実際に使うのは生身の人間です。より様々な状況下で、また、様々なハンディキャップを持った人々にも使いこなせるよう、ユーザーインターフェースにも不断の改良が求められています。東京基礎研究所では特に、音声技術と視覚障害者向けのアクセシビリティ技術において、業界を大きくリードしています。

研究分野

ロバスト音声認識

このプロジェクトでは、人間の聞き取り能力を上回る性能を持つ音声認識機能の実現を目標としています。まず実使用環境下での性能改善のため、音響処理の観点からは、定常騒音、突発性雑音の除去、マルチマイクロフォンを用いた目的話者の発話の検出および強調処理、残響の除去といった研究をしています。また言語処理の観点からは、自由発話の正確な書き起こしに向けて言い淀みのモデル化、未知語の自動獲得といった研究を推進しています。また、音声認識の利便性を高めるため、音声による場所表現の頑健な検索など音声理解の研究も精力的に行っています。

テキスト音声合成

このプロジェクトでは、個性に富み、人間味のある音声合成システムの実現を目標としています。従来のテキスト音声合成の出力では、内容は正確に聞き取れるものの、対象とする話者が本来持つ個性は失われがちでした。対象話者の収録音声から、波形生成に用いられる音響特徴量等のパラメータやモデルを学習するだけではなく、言語処理においても音声から抽出された特徴量から言語モデルを構築することで、対象となるドメインを限定すれば、対象話者の生録音音声と遜色のない合成音声をテキストだけから生成できるようになりました。全自動構築可能な音声合成システムの構築とともに、さらなる自然性の改善、人間味のある音声合成を実現するため、楽しい、悲しいといった感情を合成音声に反映させる感情音声合成の研究にも取り組んでいます。 


音声分析技術

さまざまなビジネスの局面で、CRMやコンプライアンスチェックのため、テキストのみならず、お客様との音声による「やりとり」を分析することが望まれています。従来、対話における自由発話の音声認識は難しいとされてきましたが、ここ数年著しい進歩がありました。本プロジェクトでは主としてコールセンターでの対話音声を対象とし、発話内容を時刻情報とともに正確に文字化する技術、録音に含まれる複数の話者の発話や音楽、雑音などを検出し、分離・分類する技術、発話に含まれる快・不快などの感情を言語的および音響的に検出する技術、長時間対話の主導権の遷移を概観するための技術などの研究に取り組んでいます。

集合知によるディスカッションシステム

従来のオンラインディスカッションシステムでは、議論の内容を理解するのに時間がかかる、返答を得るまでに時間がかかる、適切な知識を持ったユーザーからの返答が得られにくい等の様々な問題がありました。これらの問題を解決するために、クラウドソーシングの仕組みと、テキスト解析・ソーシャルネットワーク解析を統合したディスカッションシステムの研究をしています。これらの技術の統合により、ディスカッションの内容を視覚化・構造化し、理解しやすいものとします。また、多くのユーザーの参加を促すシステムの実現を目指して研究をしています。

ソーシャル・コンピューティングによるアクセシビリティ

世界には障害者、高齢者、非識字者などウェブアクセスに問題をかかえる様々なユーザーが居ます。その数は合わせて10億人以上。多様化するウェブのアクセシビリティへの要求はもはや開発者だけでは対処できなくなっています。このプロジェクトでは、開発者だけでなくユーザーやボランティアコミュニティなど多くの人々が協力し、集合知によってアクセシビリティを向上するという革新的なサービスの研究に取り組んでいます。


ささやき:音声によるウェブナビゲーションの支援技術

「ささやき」はユーザーに対して音声を通じて支援を行うシステムです。システムはユーザーの行動や状況を読み取り、適切なフィードバックを音声で提供します。システムはページの使い方や、ページのテキストの要約などを提供することが可能です。高齢の方、視覚障害をお持ちの方に協力いただいたウェブブラウジングの実験では、ユーザーはささやきがあることによってより自信を持って操作ができるという結果が得られました。コンピュータをはじめ、駅の券売機、ATM、車など様々な「ささやき」の応用を目指して研究をしています。

文書のデジタル化

書籍や帳票などの紙媒体に記載された文書を効率よく電子化するための研究をしています。紙媒体から正確にテキスト情報を抽出し適切に構造化するためには、文書のレイアウトや文字、文書構造(見出しなど)の機械認識精度を向上すること、および、認識結果の人手による修正作業を支援することが必要です。さらには、人手による修正結果をコンピューターに学習させて認識精度を向上するなど、人とコンピューターが連携して文書のデジタル化効率を継続的に高めていくようなシステムの構築を目指しています。

テキスト処理支援ツール

グローバル化が進む企業においては、他言語/多言語の文書が存在し、お客様とのやり取りや技術的作業に際しても、高品質の文書が要求されてきています。私たちは自然言語処理技術を活用して、文書校正・翻訳・サニタイズ/マスキングなどの作業をサポートするツールを研究・開発しています。

東京基礎研究所Twitter

IBM Research Twitter Feed

Get the latest updates from IBM Research via Twitter. Join in the conversation today!