|
プロジェクトの概要
機械翻訳プロジェクトでは、
コンピューターによる言葉の解析及び翻訳の研究をしています。
構文解析・曖昧性解消などの翻訳に使われる技術は、
自然言語処理の中で重要な部分を占めているため、
翻訳以外のアプリケーションにも応用させています。
研究項目
- データに基づく翻訳
- パターンベース翻訳 ...
大量の翻訳パターンを用いて自然な翻訳を行おうとするものです。詳細はこちらをご覧ください。
- 用例/文脈ベース処理技術 ...
翻訳用例や文脈を、機械翻訳や解析の曖昧性解消などに使用する技術の開発をしています。
- 統語解析
- 日本語形態素解析 ...
高速で高精度の日本語形態素解析システムです。機械翻訳を始めとしてキーワード抽出や音声認識など、様々な言語処理システムで使用されています。
- 日本語構文解析 ...
上記の形態素解析の結果をもとに、各単語の係り先となる単語を文中から選択し、構文構造を出力するシステムです。
日本語から英語への翻訳の要素技術であるとともに、
テキストマイニングなどにおける処理の高度化にも利用されています。
- 言語的注釈付け
言語処理を援助するような情報(例えば単語間の係受け)をオリジナルのテキストに
LAL(Linguistic Annotation Language)というXMLベースのタグセットを用いて付与し,
機械翻訳などの精度を向上させるというを研究行っています。
LALについて、詳しくはこちらをご覧ください。
- 多言語翻訳
日本語からブラジルポルトガル語、イタリア語から韓国語など、任意の言語から任意の言語に翻訳するシステムを
効率よく構築する手法について研究しています。
- 翻訳自動評価
機械翻訳の訳出の質を客観的に自動評価する手法を考案し、システムの性能向上に役立てています。
システム・製品
 |
インターネット翻訳の王様 ... 日本IBMが開発したWeb翻訳システムです。ここで紹介したパターンベース翻訳エンジンを搭載しています。
|
|
WebSphere Translation Server ... 各国のIBMが共同開発した、サーバーサイドでWebページ等を翻訳するソフトウェアです。英語と9カ国語間相互の翻訳エンジンのうち、日本語→英語・英語→日本語のエンジンにTRLの技術が使われています。
|
|
|
学会での発表・論文・著作物
各国IBM研究所との協業
|
|