|
|
 |
|
自動要約
| | |
プロジェクトの概要
自動要約プロジェクトでは、ドキュメントから自動的に要約を生成するための
研究を行っています。人間は深い意味理解に基づく要約を行っていますが、
コンピューターではまだそれはできません。その代わり、表層の様々な特徴から
文の重要度を計算し、重要な文を取り出すことで擬似的に要約を作成するという
ことが可能です。本プロジェクトでは、この重要文抽出に関わる研究を行っています。
研究項目
- 重要文抽出手法 ...
それぞれの文の重要度は、それに含まれている重要なキーワードの数、
その文のタイプ(事実、推測、主張等)、前後の文脈との接続関係、文の位置等から決めることが
できます。要約は、基本的に重要度の高い方から文を幾つか選択することにより生成されます。
しかし、単純に取り出しただけでは、できあがった要約文章は
文章としての繋がり具合(結束性)がおかしくなってしまうので、
選択された文の接続関係に応じて前後の文も同時に取り出すなどの工夫が必要となります。
- 文章タイプ別要約手法 ...
文章のタイプ(例えば、新聞で言えば、一般記事と社説等)に
より要約の仕方は変わるはずです。これは文の重要度を計算する時に、上記の様々な特徴素
の重みを変化させなければならないことになります。そこで、実験結果から、文章タイプ毎に
最適な重みを決定する手法を開発しました。
システム・製品
 |
インターネット翻訳の王様 ... 日本IBMが開発したWEB翻訳システムです。
本研究の成果が、英語のWEBページを要約する機能として使われています。
|
 |
Lotus WordPro ... ロータス・ワードプロ日本語版で本研究の成果が要約機能として使われています。
|
メディアでの紹介
- 1997年9月10日付朝日新聞夕刊 「パソコン流文章要約術」
- 月刊言語1998年2月号,中野潔「要約ソフトが突きつける読むの意味」,pp54--59,Vol.27,No.2
|
|
| |
|