本文へジャンプ

金山 博

Hiroshi Kanayama

日本アイ・ビー・エム株式会社 東京基礎研究所 主任研究員

興味を持つ分野

 「自然言語処理」に関する研究をしています。 これは、人々が普段書いたり話したりしている言葉を、(1)機械に理解させる (2)機械を使ってわかりやすくする (3)機械にとって扱いやすいデータとして蓄える、といったことを目指す分野です。

 (1)は、「暑い!」と叫んだら冷房が自動的に入ったり、「かわいいね」と言ったらロボットが頬を赤らめるための技術。
 (2)は、日本語を英語・韓国語・簡単な日本語・手話・点字などに変換して、元の文を読めない(読みづらい)人でも理解できるようにするための技術。
 (3)は、人が書いた(しばしば大量の)文を、機械が得意とする形にする技術です。 例えば、「私の名前は鈴木太郎で、横浜市に住んでいます。」という文から、「名前=鈴木太郎, 住所=神奈川県横浜市」という解釈ができれば、人間向けの言葉が、機械のためのデータに変わるのです。

 これらを実現するために、古くから、「言語的知識に基づく自然言語処理」、すなわち、大量の文法規則・単語辞書・常識などを記述していく方法が試されてきました。 しかし、例外的な文の存在、表現の曖昧性、時代による言葉の変化といった難しい問題があり、人間並みの柔軟性を持って言語を理解するような機械を作ることは困難でした。 そこで近年においては、複雑な文法規則などを使わずに、大量の文章から言葉の使われる傾向を取り出す「統計に基づく自然言語処理」が盛んに研究されています。

 私の研究は主に、言語的知識と統計の両方を用いて、上記の(2)や(3)を目指すものです。 人間が持っている言語の知識のうち、機械に教えてあげやすい(人間がデータとして入力しやすい)知識はできるだけ使って、そうでない部分は大量のデータを用いて機械自身に学んでもらう。そして、機械が身につけた知識を、機械が使うだけでなく、人間にも理解できる形にすれば、人間と機械の双方が賢くなっていくのです。

主な研究内容

発表した論文・講演

論文誌

国際会議

国際ワークショップ(査読なし)

国内会議

解説等

講演, 講義

受賞・その他

受賞

学会活動

連絡先

242-8502 神奈川県大和市下鶴間1623-14 日本アイ・ビー・エム株式会社東京基礎研究所
hkana AT jp DOT ibm DOT com

English Page

Photo


Hiroshi Kanayama

コンテンツ・ナビゲーション