プロフィール

スピーチ・テクノロジー担当
主席研究員 (Senior Technical Staff Member - Manager of Research)
IBM Research Master Inventor
博士(工学)
連絡先
略歴:
1981年 大阪大学基礎工学部生物工学科卒.
1983年 大阪大学大学院基礎工学研究科物理系博士前期課程修了.
同年日本アイビーエム(株)入社.Japan Science Institute (後の東京基礎研究所)に配属される.
以来,一貫して音声認識・音声合成技術の研究開発に従事.研究成果としては日本語ディクテーションソフトViaVoiceやコールセンターのモニタリングシステム等.最近は音声技術の医療分野への応用にも関心がある.
1998年 学位取得 博士(工学).
2003年 IBM Senior Technical Staff Member就任.
2010年 IBM Research Master Inventor就任.
現在,同研究所でスピーチテクノロジーグループを担当.
米国電気電子学会(IEEE) Senior Member,電子情報通信学会(IEICE)シニア会員ならびに日本音響学会(ASJ),情報処理学会(IPSJ)各会員.各学会の査読委員等のほか,情報処理学会音声言語情報処理研究会運営委員,文部科学省科学技術政策研究所専門調査委員,電子情報通信学会編集顧問なども務めています.
論文
学会論文(査読あり)
-
[1] "中間累積距離と音節間類似度を用いた単音節音声認識,"
西村雅史, 松田安弘,
情報処理学会論文誌, 第27巻, 第1号, pp.41-48, 1986. -
[2] “フェノニックマルコフモデルに基づく音声認識のための話者適応化法,”
西村雅史,
電子情報通信学会論文誌, D-II, Vol. J73-D-II, No.10, pp.1630-1638, 1990. -
[3] “Speaker adaptation method for fenonic Markov model-based speech recognition,”
Masafumi Nishimura,
Systems and Computers in Japan, Vol.22, No.13, pp.47-58, 1991. (上記論文[2]の英訳) -
[4] “汎用音声処理カードによる大語彙音声認識,”
黒田明裕, 西村雅史,
情報処理学会論文誌, 第35巻, 第8号, pp.1549-1554, 1994. -
[5] “クラスに基づく言語モデルのための単語クラスタリング,”
森信介, 西村雅史, 伊東伸泰,
情報処理学会論文誌, 第38巻, 第11号, pp.2200-2208, 1997. -
[6] “単語を認識単位とした日本語ディクテーションシステム,”
西村雅史, 伊東伸泰,
電子情報通信学会論文誌,D-II, Vol. J81-D-II, No.1, pp.1-8, 1998.1. -
[7] "単語単位による日本語言語モデルの検討,"
伊東伸泰, 西村雅史, 荻野紫穂, 山崎一孝,
自然言語処理, Vol.6, No.1, pp. 9-28, Jan 1999. -
[8] "Wavelet analysis for text-to-speech synthesis, "
Mei Kobayashi, Masaharu Sakamoto, Takeshi Saito, Yasuhide Hashimoto, Masafumi Nishimura, Kazuhiro Suzuki,
IEEE Circuits & Systems, Vol. 45, No. 8, Aug. 1998, pp. 1125-1129. -
[9] "単語を認識単位とした日本語の大語彙連続音声認識,"
西村雅史, 伊東伸泰, 山崎一孝,
情報処理学会論文誌, Vol.40, No.4, pp.1395-1403, 1999-4. -
[10] "講義コーパスを用いた自由発話の大語彙連続音声認識,",
西村雅史, 伊東伸泰,
電子情報通信学会論文誌, D-2, J83-D2, pp.2473-2480, 2000, 11. -
[11] "Large vocabulary spontaneous-speech recognition using a corpus of lectures,"
M.Nishimura, N.Itoh,
Electronics and Communications in Japan, Vol.86, No.9 (2003.Sep) (上記論文[9]の英訳) -
[12] "Speech enhancement by Profile Fitting method,"
O.Ichikawa, T.Takiguchi, M.Nishimura,
IEICE Transaction, Vol.E86D No.3, pp.514-521, 2003. -
[13] "Improved HMM Separation for Distant-Talking Speech Recognition,"
T.Takiguchi, M.Nishimura,
IEICE Trnsaction, Vol.E87-D, No.5, pp.1127-1137, 2004. -
[14] "Sound source localization using a pinna-based Profile Fitting method,"
O.Ichikawa, T.Takiguchi, M.Nishimura,
IEICE Transaction, Vol.E87-D No.5, pp.1138-1145, 2004. -
[15] "Simultaneous adaptation of echo cancellation and spectral subtraction for in-car speech recognition,"
O.Ichikawa, M.Nishimura,
IEICE Transaction, Vol.E88A No.7, pp.1732-1738, 2005. -
[16] "N-gram確率モデルを用いた音声合成のための読み及びアクセント推定,"
長野 徹, 森 信介, 西村 雅史
情報処理学会論文誌, Vol.47, No.6 (2006) -
[17] "Acoustic Model Adaptation Using First-Order Linear Prediction for Reverberant Speech”,
T. Takiguchi, M. Nishimura, and Y. Ariki,
IEICE Trans. Inf. & Syst., Vol. E89-D, No. 3, pp. 908-914, 2006. -
[18] "Automatic Prosody Labeling using Multiple Models for Japanese,"
R.Tachibana, T.Nagano, G.Kurata, M.Nishimura, N.Babaguchi,
IEICE Transactions on Information and Systems, Vol.E90-D, No.11, pp.1805-1812, 2007. -
[19] "講義関連コーパスを利用した音声認識システムの自動適応,"
倉田岳人,森信介,西村雅史,
電子情報通信学会論文誌,Vol.J90-D, No.9, pp.2530-2540, 2007. -
[20] "音声とテキストを用いた認識単語辞書の自動構築,"
倉田 岳人, 森 信介, 伊東 伸泰, 西村 雅史
情報処理学会論文誌, Vol.49, No.8, pp.2900-2909, 2008. -
[21] "Local peak enhancement for in-car speech recognition in noisy environment,"
O.Ichikawa, T.Fukuda, M.Nishimura,
IEICE Transaction, Vol.E91D No.3, pp.635-639, 2008. -
[22] "DOA Estimation with Local-Peak-Weighted CSP,"
Ichikawa, O., Fukuda, T., Nishimura, M.,
Trans. EURASIP, Volume 2010, Article ID 358729, 9 pages, 2010, May. -
[23]“Long-term spectro-temporal and static harmonic features for voice activity detection,”
Fukuda, T., Ichikawa, O., Nishimura, M.,
IEEE Journal of Selected Topics in Signal Processing, Vol.4, No.5, pp. 834-844, October, 2010. -
[24]“Dynamic Features in the Linear-Logarithmic Hybrid Domain for Automatic Speech Recognition in a Reverberant Environment,"
Ichikawa, O., Fukuda, T., Nishimura, M.,
IEEE Journal of Selected Topics in Signal Processing, Vol 4, No.5, pp. 816-823, October, 2010. -
[25] "ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討,"
倉田岳人, 市川治,西村雅史, 電子情報通信学会論文誌 D-II Vol,J93-D, No.10, pp.2107-2117, Oct., 2010. -
[26] "コーパスベース日本語音声合成フロントエンド,"
長野徹, 立花隆輝, 西村雅史 電子情報通信学会論文誌 D-II Vol, J93-D, No.10, pp.2096-2106, Oct., 2010. -
[27] "Acoustically Discriminative Language Model Training with Pseudo-hypothesis,"
Gakuto Kurata, Abhinav Sethy, Bhuvana Ramabhadran, Ariya Rastrow, Nobuyasu Itoh, Masafumi Nishimura,
Speech Communication, Vol.54, Issue 2, pp.219-228, February 2012. -
[28] "Leveraging Word Confusion Networks for Named Entity Modeling and Detection from Conversational Telephone Speech,"
Gakuto Kurata, Nobuyasu Itoh, Masafumi Nishimura, Abhinav Sethy, Bhuvana Ramabhadran,
Speech Communication, Vol.54, Issue 3, pp.491-502, March 2012.
国際会議論文 (査読あり)
-
[1] "A Method for recognizing Japanese monosyllables by using intermediate cumulative distance,"
Yasuhiro Matsuda, Shu Tezuka, Mitsuhiko Kanoh, Masafumi Nishimura and Toyohisa Kaneko,
IEEE ICASSP'84, 9.3, 1984. -
[2] "Isolated word recognition using hidden Markov models,"
Kazuhide Sugawara, Masafumi Nishimura Koichi Toshioka Masaaki Okochi and Toyohisa Kaneko,
IEEE ICASSP'85, 1.1, 1985. -
[3] "Isolated word recognition using HMM with duration distribution,"
Masafumi Nishimura and Masakai Okochi,
ICA-12, A1-8, 1986. -
[4] "Speaker adaptation for a hidden Markov model,"
Kazuhide Sugawara, Masafumi Nishimura and Akihiro Kuroda,
IEEE ICASSP'86, 49.11, 1986. -
[5] "HMM-based speech recognition using multi-dimensional multi-labeling,"
Masafumi Nishimura and Koichi Toshioka,
IEEE ICASSP'87, 27.11, 1987. -
[6] "Speaker adaptation method for HMM-based speech recognition,"
Masafumi Nishimura and Kazuhide Sugawara,
IEEE ICASSP'88, S5.7, 1988. -
[7] "HMM-based speech recognition using dynamic spectral feature,"
Masafumi Nishimura,
IEEE ICASSP'89, S6.12, 1989. -
[8] "Word Clustering for a Word Bi-gram Model,"
Shinsuke Mori, Masafumi Nishimura, Nobuyasu Itoh
ICSLP 1998 -
[9] "Recognizing overlapping speech by using HMM composition,"
T.Takiguchi, M.Nishimura,
The seventh Western Pacific Regional Acoustics Conference, 2000. -
[10] "A method for sytle adaptation to spontaneous speech by using a semi-linear interpolation technique,"
N.Itoh, M.Nishimura,
Proc of 6th ICSLP, Oct, 2000. -
[11] "Integration of HMM composition and a microphone array for overlapping speech recognition,"
T.Takiguchi, M.Nishimura,
Workshop on Hands-free speech communication, pp.127-130, 2001. -
[12] "A Stochastic Parser Based on a Structural Word Prediction Model,"
Shinsuke MORI, Masafumi NISHIMURA, Nobuyasu ITOH, Shiho OGINO, Hideo WATANABE
Proc. of Coling 2000, pp. 558-564, 2000. -
[13] "Improvement of a Structured Language Model: Arbori-context Tree,"
Shinsuke MORI, Masafumi NISHIMURA, Nobuyasu ITOH
Proc. of EuroSpeech 2001, pp. 713-716, 2001. -
[14] "An automatic sentence boundary detector based on a structured language model,"
S.Mori, M.Nishimura and N.Itoh,
Proc. of ICSLP 2002., pp.921-924, Sep. 2002. -
[15] "Sound source localization using a pinna-based Profile Fitting method,"
O.Ichikawa, T.Takiguchi, M.Nishimura,
International Workshop on Acoustic Echo and Noise Control(IWAENC), pp.263-266, 2003. -
[16] "Reverberant Speech Recognition using First-Order Linear Prediction,"
T.Takiguchi, M.Nishimura,
Proc. of International Congress on Acoustics, pp.2829-2830. 2003. -
[17] "Language Model Adaptation Using Word Clustering,"
Shinsuke MORI, Masafumi NISHIMURA, Nobuyasu ITOH
Proc. of EuroSpeech 2003, pp.425-428, 2003. - [18] "Acoustic Model Adaptation using First Order Prediction for Reverberant Speech," T.Takiguchi, M.Nishimura, Proc. IEEE International Conf. on Acoustics, Speech and Signal Processing, pp.869-872. 2004.
-
[19] "A Stochastic Approach to Phoneme and Accent Estimation,"
Tohru NAGANO, Shinsuke MORI, Masafumi NISHIMURA
EuroSpeech 2005 -
[20] "Simultaneous adaptation of echo cancellation and spectral subtraction for in-car speech recognition,"
Osamu Ichikawa and Masafumi Nishimura,
Proc. of European Conference on Speech Communication and Technology (EuroSpeech / InterSpeech) 2005, pp.2293-2296, 2005. -
[21] "Unsupervised Adaptation of a Stochastic Language Model Using a Japanese Raw Corpus,"
Gakuto KURATA, Shinsuke MORI, Masafumi NISHIMURA
ICASSP 2006.6. -
[22] "Unsupervised Lexicon Acquisition from Speech and Text, "
G.KURATA, S.MORI, N.ITOH, M.NISHIMURA,
Proc. of ICASSP 2007, Vol.4, pp.421-424, 2007. -
[23] "Preliminary Experiments toward Automatic Generation of New TTS Voices from Recorded Speech Alone,"
R.Tachibana, T.Nagano, G.Kurata, M.Nishimura, N.Babaguchi,
Proc. of INTERSPEECH, 2007. -
[24] "Short- and Long-term Dynamic Features for Robust Speech Recognition,"
T.Fukuda, O.Ichikawa, M.Nishimura,
Proc of Interspeech 2008, pp.2262-2265, 2008. -
[25] "Phone-duration-dependent Long-term Dynamic Features for Stochastic Model-based Voice Activity Detection,"
T.Fukuda, O.Ichikawa, M.Nishimura,
Proc of Interspeech 2008, pp.1293-1296, 2008. -
[26] "Improving Phoneme and Accent Estimation by Leveraging a Dictionary for a Stochatic TTS Front-end,"
T.Nagano, R.Tachibana, N. Itoh, and M.Nishimura,
Proc.,IEEE ICASSP 2008, pp.4689-4692, 2008. -
[27]“Local Peak Enhancement Combined with Noise Reduction Algorithms for Robust Automatic Speech Recognition in Automobiles,”
O.Ichikawa, T.Fukuda, M.Nishimura,
IEEE ICASSP 2008, pp.4865-4868, 2008. -
[28]“Acoustically Discriminative Training for Language Models”,
Gakuto KURATA, Nobuyasu ITOH, Masafumi NISHIMURA,
Proc. Of ICASSP 2009, Apri. 2009 -
[29] "Japanese Pitch Conversion for Voice Morphing Based on Differential Modeling,"
Ryuki Tachibana, Zhiwei Shuang, Masafumi Nishimura,
InterSpeech 2009, Sep. 2009. -
[30]“Dynamic Features in the Linear Domain for Robust Automatic Speech Recognition in a Reverberant Environment”,
Osamu Ichikawa, Takashi Fukuda, Masafumi Nishimura,
Interspeech 2009, Sep. 2009 -
[31]“Improved voice activity detection using static harmonic features,”
Fukuda, T., Ichikawa, O., Nishimura, M.,
International conference on acoustic, speech, and signal processing (ICASSP), pp. 4482-4485, 2010, March. -
[32]“Speech Synthesis by Modeling Harmonics Structure with Multiple Function”,
Nakashika, T., Tachibana, R., Nishimura, M., Takiguchi, T., Ariki, Y,
INTERSPEECH 2010, pp.295-948, Sep., 2010. -
[33] "Named Entity Recognition from Conversational Telephone Speech Leveraging Word Confusion Networks for Training and Recognition,”
Gakuto Kurata, Nobuyasu Itoh, Masafumi Nishimura, Abhinav Sethy, Bhuvana Ramabhadran,
Proc. of ICASSP 2011, pp.5576-5579, May, 2011. -
[34] "Training of Error-Corrective Model for ASR without Using Audio Data,"
Gakuto Kurata, Nobuyasu Itoh, Masafumi Nishimura,
Proc. of ICASSP 2011, pp.5572-5575, May, 2011. -
[35] "Acoutic Model Training with Detecting Transcription Errors in the Training Data,"
Gakuto Kurata, Nobuyasu Itoh, Masafumi Nishimura,
INTERSPEECH 2011, Aug., 2011. -
[36] "Combining feature space discriminative training with long-term spectro-temporal features for noise-robust speech recognition,"
Takashi Fukuda, Osamu Ichikawa, Masafumi Nishimura,
INTERSPEECH 2011, Aug., 2011. -
[37] "Agglomerative Hierarchical Clustering of Emotions in Speech Based on Subjective Relative Similarity,"
Ryoichi Takashima, Tohru Nagano, Ryuki Tachibana, Masafumi Nishimura,
INTERSPEECH 2011, Aug., 2011. -
[38] "Breath-detection-based Telephony Speech Phrasing,"
Takashi Fukuda, Osamu Ichikawa, Masafumi Nishimura,
INTERSPEECH 2011, Aug., 2011. -
[39] "Continuous Digits Recognition Leveraging Invariant Structure,"
Masayuki Suzuki, Gakuto Kurata, Masafumi Nishimura, Nobuaki Minematsu,
INTERSPEECH 2011, Aug., 2011. -
[40] "Model-based noise reduction leveraging frequency-wise confidence metric for in-car speech recognition,"
Osamu Ichikawa, Steven Rennie, Takashi Fukuda, Masafumi Nishimura,
SP-P16, ICASSP 2012, March 2012. -
[41] "Disicriminative Reranking for LVCSR Leveraging Invariant Structure,"
Masayuki Suzuki, Gakuto Kurata, Masafumi Nishimura, Nobuaki Minematsu,
INTERSPEECH 2012, Sep., 2012. (To Appear)
国内学会発表論文 (査読なし)
-
[1] “単音節認識における発声上の諸要因に関する検討,”
西村雅史, 松田安弘, 手塚集,
情報処理学会第28回全国大会, 2L-5, pp.901-902, 1984年3月. -
[2] “単音節認識のためのマルチテンプレート方式に関する一考察,”
西村雅史, 松田安弘, 手塚集, 金子豊久,
日本音響学会講演論文集, 1-3-8, pp.63-64, 1984年3月. -
[3] “単音節認識における候補の再評価方法,”
西村雅史, 松田安弘, 手塚集,
情報処理学会第29回全国大会, 4Q-4, pp1327-1328, 1984年9月. -
[4] “中間累積距離を用いた単音節の認識実験,”
西村雅史, 松田安弘, 手塚集,
日本音響学会音声研究会, S84-23, pp.175-182, 1984年6月. -
[5] “単音節認識のためのマルチテンプレート方式に関する一考察,”
西村雅史, 松田安弘,
日本音響学会講演論文集, 1-9-3, pp.5-6, 1984年10月. -
[6] “状態の継続長を反映したマルコフ・モデルによる音声認識,”
西村雅史, 大河内正明,
日本音響学会講演論文集, 1-4-18, pp.35-36, 1985年9月. -
[7] “状態の継続時間分布を反映したマルコフ・モデルによる音声認識,”
大河内正明, 西村雅史,
情報処理学会第31回全国大会, 3N-3, 1985年9月. -
[8] “マフコフモデルの適応化方式,”
菅原一秀, 西村雅史, 黒田明裕,
日本音響学会講演論文集, 1-1-12, pp.23-24, 1986年3月. -
[9] “状態の継続長を反映したマルコフ・モデルによる音声認識 - 端点の確率的切り出しの導入,”
西村雅史, 大河内正明,
日本音響学会講演論文集, 3-1-10, pp.103-104, 1986年3月. -
[10] “マルチ・ラベリング手法を用いたHMMによる音声認識,”
西村雅史,年岡晃一,
日本音響学会講演論文集, 3-5-11, pp.143-144, 1986年10月. -
[11] “ベクトル量子化に基づく音声認識用雑音適応化音声/雑音判別方法,”
西村雅史,
情報処理学会第34界全国大会, 7D-5, pp.1785-1786, 1987年3月. -
[12] “HMMにおける話者適応化,”
西村雅史, 菅原一秀, 年岡晃一, 大河内正明,
日本音響学会講演論文集, 2-5-17, pp.83-84, 1987年10月. -
[13] “スペクトルの静的・動的特徴を独立に評価するHMMによる音声認識,”
西村雅史,
日本音響学会講演論文集, 2-P-25, pp.251-252, 1988年10月. -
[14] “統計的性質を用いた量子化コードブックの話者適応化,”
西村雅史,
日本音響学会講演論文集, 2-6-8, pp.61-62, 1989年3月. -
[15] “フェノニックマルコフモデルを使った大語彙音声認識,”
西村雅史, 橋本泰秀, 菅原一秀,
日本音響学会講演論文集, 1-1-19, pp.37-38, 1992年3月. -
[16] “フェノニック異音モデル網による音声認識の検討,”
西村雅史, 橋本泰秀,
日本音響学会講演論文集, 2-1-19, pp.115-116, 1992年10月. -
[17] “連続分布フェノニックマルコフモデルによる音声認識,”
西村雅史, 橋本泰秀, 大河内正明,
日本音響学会講演論文集, 2-P-24, pp.205-206, 1994年3月. -
[18] “多数話者テンプレートを用いたフェノニックマルコフモデルの性能評価,”
橋本泰秀, 阪本正治, 西村雅史,
日本音響学会講演論文集, 2-P-23, pp.203-204, 1994年3月. -
[19] “ウェーブレット変換を使った音声認識,”
阪本正治, 西村雅史,
日本音響学会講演論文集, 1-Q-1, pp.117-118, 1994年3月. -
[20] “日本語文音声認識システムを利用した音声圧縮・編集方法の提案,”
西村雅史, 阪本正治, 大嶋良明, 斎藤隆, 鈴木和洋,
情報処理学会第49回全国大会, 6G-10, pp.2-71-72, 1994年9月. -
[21] “Decision Treeによる日本語音素環境クラスタリングの検討,”
大嶋良明, 西村雅史,
情報処理学会第49回全国大会, 6G-1, pp.2-53-54, 1994年9月. -
[22] “日本語Dictation Systemのための統計的言語モデルに関する一考察,”
西村雅史, 大嶋良明, 野崎広志,
情報処理学会第51回全国大会, 3R-7, pp.2-117-118, 1995年9月. -
[23] “人の発声単位を考慮した日本語言語モデルの検討 -日本語における単語とは,”
伊東伸泰, 西村雅史, 荻野紫穂, 山崎一孝,
情報処理学会自然言語処理研究会, 116-9, pp.57-64, 1996年11月. -
[24] “離散単語発声による日本語ディクテーションシステムについて,”
西村雅史, 伊東伸泰,
日本音響学会講演論文集, 3-3-9, pp.103-104, 1996年9月. -
[25] “単語を認識単位とした日本語ディクテーションシステム,”
西村雅史, 伊東伸泰, 山崎一孝, 荻野紫穂,
情報処理学会音声言語情報処理研究会, 15-5, pp.27-34, 1997年2月.
-
[26] “単語を認識単位とした日本語大語彙連続音声認識,”
西村雅史, 伊東伸泰, 山崎一孝, 荻野紫穂,
日本音響学会講演論文集, 3-1-5, 1997年9月. -
[27] ‘’N-gramを用いた日本語テキストの単語単位への分割,’’
伊東伸泰, 西村雅史,
情報処理学会自然言語処理研究会, 122-9, pp.57-62, 1997年11月. -
[28] "単語を認識単位とした日本語の大語彙連続音声認識," (山下記念研究賞受賞)
西村雅史,伊東伸泰, 山崎一孝, 荻野紫穂
情報処理学会音声言語情報処理研究会,1998.2 -
[29] "ここまでできるぞ音声/言語処理技術:音声編,"
西村雅史他 (共著17名)
情報処理学会音声言語情報処理研究会, 1998.5 -
[30] "ニュース音声書き起しシステムに関する検討," (日本音響学会ポスター賞受賞)
西村雅史, 伊東伸泰,
日本音響学会講演論文集, 1-R-14, pp.145-146, 1998.9. -
[31] "放送音声の書き起しに関する検討," (研究会ポジションペーパー)
西村雅史, 伊東伸泰,
情報処理学会音声言語情報処理研究会,SLP99-25-6, pp.31-32, 1999.2 -
[32] "音声認識・合成によるホームページの閲覧方式,"
北村 浩三, 浅川 智恵子, 伊藤 隆, 伊東 伸泰, 西村雅史,
情報処理学会音声言語情報処理研究会,SLP99(14), pp.7-12, 1999.2 -
[33] (招待講演) "日本語ディクテーションシステムの現状と今後の課題,"
西村雅史
情報処理学会音声言語情報処理研究会,SLP99-29-2, 1999.12 -
[34] 放送大学コーパスを用いた自由発話の大語彙連続音声認識
西村 雅史, 伊東 伸泰, 森 信介
音響学会春季研究発表会 (2000) -
[35] 形態素単位の係り受けによる構文解析
森 信介, 西村 雅史, 伊東 伸泰, 荻野 紫穂, 渡辺 日出雄
言語処理学会年次大会 (2000) -
[36] 形態素係り受けモデルによる構文解析
森 信介, 西村 雅史, 伊東 伸泰, 荻野 紫穂, 渡辺 日出雄
情報処理学会自然言語処理研究会 (2000-NL-140) -
[37] "調波構造と音源方向を利用した音声強調手法の検討," (粟屋潔学術奨励賞受賞)
滝口哲也,坂本正治, 西村雅史,
日本音響学会春季研究発表会講演論文集,3-P-7, 2002, 3. -
[38] プロファイルフィッティング法による雑音抑圧処理
市川治,滝口哲也,西村雅史
電子情報通信学会音声研究会, SP2002-21, pp. 19-23, 2002-5. -
[39] "音声言語情報処理に関する情報処理学会の試行標準策定活動"
新田恒雄, 石川 泰, 伊藤克亘, 畑岡信夫,松浦 博, 磯谷亮輔, 西村雅史, 西本卓也:
情処研報2002-SLP-40-10,pp.57-60,Feb 2002. -
[40] 音声認識用読み記号および音声関連ソフトウェアに関わる用語の試行標準案,
松浦 博, 西本卓也, 金子 宏, 磯谷亮輔, 石川 泰, 西村雅史,伊藤克亘, 新田恒雄,
情報処理学会音声言語情報処理研究会,SLP-45-11, pp.65-70, 2003.2. -
[41] 雑音下音声認識に関する共通コーパスと評価,
西村雅史
電子情報通信学会FIT,2003.9. -
[42] 雑音・残響下音声認識におけるHMM分離・合成法の改良
滝口哲也,西村雅史
電子情報通信学会応用音響研究会, EA2003-2, pp. 7-12, 2003-4. -
[43] 残響下音声認識におけるHMM分離法の改良
滝口哲也,西村雅史
情報処理学会音声言語情報処理研究会, SLP45-3, pp. 13-18, 2003-2. -
[44] "読み上げ韻律との差分を使った強調韻律の学習,"
立花 隆輝, 西村 雅史,
日本音響学会2004年春季研究発表会, pp. 179-180, 2005年3月 -
[45] 音声認識応用に関する学会試行標準,
西本卓也,西村雅史, 赤堀 一郎, 石川 泰, 磯谷 亮輔, 伊藤 克亘, 大淵 康成, 金澤 博史, 國枝 伸行, 外山 聡一, 新田 恒雄
情報処理学会音声言語情報処理研究会,SLP-55, pp.47-52, 2005, 2. -
[46] (招待講演) "音声認識ビジネスの現状と将来展望,"
西村雅史,
第55回音声言語情報処理研究会,SIG-SLP55, No.12, 2005年2月. -
[47] 構文構造を反映した確率的言語モデル
森 信介, 西村 雅史, 伊東 伸泰
情報処理学会音声言語情報処理研究会 (2005-SLP-032) -
[48] 確率モデルを用いた読み及びアクセント推定
長野 徹, 森 信介, 西村 雅史
情報処理学会音声言語情報処理研究会 (2005-SLP-057) -
[49] 日本語生コーパスから自動獲得した未知語と言語モデルによる大語彙連続音声認識
倉田 岳人, 森 信介, 西村 雅史
情報処理学会音声言語情報処理研究会 (2005-SLP-057-19) -
[50] "全自動構築可能なテキスト音声合成システムの検討”,
西村 雅史, 立花 隆輝, 長野 徹, 倉田 岳人,
日本音響学会2006年秋季研究発表会, 2006-9 -
[51] "発話末尾残響区間推定に基づく低コストなフィルタ係数決定法,”
福田 隆,市川 治,西村雅史,
日本音響学会2006年秋季研究発表会講演論文集,2-P-1,pp.95-96, September 2006. -
[52] "音声とテキストからの語彙自動獲得",
倉田 岳人, 森 信介, 伊東 伸泰, 西村 雅史,
音響学会2007年春季研究発表会講演論文集,3-9-10,pp.83-84,March 2007 -
[53] “長時間スペクトル変動を考慮した音声特徴量の検討,”
福田 隆,市川 治,西村雅史,
日本音響学会2007年春季研究発表会講演論文集,1-P-1,pp.125-126, March 2007. -
[54] "複数のモデルを利用した自動アクセントラベリング",
立花 隆輝, 長野 徹, 倉田 岳人, 西村 雅史
音響学会2007年春季研究発表会講演論文集,3-8-2,pp.227-228,March 2007 -
[55] "音声合成のための自動アクセントラベリング",
立花 隆輝, 長野 徹, 倉田 岳人, 西村 雅史, 馬場口 登,
情報処理学会研究報告, SLP-65-18, February 2007 -
[56] "確率モデルを用いたテキスト音声合成用フロントエンドの改善,",
+ 長野徹,立花隆輝,森信介,西村雅史,
日本音響学会2007年春季研究発表会,1-Q-32, pp.327-328, March 2007. -
[57] "波形重畳型音声合成におけるF0 傾きモデルを用いた韻律修正,"
立花隆輝,長野徹,西村雅史,
日本音響学会2007年秋季研究発表会,1-4-4, pp.327-328, Sepbember 2007. -
[58] "波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用,"
立花隆輝,長野徹,西村雅史,
電子情報通信学会技術報告, 2007-NLC/SP-12, pp.253-258, December 2007. -
[59] "アクセントクラスを用いた統計的TTS フロントエンドの改善,"
長野徹,立花隆輝,伊東伸泰,西村雅史,
日本音響学会2008年春季研究発表会,1-11-30, 2008. -
[60] "長時間スペクトル変動を考慮した低S/N環境下における発話区間検出法,"
福田 隆,市川 治,西村雅史,
日本音響学会2008年春季研究発表会講演論文集,1-10-6,pp. 19-20,March 2008. -
[61] "耐雑音性の高い発話区間検出のための調波構造に基づく音声特徴量,"
福田 隆,市川 治,西村雅史,
日本音響学会2008年秋季研究発表会講演論文集,1-1-11,pp.25-26,September 2008. -
[62] "長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法,"
福田 隆,市川 治,西村雅史,
情報処理学会研究報告(音声言語情報処理),2008-SLP-73 (1),pp.1-6,October 2008. -
[63] "短・長スペクトル変動を考慮した雑音に頑健な音声認識,"
福田 隆,市川 治,西村雅史,
日本音響学会2009年春季研究発表会講演論文集,1-5-3,pp.7-10,March 2009. -
[64] "擬似音声認識を利用した言語モデルの識別学習",
倉田 岳人, 伊東 伸泰, 西村 雅史,
音響学会2009年秋季研究発表会講演論文集,2-1-2,pp.55-58,September 2009 -
[65] "残響にロバストな音声認識のための動的特徴量,"
市川治,福田隆,西村雅史,
日本音響学会2009年秋季研究発表会,1-1-9,September 2009. -
[66] "長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法の評価と考察,"
福田隆,市川治,西村雅史,
日本音響学会2009年秋季研究発表会,1-1-13,September 2009. -
[67] "ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討",
倉田 岳人, 市川 治, 西村 雅史,
情報処理学会研究報告, SLP-78-2, October 2009 -
[68] 多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討
中鹿亘,立花隆輝,西村雅史,滝口哲也,有木康雄
第11回音声言語シンポジウム,SP2009-93,No.29,pp.165-170,2009-12 -
[69]“雑音にロバストな音声認識のための動的特徴量と調波構造重み付けメルフィルタバンク,”
市川治,福田隆,西村雅史,
日本音響学会2010年春季研究発表会,1-6-1, Mar. 2010 -
[70]“頑健な音声認識のための線形-対数ハイブリッド領域における長時間動的特徴量," (粟屋潔学術奨励賞受賞)
福田隆,市川治,西村雅史,
日本音響学会2010年春季研究発表会,1-6-2, pp.5-8, Mar. 2010. -
[71] "音声合成を用いたインターネット動画用音声ガイド,"
立花隆輝, 長野徹, 高木啓伸, 西村雅史,
情報処理学会研究報告, SLP-80, No. 1, 2010, 2. -
[72]“擬似音声認識を利用した誤り訂正モデルの識別学習”,
倉田岳人,伊東伸泰, 西村雅史,
日本音響学会2010年春季研究発表会,2-6-1, Mar. 2010. -
[73]“多重関数を用いた調波時間スペクトル形状のモデル化による音声合成,"
中鹿 亘,立花 隆輝,西村 雅史,滝口 哲也,有木 康雄,
日本音響学会2010年春季研究発表会講演論文集,1-P-4, Mar. 2010. -
[74] "音声認識のための長時間変動量と線形判別分析の比較検討,"
福田隆, 市川治,西村雅史, Hershey John,
日本音響学会2010年秋季研究発表会講演論文集,1-9-2, September, 2010. -
[75] "音声認識における母音区間の位相の安定性の利用,"
市川治,福田隆,西村雅史,
日本音響学会2010年秋季研究発表会講演論文集,1-Q-7, September, 2010. -
[76] (招待講演) "カーナビの音声インターフェース - 理想と現実のギャップ",
西村雅史,
第60回人工知能学会 言語・音声理解と対話処理研究会,SIG-SLUD, 2010年10月. -
[77] "単語コンフュージョンネットワークを利用した日本語電話音声からの固有表現抽出,"
倉田岳人,伊東伸泰,西村雅史,Sethy Abhinav, Ramabhadran Bhuvana,
日本音響学会2011年春季研究発表会講演論文集,3-5-14, March, 2011. -
[78] "音声の構造的表象を用いた連続数字音声認識,"
鈴木雅之,倉田岳人,西村雅史,峯松信明,
日本音響学会2011年秋季研究発表会講演論文集,1-10-14,September,2011. -
[79] "OpenEARを用いた音声による心理的ストレス検出の試み," (学会奨励賞受賞)
根本清貴, 太刀川弘和, 長野徹,立花隆輝,西村雅史,朝田隆,
第27回日本ストレス学会学術総会, 2011年11月. -
[80] "息継ぎ音を利用した電話音声の発話分割," (音声研究会研究奨励賞受賞)
福田隆, 市川治,西村雅史,
電子情報通信学会音声研究会,信学技報 Vol.111, No.431, SP2011-153, 2012年2月. -
[81] "特徴空間における長時間スペクトル変動成分の識別学習,"
福田隆,市川治,西村雅史,
情報処理学会音声言語情報処理研究会資料,Vol. 2012-SLP-90, No.21, 2012年2月.
IBM社内論文
-
[1] “日本語単音節の認識法 -中間累積距離マッチング法の提案,”
松田安弘, 狩野光彦, 手塚集, 西村雅史,
IBM Review 92, 1984. -
[2] “日本語音声の認識実験,”
松田安弘, 西村雅史,
IBM 情報セミナー論文, 1984. (入選論文賞) -
[3] “A word-based Japanese dictation system,”
Masafumi Nishimura, Nobuyasu Itoh,
IBM Research Report, RT0219, 1997.9. -
[4] “A word-based Japanese Language Model,”
Nobuyasu Itoh, Masafumi Nishimura, Shiho Ogino, Kazutaka Yamasaki,
IBM Research Report, RT0288, 1998-12. -
[5] “Synthesizing Speech with Emphasis by Learning Prosody Change,”
Ryuki Tachibana, Masafumi Nishimura,
IBM Research Report, RT0608, 2005-4. -
[6] “Automatic Accent Labelling Using the Prosodic Structure of the Language,”
Ryuki Tachibana, Tohru Nagano, Gakuto Kurata, Masafumi Nishimura,
IBM Research Report, RT5273, 2006-11. - [7] “New Speech Interface by Free Form Command,” Gakuto Kurata, Osamu Ichikawa, Masafumi Nishimura, IBM Research Report, RT5274, 2006-12.
- [8] “AFE: ASR Front-end for Speech Enhancement,” Takashi Fukuda, Osamu Ichikawa, Masafumi Nishimura, IBM Research Report, RT5281, 2007-7.
- [9] “Optimum F0 Adjustment for Concatenative TTS,” Ryuki Tachibana, Masafumi Nishimura, IBM Research Report, RT5287, 2008-1.
- [10] “Speech Input Method in Automobiles Reflecting Analysis on How Users Speak” Gakuto KURATA, Masafumi NISHIMURA, IBM 2008年プロフェッショナル論文, 2008.12.(優秀論文賞)
- [11] “Dictation and Transcription by Speech Technology and its Application - Productivity improvements in contact-centers and branch office,” Nobuyasu Itoh, Gakuto Kurata, Masafumi Nishimura, IBM 2008年プロフェッショナル論文, 2008.12.(入選論文賞)
- [12] “Discriminative Reranking with Pseudo-ASR,” Gakuto Kurata, Nobuyasu Itoh, Masafumi Nishimura, IBM Research Report, RT5302, 2009-4.
-
[13] “Pitch Conversion for Unit Selection TTS Using Combination of Direct and Differential Features,”
Ryuki Tachibana, Zhiwei Shuang, Masafumi Nishimura,
IBM Research Report, RT0881, 2009-9. - [14] "Text-to-speech synthesis system with an easy and effective interface for tuning”, Ryuki Tachibana, Masafumi Nishimura, IBM 2009年プロフェッショナル論文,2009.12.(入選論文賞)
-
[15] “Corpus-based Text-to-Speech Front-end for Japanese,”
Tohru Nagano, Ryuki Tachibana, Masafumi Nishimura,
IBM Research Report, RT0916, 2010-8. - [16] “コールセンター会話音声からの感情検出手法の検討,” 倉田岳人, 西村雅史, IBM2010年度プロフェッショナル論文,2010.12. (優秀論文賞)
- [17] “息継ぎ音を利用したコールセンター会話音声の発話分割,” 福田隆, 西村雅史, IBM2010年度プロフェッショナル論文, 2010.12. (最優秀論文賞)
-
[18] “POI Retrieval from Free Keywords,”
Nobuyasu Itoh, Osamu Ichikawa, Masafumi Nishimura,
IBM Research Report, RT0919, 2010-10. -
[19] “Emotion Detection in Call-Center Conversation,”
Gakuto KURATA, Nobuyasu Itoh, Masafumi Nishimura,
IBM Research Report, RT0928. 2011-2.
特許関係
成立特許
- [1] "SPEECH ROCOGNITION SYSTEM," 1997-06-13, Pat. no. 2662120, Japan
- [2] "A METHOD FOR CONTROLING DICTATION-STYLE MODEL," 2006-03-17, Pat. no. 3782943, Japan
- [3] "A METHOD FOR PREDICTING DISFLUENCY WORDS BY N-GRAM MODEL," 2005-12-07, Pat. no. ZL00135969.X, China
- [4] "A METHOD FOR PREDICTING DISFLUENCY WORDS BY N-GRAM MODEL," 2003-05-09, Pat. no. 3426176, Japan
- [5] “Adaptation of Acoustic Prototype Vectors in a Speech Recognition System,” 1991-09-03, Pat. No. 5046099, United States
- [6] "A PITCH SYNCHRONOUS OVERLAP-ADD METHOD BASED ON GLOTTAL CLOSURE INSTANTS," 2000-07-28, Pat. no. 3093113, Japan
- [7] "HMM BASED SPECH RECOGNITION METHOD USING STATIC AND DYNAMIC FEATURES," 1994-12-26, Pat. no. 1892342, Japan
- [8] "METHOD OF SPEECH MODELLING AND A SPEECH RECOGNIZER," 1999-04-14, Pat. no. 69324428.3, Germany
- [9] "METHOD OF SPEECH MODELLING AND A SPEECH RECOGNIZER," 1999-04-14, Pat. no. 590925, France
- [10] "METHOD OF SPEECH MODELLING AND A SPEECH RECOGNIZER," 1999-04-14, Pat. no. 590925, United Kingdom
- [11] “METHOD, APPARATUS, COMPUTER SYSTEM AND STORAGE MEDIUM FOR SPEECH RECOGNITION,” 2005-07-12, Pat. No. 6917910, United States
- [12] "SPEAKER ADAPTATION FOR HMM BASED SPEECH RECOGNITION," 1992-08-11, Pat. no. 1689273, Japan
- [13] "SPEAKER ADAPTATION METHOD FOR VQ CODE BOOK," 1995-02-24, Pat. no. 1906392, Japan
- [14] “SPEECH RECOGNITION APPARATUS AND METHOD UTILIZING A LANGUAGE MODEL PREPARED FOR EXPRESSIONS UNIQUE SPONTANEOUS SPEECH,” 2006-01-10, Pat. no. 6985863, United States
- [15] “SPEECH RECOGNITION BY CONCATENATING FENONIC ALLOPHONE HIDDEN MARKOV MODELS IN PARALLEL AMONG SUBWORDS,” 1996-03-26, Pat. No. 5502791, United States
- [16] "SPEECH RECOGNITION METHOD," 1989-06-27, Pat.no. 1256562, Canada
- [17] "SPEECH RECOGNITION METHOD," 1991-09-18, Pat.no. 3773039808, Germany
- [18] "SPEECH RECOGNITION METHOD," 1991-09-18, Pat. no. 243009, France
- [19] "SPEECH RECOGNITION METHOD," 1991-09-18, Pat. no. 243009, United Kingdom
- [20] "SPEECH RECOGNITION METHOD," 1991-09-18, Pat. no. 243009, Italy
- [21] "SPEECH RECOGNITION METHOD," 1992-08-11, Pat. no. 1689246, Japan
- [22] "SPEECH RECOGNITION METHOD," 1996-04-09, Pat. no. 2044703, Japan
- [23] “SPEECH RECOGNITION METHOD,” 1989-05-09, Pat.no.4829577, United States
- [24] "SPEECH RECOGNITION SYSTEM USING MARKOV MODELS," 1992-11-25, Pat. no. 3876207208, Germany
- [25] "SPEECH RECOGNITION SYSTEM USING MARKOV MODELS," 1992-11-25, Pat. no. 312209, France
- [26] "SPEECH RECOGNITION SYSTEM USING MARKOV MODELS," 1992-11-25, Pat. no. 312209, United Kingdom
- [27] “SPEECH RECOGNITION SYSTEM USING MARKOV MODELS HAVING INDEPENDENT LABEL OUPUT SETS,” 1991-07-09, Pat.no.5031217, United States
- [28] "SPEECH ROCOGNITION," 1998-04-01, Pat. no. 69224953.2, Germany
- [29] "SPEECH ROCOGNITION," 1998-04-01, Pat. no. 535909, France
- [30] "SPEECH ROCOGNITION," 1998-04-01, Pat. no. 0535909, United Kingdom
- [31] “SPEECH ROCOGNITION SYSTEM HAVING AN INTEFACE TO A HOST COMPUTER BUS FOR DIRECT ACCESS TO THE HOST MEMORY,” 1994-10-04, Pat. No.5353377, United States
- [32] “SPEECH SYNTHESIS USING GLOTTAL CLOSURE INSTANTS DETERMINED FROM ADAPTIVELY-THRESHOLDED WAVELET TRANSFORMS,” 1997-09-23, Pat.no.5671330, United States
- [33] “SYSTEM INSERTION APPARATUS AND METHOD,” 2004-08-17, Pat.no.6778958, United States
- [34] "VOICE RECOGNITION APPARATUS," 1995-07-25, Pat. no. 1336458, Canada
- [35] "WORD-BASED JAPANESE DICTATION SYSTEM," 2000-10-20, Pat. no. 3121530, Japan
- [36] “SPEECH RECOGNITION METHOD,” 1991-09-17, Pat.no. 5050215, United States
- [37] "SPEECH RECOGNITION METHOD USING A TRAINABLE HMM-NETWORK," 1996-04-25, Pat. no. 2048523, Japan
- [38] "SPEECH RECOGNITION SYSTEM," 1994-07-20, Pat. no. 69010722.6, Germany
- [39] "SPEECH RECOGNITION SYSTEM," 1994-07-20, Pat. no. 388067, France
- [40] "SPEECH RECOGNITION SYSTEM," 1994-07-20, Pat. no. 388067, United Kingdom
- [41] "SYSTEM, PROGRAM, AND CONTROL METHOD FOR SPEECH SYNTHESIS," 2009-01-23, Pat. no. 4247564, Japan
- [42] "REVERBERANT SPEECH RECOGNITION BASED ON MODEL COMPENSATION APPROACH," 2006-08-04, Pat. no. 3836815, Japan
- [43] "APPARATUS, METHOD, AND PROGRAM FOR SUPPORTING SPEECH INTERFACE DESIGN," 2008-07-18, Pat. no. 4156639, Japan
- [44] "A METHOD TO DESIGN THE SHAPE OF OUTER-EAR SUITABLE FOR SOUND SOURCE LOCALIZATION," 2007-08-17, Pat. no. 3999689, Japan
- [45] "CONTROLS FOR AUTOMATIC-PUNCTUATING FUNCTION," 2001-09-14, Pat. no. 3232289, Japan
- [46] ”SPEECH RECOGNITION SYSTEM AND PROGRAM THEREOF,” 2008-07-22, Pat.no.7403896, United States
- [47] "SPEECH RECOGNITION BY FRAME-WISE SELECTION OF THE MODEL UNDER THE RAPID CHANGE OF NOISE," 2007-12-28, Pat. no. 4061094, Japan
- [48] "SPEECH RECORDING METHOD FOR COURT REPORT," 2008-02-22, Pat. no. 4082611, Japan
- [49] “SYSTEMS AND METHODS FOR NATURAL SPOKEN LANGUAGE WORD PREDICTION AND SPEECH RECOGNITION,” 2008-04-15, Pat.no. 7359852, United States
- [50] "STRUCTURAL LANGUAGE MODELING BASED ON DEPENDENCY," 2008-04-04, Pat. no. 4105841, Japan
- [51] "LOW-COST METHOD FOR DETERMINING FILTER COEFFICIENT IN DEREVERBERATION," 2008-04-11, Pat. no. 4107613, Japan
- [52] "SYSTEM FOR SUPPORTING TEXT-TO-SPEECH," 2008-05-30, Pat. no. 4129989, Japan
- [53] "MICROPHONE-ARRAY BASED NOISE SUPPRESSION METHOD," 2008-10-03, Pat. no. 4195267, Japan
- [54] "CONTEXT TREE FOR TREE-STRUCTURED HISTORY," 2008-11-14, Pat. no. 4215418, Japan
- [55] “SPEECH RECOGNITION APPARATUS, SPEECH RECOGNITION APPARATUS AND PROGRAM THEREOF,” 2009-1-13, Pat.no. 7478041, United States.
- [56] “WORD PREDICTING METHOD, VOICE RECOGNITION METHOD, AND VOICE RECOGNITION APPARATUS AND PROGRAM USING THE SAME METHODS,” 2009-01-20, Pat. No. 7480612, United States
- [57] “SIGNAL ENHANCEMENT VIA NOISE REDUCTION FOR SPEECH RECOGNITION,” 2009-05-12, Pat. No. 7533015, United States
- [58] “SIGNAL ENHANCEMENT VIA NOISE REDUCTION FOR SPEECH RECOGNITION,” 2011-02-22, Pat. No. 7895038, United States
- [59] "SPEECH RECOGNITION SYSTEM AND METHOD," 2011-08-26, Pat. No. 4808764, Japan
- [60] "RECORDING SYSTEM WITH IMPROVED SUPPRESSION OF INTERFERING TALKER," 2012-01-20, Pat. No. 4906908, Japan
- [61] "METHOD AND SYSTEM FOR POSITION DETECTION OF A SOUND SOURCE," 2012-04-24, Pat. No. 8165317, United States
- [62] "SYSTEM, METHOD, AND PROGRAM PRODUCT FOR PROCESSING SPEECH RATIO DIFFERENCE DATA VARIATIONS IN A CONVERSATION BETWEEN TWO PERSONS," 2012-04-24, Pat. No. 8165874, United States
IBM Tchinical Disclosure Bulletin (技術公開報)
- [1] “Isolated word recognition method,” Masafumi Nishimura and Masaaki Okochi, IBM technical disclosure bulletin, Vol.29, No.4, Sep.1986.
- [2] “Speech recognition method using multiple fenemic baseforms of HMM,” Masafumi Nishimura and Koichi Toshioka, IBM technical disclosure bulletin, Vol.30, No.6, Nov.1987.
- [3] “Speech recognition method,” Masafumi Nishimura, IBM technical disclosure bulletin, Vol.34, No.5, Oct.1991.
- [4] “Speech recognition method using multi-labeling,” Masafumi Nishimura and Koichi Toshioka, IBM technical disclosure bulletin, Vol.29, No.10, Mar.1987.
- [5] “Speech recognition method,” Masafumi Nishimura, IBM technical disclosure bulletin, Vol.33, No.2, Jul.1990.
- [6] “Using information entropy to select leaning words,” Masafumi Nishimura, IBM technical disclosure bulletin, Vol.34, No.10B, Mar.1992.
- [7] “Improved endpoint detector for Japanese speech recognition,” Masafumi Nishimura, IBM technical disclosure bulletin, Vol.34, No.9, Feb.1992.
- [8] “Method of endpoint detection,” Yasuhide Hashimoto and Masafumi Nishimura, IBM technical disclosure bulletin, Vol.34, No.9, Feb.1992.
- [9] “Method for compressing a fast match table,” Masafumi Nishimura, IBM technical disclosure bulletin, Vol.34, No.1, Jun.1991.
- [10] “Speech recognition method using templates spoken by multiple speakers,” Yasuhide Hashimoto, Masafumi Nishimura and Masaharu Sakamoto, IBM technical disclosure bulletin, Vol.37, No.12, Dec.1994.
- [11] “Real-time word recognition method,” Masafumi Nishimura and Masaharu Sakamoto, IBM technical disclosure bulletin, Vol.38, No.8, Aug.1995.
- [12] “Method for segmenting texts into words,” Nobuyasu Itoh and Masafumi Nishimura, IBM technical disclosure bulletin, Vol.39, No.11, Nov.1996.
その他の著作
著書 (Chapters in books)
-
[1] "Wavelet Analysis of Speech Signals",
M.Kobayashi, M.Sakamoto, T.Saitoh, M.Nishimura
Approximation Theory VIII, Vol.2:Wavelets and Multilevel Approximation, pp209-215, Academic Press, NY, 1995 -
[2] "Wavelet Analysis for a Text-to-speech System,"
M.Kobayashi, M.Sakamoto, T.Saitoh, M.Nishimua,
Wavelets and their applications, pp.75-100, SIAM, Philadelphia, PA, 1998. -
[3] "IBM's Japanese Dictation System,"
Masafumi Nishimura
Spoken Language Systems, Chapter2, pp.47-58, Ohmusha/IOS Press, 2005. ISBN 4-274-90637-X.
学会誌解説記事
-
[1] "音声ワープロ最新事情,"
西村雅史,
日本音響学会誌, Vol.54, No.3, p.229-234, 1998, 3. -
[2] "音声認識・理解のための統計的言語処理,"
西村雅史,森信介,
電子情報通信学会誌, Vol.5, pp.828-831, 1999. 5. -
[3] "音声ワープロ : 過去・現在・未来,"
西村雅史, 伊東伸泰,
情報処理学会誌, Vol. 40, No. 2, pp.164-167, 1999. -
[4] "音声言語インターフェースのための情報処理学会試行標準,"
新田恒雄,松浦博,西本卓也,西村雅史
情報処理,Vol. 47,No. 7,pp.762-767, 2006.7. -
[5] "国内外に見る音声インターフェースの現状とイノベーションの可能性,"
西村雅史,倉田岳人
情報処理,Vol51. No.11, pp.1434-1439, 2010.11.
商業誌論文・解説記事
-
[1] "音声認識の最新技術,"
西村雅史, 伊東伸泰,
Bit (共立出版), Vol. 30, No.7, pp.8-13, 1998年7月. -
[2] "音声認識技術の基礎と応用プログラム開発技法,"
西村雅史, 伊東伸泰,
インターフェース (CQ-出版), 1998-8, pp. 100-108, 1998年8月. -
[3] "音声入力パソコンを支える音声認識ソフトウェアの実力,"
西村雅史,
エレクトロニクス (オーム社), 1999年8月. -
[4] "PC用音声認識ソフトウェアの到達点,"
西村雅史
エレクトロニクス (オーム社), 2000年10月. -
[5] "作業効率の高いテキスト合成音声チューニング環境,”
立花隆輝,長野徹,西村雅史,
IBM ProVision, No.66, pp.67-73, 2010. -
[6] “息継ぎ音を利用したコールセンター会話音声の発話分割,”
福田隆, 西村雅史,
IBM ProVision, No.68, pp.80-87, 2011 Winter.
社外委員
政府関係委員
- 文部科学省科学技術政策研究所 専門調査委員 (2003.2 - 在任中)
- 特許庁「音声認識技術・ブロードバンドを支える変復調技術委員会」委員 (2003年)
学会関係委員
- 情報処理学会音声言語情報処理研究会運営委員 (1998.4-2002.4)
- 情報処理学会学会標準検討委員会委員 (2001.6-2006)
- 電子情報通信学会音声専門委員会委員 (2001.3-2007.3)
- 電子情報通信学会論文常任査読委員 (2001.9- 在任中)
- 日本音響学会論文査読委員 (1998.4- 在任中)
- 電子情報通信学会英文論文誌編集委員 (2006.5-2010.5)
- 電子情報通信学会英文論文誌特集号幹事 (2007-8,2009-2010)
- Member of Scientific Committee, 2008 IEEE workshop on Spoken Language Technology (2008)
- 電子情報通信学会英文論文誌編集幹事 (2010.5-2012.5)
- 情報処理学会音声言語情報処理研究会運営委員 (2012.4-)
- 電子情報通信学会編集顧問会顧問 (2012.5- )
標準化活動
-
情報処理学会試行標準WG4小委員会委員 (2001-2006)
[1] 情報処理学会情報規格調査会 :"カーナビ用音声入力の性能評価のためのガイドライン"
情報処理学会試行標準 IPSJ-TS 0011:2005
[2] 情報処理学会情報規格調査会 :"音声認識のための読み表記"
情報処理学会試行標準 IPSJ-TS 0004:2003
[3] 情報処理学会情報規格調査会 :"ディクテーションに用いる基本記号に対応する読み"
情報処理学会試行標準 IPSJ-TS 0009:2004
社外講師
大学非常勤講師
- [1] 大阪大学大学院 1998.5 音声認識概論 (特別講義)
- [2] 東京都立大学 1998.6 音声認識概論 (特別講義)
- [3] 龍谷大学 1999.11 音声認識概論 (特別講義)
- [4] 静岡大学 1999.11 音声認識概論 (特別講義)
- [5] 鳥取大学大学院 2000(前期) パターン認識および音声認識概論 (非常勤,集中講義)
- [6] 会津大学 2,000.3 音声認識概論 (特別講義)
- [7] 名古屋大学 2000(前期) 音声認識概論 (非常勤,集中講義)
- [8] 東京大学 2,001.6,2002.6 (特別講義,他講師と分担) 音声認識技術の現状と今後の課題
- [9] 大阪大学大学院 2000(前期),2002(後期), 2003(後期),2004(後期) 音声技術概論 (非常勤,集中講義)
社外セミナー講師
- [1] 電子情報通信学会関西支部 1998 音声認識技術の現状と今後の課題
- [2] 電子情報通信学会東海支部 1999 音声認識技術の現状と今後の課題
- [3] 信州大学ライフサイエンス研究会 2000.1 音声認識技術の現状と今後の課題
- [4] 岡山県新技術新興財団 2000.6 音声認識技術の現状と今後の課題
- [5] 日本工業技術センター 1997.8 音声認識技術の実際
- [6] 日本情報技術センター 1998.8 最新音声認識技術と今後の展開
- [7] 情報処理学会 音声言語情報処理研究会,1999.12, 招待講演,日本語ディクテーションシステムの現状と今後の課題
- [8] 情報処理学会 音声言語情報処理研究会, 2000,12, パネル討論: 10年後の技術予測, パネリスト
- [9] 電子情報通信学会 FIT2003, 2003, 9, パネル討論: どんな雑音,どんなタスク,どんな評価, パネリスト
- [10] 情報処理学会 音声言語情報処理研究会,2005.12, 招待講演, 音声認識ビジネスの現状と将来展望
- [11] 情報処理学会 SLP デベロッパーズフォーラム, 2009.11, パネル討論: 音声認識がキャズムを超えるには?, パネリスト
- [12] 豊橋技術科学大学中川研究室30周年記念講演, 2010.4.3, IBMに見る音声研究の歴史と今後
- [13] 人工知能学会 言語・音声理解と対話処理研究会, 招待講演, 2010.10.28, カーナビの音声インターフェース –理想と現実のギャップ
- [14] 情報処理学会 音声言語情報処理研究会,特別講演,2011.2.4, 研究室紹介: IBM東京基礎研究所Speech Technology, 2011SLP-085.
