数理科学
東京基礎研究所
e-mail: tetsuro {AT} jp.ibm.com
研究分野
• 強化学習
• 機械学習
• データ・マイニング
主な業績
論文誌
- Tetsuro Morimura, Eiji Uchibe, Junichiro Yoshimoto, Jan Peters, and Kenji Doya: Derivatives of Logarithmic Stationary Distributions for Policy Gradient Reinforcement Learning, Neural Computation, Vol. 22, No. 2, pp. 342-376, 2010.
- Tetsuro Morimura, Eiji Uchibe, and Kenji Doya: Natural actor-critic with baseline adjustment for variance reduction, Artificial Life and Robotics, Vol. 13, No. 1, pp. 275-279, 2008.
- 森村哲郎, 内部英治, 吉本潤一郎, 銅谷賢治: 自然方策こう配法 平均報酬の自然こう配に基づく方策探索, 電子情報通信学会論文誌D, Vol. J91-D, No.6, pp.1515-1527, 2008.
- Tetsuro Morimura, Mio Hashiba, Hiroshi Kameda, Mihoko Takami, Hirokazu Takahama, Masahiko Ohshige, and Fumio Sugawara: Identification of Macrolide Antibiotic-binding Human_p8 Protein, The Journal of Antibiotics, Vol. 61, pp. 291-296, 2008.
- Tetsuro Morimura, Naoko Noda, Yasutaro Kato, Tetsuaki Watanabe, Takeki Saitoh,Takayuki Yamazaki, Keiichi Takada, Satoko Aoki, Keisuke Ohta, Masahiko Ohshige, Kengo Sakaguchi, and Fumio Sugawara: Identification of Antibiotic Clarithromycin Binding Peptide Displayed by T7 Phage Particles, The Journal of Antibiotics, Vol. 59, pp. 625-632, 2006.
国際会議 (査読付き)
- Tetsuro Morimura, Masashi Sugiyama, Hisashi Kashima, Hirotaka Hachiya, and Toshiyuki Tanaka: Nonparametric Return Distribution Approximation for Reinforcement Learning, In Proc. 27th International Conference on Machine Learning (ICML2010), to appear.
- Tetsuro Morimura, Eiji Uchibe, Junichiro Yoshimoto, and Kenji Doya: A Generalized Natural Actor-Critic Algorithm, In Proc. 23st Annual Conference on Neural Information Processing Systems (NIPS2009), pp. 1312-1320, 2010.
- Masashi Sugiyama, Hirotaka Hachiya, Hisashi Kashima, and Tetsuro Morimura: Least Absolute Policy Iteration for Robust Value Function Approximation, In Proc. 2009 IEEE International Conference on Robotics and Automation (ICRA2009), pp. 2904-2909, 2009.
- Tetsuro Morimura, Eiji Uchibe, Junichiro Yoshimoto, and Kenji Doya: A new natural policy gradient by stationary distribution metric, Machine Learning and Knowledge Discovery in Databases, Vol. 5212, pp. 82-97, 2008. (presented at the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD), 2008.)
- Tetsuro Morimura, Eiji Uchibe, and Kenji Doya: Utilizing Natural Gradient in Temporal Difference Reinforcement Learning with Eligibility Traces, In Proc. 2nd International Symposium on Information Geometry and its Applications (IGAIA 2005), pp. 256-263, 2005.
会議・研究会等 (査読なし)
- 森村哲郎, 杉山 将, 鹿島 久嗣, 八谷 大岳, 田中 利幸: リスク考慮型強化学習に向けたリターン分布推定, 第12回情報論的学習理論ワ-クショップ (IBIS2009), 2009.
- 吉田岳彦、伊藤真、森村哲郎、鮫島和行、奥田次郎、吉本潤一郎、銅谷賢治: 遅延を伴う確率的報酬獲得課題におけるヒトの意思決定に関する研究, 情報処理学会 バイオ情報学研究会(SIG BIO)研究報告, 2008.
- 森村哲郎, 内部英治, 吉本潤一郎, 銅谷賢治: 自然状態行動勾配法 (Natural State-action Gradient Learning), 第11回情報論的学習理論ワ-クショップ (IBIS2008), 2008.
- 森村哲郎, 内部英治,銅谷賢治: 自然TD学習: 割引報酬におけるTD誤差を利用する自然方策勾配に基づいた強化学習法, 電子情報通信学会技術研究報告, 2005.
- 森村哲郎, 松山和裕, 林卓治, 鮫島和行, 銅谷賢治: 人の行動データの系列モンテカルロ法解析による意思決定モデルの検証, 脳と心のメカニズム, 第5回夏のワークショップ「意志決定:心の物質基盤」, 2004.
- 森村哲郎、野田直子, 青木仁子, 太田慶佑, 坂口謙吾, 菅原二三男: ファージディスプレイ法によるクラリスロマイシン結合蛋白質の同定, 日本分子生物学会, 2003.
講演
- 森村哲郎: リターン分布推定によるリスク考慮型かつロバストな強化学習法, グローバルCOE, 知識コアグリッドセミナー, 京都大学, 2009/6/12.
経歴
学歴
- 2003.3: 東京理科大学 理工学部 応用生物科学科 卒業
- 2005.3: 奈良先端科学技術大学院大学 情報科学研究科 博士前期課程 修了
- 2008.3: 奈良先端科学技術大学院大学 情報科学研究科 博士後期課程 修了, 博士(工学)
職歴
- 2004.8-2008.3: 沖縄大学院大学先行研究事業 (OIST) 準研究員
- 2008.4-: 日本アイ・ビー・エム株式会社 東京基礎研究所 研究員
学会
- 電気情報通信学会会員
- 2010.4-: 電気学会「実応用を指向する機械学習技術調査専門委員会」委員
