リスクを考慮した意思決定の研究
概要
我々は、企業活動の様々な場面におけるリスクやチャンスを、正しく、定量的に評価し、それを意思決定に役立てるためのデータ解析手法の研究を行っています。特に、直近の意思決定が短期的な効果だけでなく中長期的にも影響を及ぼすような一般的な状況を想定して、長期リターン(収益)のリスクを統一的に扱うための新しい手法を研究しています。
その中で我々は、強化学習を確率的に拡張することで、外部環境に関する知識を前提とせずに長期リターンの分布を推定するアルゴリズムを開発しました。このアルゴリズムにより、分布から規定される任意の特徴量を指標とした意思決定を考えることが可能になり、例えば、期待リターンだけではなく長期リターンのバリュー・アット・リスクや期待ショートフォール等のリスク指標も考慮した高度にカスタマイズ可能な戦略の策定も可能になります。
また、動的な意思決定が合理的であるためのリスク指標についての研究や、個々人のリスク嗜好を考慮した行動データの解析等も行っています。
主要論文
- Tetsuro Morimura, Masashi Sugiyama, Hisashi Kashima, Hirotaka Hachiya, and Toshiyuki Tanaka: Nonparametric Return Distribution Approximation for Reinforcement Learning, In Proc. 27th International Conference on Machine Learning (ICML 2010).
- Tetsuro Morimura, Masashi Sugiyama, Hisashi Kashima, Hirotaka Hachiya and Toshiyuki Tanaka: Return Density Approximation for Reinforcement Learning, In Proc. 26th Conference on Uncertainty in Artificial Intelligence (UAI 2010).
- Takayuki Osogami and Tetsuro Morimura, Time-consistency of optimization problems, Technical Report, IBM Research, RT0923.
- 森村 哲郎, 杉山 将, 鹿島 久嗣, 八谷 大岳, 田中 利幸: 動的計画法によるリターン分布推定, 電子情報通信学会技術研究報告, IBISML2010-98, pp.283-290.
研究テーマ
- リスク考慮型意思決定アルゴリズムの設計と評価
- 合理的な意思決定手段の検討
- 人間行動の数理分析
