20181212

逆強化学習による「動物の行動戦略」の解読

本田 直樹 博士

京都大学生命科学研究科理論生物学分野

【要旨】

動物は外界の状況に応じて、より多くの報酬が期待できる行動戦略を持って行動していると考えられる。しかし、報酬には食料などの直接的なもののみならず、間接的にそれらに結びつくものもあるため、動物の行動を単に観察しているだけでは、「動物が何を報酬として行動しているのか、何に価値を置いて行動しているのか?」を知ることは困難であった。また脳内では、報酬はドーパミンによって表現されていることから、動物にとって何が報酬となっているのかを明らかにすることは、行動戦略を司る神経メカニズムの理解のためにも重要ある。そこで我々は行動時系列データからその裏に潜む戦略や未知の報酬を解読する機械学習法(逆強化学習)を開発した。この手法を線虫の温度走性行動へと応用することで、線虫にとっての報酬や行動戦略を明らかにすることができた。

参考文献
Yamaguchi et al., Identification of animal behavioral strategies by inverse reinforcement learning. PLoS Comput Biol, 2018

日時: 2018年12月12日(水) 17:00~18:30
場所: 理学部3号館4F 412室
連絡先: 理学系研究科 生物科学専攻 生物情報科学科
黒田 真也(skuroda AT bs.s.u-tokyo.ac.jp)