写真

氏名

上野 史 (ウワノ フミト)

UWANO Fumito

ホームページ

メールアドレス

所属部局

自然科学研究科

所属学科・講座

自然科学研究科・産業創成工学専攻・計算機科学講座,工学部・情報系学科

専門分野

マルチエージェントシステム,強化学習

職名

助教

科研費細目番号 【 表示 / 非表示

研究課題 【 表示 / 非表示

  • 基礎研究

    本研究は,現実問題に起こる通信遅延や情報の不確かさに対処するために,複数のエージェント間の協調行動を通信なしで導く強化学習手法を提案するとともに,変化のない静的環境に加えて不測の事態などで変化する動的環境に対応できるように拡張し,それらの有効性の検証を目的とする.その実現に向け,各エージェントの目的を合理的に設定し,逐次的にエージェントの行動を決定させることで協調行動を導く.さらに,環境変化にあわせて学習範囲を制限することで,動的環境時でも適切に目的を切り替えるように改良する.迷路問題に適用した結果,静的環境のみならず動的環境においても,提案手法は従来のQ学習よりも多くの報酬を早く獲得可能であることを明らかにした.

  • 基礎研究

    本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.

研究キーワード 【 表示 / 非表示

マルチエージェントシステム,強化学習,通信無し,報酬設計,目的選択

代表的な研究成果 【 表示 / 非表示

Fumito Uwano and Keiki Takadama,"Reward Value-Based Goal Selection for Agents’ Cooperative Route Learning Without Communication in Reward and Goal Dynamism," Springer Nature Computer Science, Volume 1, Number 3, May, 2020.

Fumito Uwano and Keiki Takadama,"Utilizing Observed Information for No-Communication Multi-agent Reinforcement Learning toward Cooperation in Dynamic Environment,"SICE Journal of Control, Measurement, and System Integration (SICE JCMSI). Volume 12, October, 2019.

Fumito Uwano, Naoki Tatebe, Yusuke Tajima, Masaya Nakata, Tim Kovacs, and Keiki Takadama, "Multi-Agent Cooperation Based on Reinforcement Learning with Internal Reward in Maze Problem,"SICE Journal of Control, Measurement, and System Integration (SICE JCMSI). Volume 11, July, 2018.

研究連携について 【 表示 / 非表示

ひとこと 【 表示 / 非表示

複雑系と呼ばれる単純な法則の主体が集団になることで複雑な行動を創発する分野を研究しています.