研究課題 【 表示 / 非表示 】
-
研究課題名:抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習
研究課題概要:本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.
-
研究課題名:通信無し強化学習エージェント群による動的環境への追従
氏名
上野 史 (ウワノ フミト)
UWANO Fumito
所属専攻講座
自然科学研究科
職名
助教
性別
男性
研究分野・キーワード
(日)マルチエージェントシステム,強化学習,進化計算,ヒューマンエージェントインタラクション,医療情報学,宇宙工学
(英)Multi-Agent System, Reinforcement Learning, Evolutionary Computation, Human-Agent Interaction, Medical Informatics, Space Engineering
出身学校 【 表示 / 非表示 】
-
学校名:電気通信大学
学校の種類:大学
学部名:情報理工学部
学科名:総合情報学科
卒業年月:2015年03月
卒業区分:卒業
所在国:日本国
出身大学院 【 表示 / 非表示 】
-
大学院名:電気通信大学
研究科名:情報理工学研究科
専攻名:情報学専攻
修了課程:博士課程
修了年月:2020年03月
修了区分:修了
所在国:日本国
取得学位 【 表示 / 非表示 】
-
学位名:博士(工学) (Doctor (Engineering))
学位の分野名:知能情報学 (Intelligent informatics)
学位授与機関名:電気通信大学 (The University of Electro-Communications)
取得方法:課程
取得年月:2020年03月
-
学位名:修士(工学) (Master (Engineering))
学位の分野名:知能情報学 (Intelligent informatics)
学位授与機関名:電気通信大学 (The University of Electro-Communications)
取得方法:課程
取得年月:2017年03月
-
学位名:学士(工学) (Bachelor (Engineering))
学位の分野名:知能情報学 (Intelligent informatics)
学位授与機関名:電気通信大学 (The University of Electro-Communications)
取得方法:課程
取得年月:2015年03月
所属学会・委員会 【 表示 / 非表示 】
-
電気学会 (The Institute of Electrical Engineers of Japan) / 日本国 ( 2019年09月 ~ 継続中 )
-
進化計算学会 (The Japanese Society for Evolutionary Computation) / 日本国 ( 2019年09月 ~ 継続中 )
-
Association for Computing Machinery (ACM) (Association for Computing Machinery (ACM)) / 日本国 ( 2019年04月 ~ 継続中 )
-
Institute of Electrical and Electronics Engineers (IEEE) (Institute of Electrical and Electronics Engineers (IEEE)) / 日本国 ( 2019年04月 ~ 継続中 )
-
情報処理学会 (Information Processing Society of Japan) / 日本国 ( 2018年08月 ~ 継続中 )
研究経歴 【 表示 / 非表示 】
-
研究課題名:抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習 (Multi-agent reinforcement learning to acquire coordinate policy with different abstraction)
キーワード:マルチエージェントシステム,強化学習,ニューラルネットワーク,抽象度,協調 (Multi-Agent System, Reinforcement Learning, Neural Network, Abstraction, Coordination)
研究態様:個人研究
研究制度:科学研究費補助金
研究期間:2020年10月 ~ 2022年03月
専門分野(科研費分類):知能情報学
専門分野(researchmap分類):人工知能
-
研究課題名:通信無し強化学習エージェント群による動的環境への追従 (Non-Communicative Multi-Agent Reinforcement Learning for Dynamic Environment)
キーワード:マルチエージェントシステム,強化学習,報酬設計,通信無し (Multi-Agent System, Reinforcement Learning, Reward Design, Non-Communication)
研究態様:個人研究
研究制度:その他の研究制度
研究期間:2017年04月 ~ 2020年03月
専門分野(科研費分類):知能情報学
専門分野(researchmap分類):人工知能
担当授業科目 【 表示 / 非表示 】
-
年度:2020年度
授業科目:プログラミング2
担当期間:2020年12月 ~ 2021年02月
授業形式:専任
-
年度:2020年度
授業科目:工学倫理
担当期間:2020年12月 ~ 2021年02月
授業形式:専任
-
年度:2020年度
授業科目:プログラミング1
担当期間:2020年10月 ~ 2020年12月
授業形式:専任
-
年度:2020年度
授業科目:情報処理入門2(情報機器の操作を含む)
担当期間:2020年06月 ~ 2020年08月
授業形式:専任
-
年度:2020年度
授業科目:プログラミング演習2
担当期間:2020年06月 ~ 2020年08月
授業形式:専任
論文(総説以外) 【 表示 / 非表示 】
-
論文題目名:How to Emote for Consensus Building in Virtual Communication(共著) ( How to Emote for Consensus Building in Virtual Communication "jointly worked")
記述言語:英語
掲載種別:国際会議proceedings
掲載誌名:Proceedings of 22nd International Conference on Human-Computer Interaction ( Proceedings of 22nd International Conference on Human-Computer Interaction)
発行年月:2020年07月
著者氏名(共著者含):
共著区分:共著
-
論文題目名:Reward Value-Based Goal Selection for Agents’ Cooperative Route Learning Without Communication in Reward and Goal Dynamism ( Reward Value-Based Goal Selection for Agents' Cooperative Route Learning Without Communication in Reward and Goal Dynamism)
記述言語:英語
掲載種別:学術雑誌
掲載誌名:SN Computer Science ( SN Computer Science) 1巻 3号
発行年月:2020年05月
著者氏名(共著者含):
共著区分:共著
-
論文題目名:Directionality Reinforcement Learning to Operate Multi-Agent System without Communication ( Directionality Reinforcement Learning to Operate Multi-Agent System without Communication)
記述言語:英語
掲載種別:国際会議proceedings
掲載誌名:Proceedings of 11th International Workshop on Optimization and Learning in Multiagent Systems ( Proceedings of 11th International Workshop on Optimization and Learning in Multiagent Systems)
発行年月:2020年05月
著者氏名(共著者含):
共著区分:共著
-
論文題目名:マルチエージェント強化学習による目的数宇の異なるエージェント間の目的推定(共著)
記述言語:日本語
掲載種別:その他
掲載誌名:第47回知能システムシンポジウム講演論文集
発行年月:2020年03月
著者氏名(共著者含):
共著区分:共著
-
論文題目名:目的制限に基づく通信なしマルチエージェント協調行動学習とその効果の証明
記述言語:日本語
掲載種別:学術雑誌
掲載誌名:電気学会 論文誌C140巻 1号
発行年月:2020年01月
著者氏名(共著者含):
共著区分:共著
総説・解説記事 【 表示 / 非表示 】
-
題目:Well-being Computing:身体的・心理的・社会的健康増進技術と睡眠からの展望
記述言語:日本語
掲載種別:学会誌
掲載誌名:人工知能32巻 1号 (頁 81 ~ 86)
出版機関名:
発行年月:2017年01月
著者氏名(共著者含):髙玉圭樹,村田暁紀,上野史,田島友祐,辰巳嵩豊,原田智広
共著区分:共著
著書 【 表示 / 非表示 】
-
著書名:How to Emote for Consensus Building in Virtual Communication (共著)
記述言語:英語
著書種別:著書
出版機関名:Springer
発行日:2020年07月
著者名:Yoshimiki Maekawa, Fumito Uwano, Eiki Kitajima, and Keiki Takadama
著書形態:共著
-
著書名:How to Design Adaptable Agents to Obtain a Consensus with Omoiyari(共著)
記述言語:英語
著書種別:著書
出版機関名:Springer
発行日:2019年06月
著者名:Yoshimiki Maekawa, Fumito Uwano, Eiki Kitajima, and Keiki Takadama
著書形態:共著
-
著書名:Strategy for Learning Cooperative Behavior with Local Information for Multi-agent Systems
記述言語:英語
著書種別:著書
出版機関名:Springer
発行日:2018年10月
著者名:Fumito Uwano and Keiki Takadama
著書形態:共著
-
著書名:Correcting Wrongly Determined Opinions of Agents in Opinion Sharing Model(共著)
記述言語:英語
著書種別:著書
出版機関名:Springer
発行日:2018年06月
著者名:Eiki Kitajima, Caili Zhang, Haruyuki Ishii, Fumito Uwano, and Keiki Takadama
著書形態:共著
-
著書名:Strategies to improve cuckoo search toward adapting randomly changing environment(共著)
記述言語:英語
著書種別:著書
出版機関名:Springer
発行日:2017年06月
著者名:Yuta Umenai, Fumito Uwano, Hiroyuki Sato, and Keiki Takadama
著書形態:共著
学会等における発表 【 表示 / 非表示 】
-
会議区分:国内会議
発表の種類:学会発表
会議名称:NII-IDRユーザフォーラム
開催期間:2020年11月
題目又はセッション名:楽天レビューデータの商品属性を利用した文の分散表現の学習
-
会議区分:国際会議
発表の種類:学会発表
会議名称:22nd International Conference on Human-Computer Interaction
開催期間:2020年07月
題目又はセッション名:How to Emote for Consensus Building in Virtual Communication
-
会議区分:国際会議
発表の種類:学会発表
会議名称:11th International Workshop on Optimization and Learning in Multiagent Systems
開催期間:2020年05月
題目又はセッション名:Directionality Reinforcement Learning to Operate Multi-Agent System without Communication
-
会議区分:国内会議
発表の種類:学会発表
会議名称:第47回知能システムシンポジウム
開催期間:2020年03月
題目又はセッション名:マルチエージェント強化学習による目的数宇の異なるエージェント間の目的推定
-
会議区分:国内会議
発表の種類:学会発表
会議名称:計測自動制御学会システム・情報部門学術講演会2019
開催期間:2019年11月
題目又はセッション名:多次元意見共有エージェントネットワークモデルにおける複数の環境情報発信源を考慮した誤報伝搬防止アルゴリズム
学会賞等受賞 【 表示 / 非表示 】
-
受賞学術賞名:令和元年度電気通信大学学生表彰
受賞区分:その他の賞
受賞年月:2020年03月25日
受賞国:日本国
授与機関:電気通信大学
受賞者・受賞グループ名:上野史
-
受賞学術賞名:計測自動制御学会 SSI優秀論文賞
受賞区分:国内学会・会議・シンポジウム等の賞
受賞年月:2019年11月
受賞国:日本国
授与機関:計測自動制御学会
受賞者・受賞グループ名:北島瑛貴,村田暁紀,上野史,髙玉圭樹
題目名:多次元意見共有エージェントネットワークモデルにおける複数の環境情報発信源を考慮した誤報伝搬防止アルゴリズム
-
受賞学術賞名:平成30年度電気通信大学学生表彰
受賞区分:その他の賞
受賞年月:2019年03月25日
受賞国:日本国
授与機関:電気通信大学
受賞者・受賞グループ名:上野史
-
受賞学術賞名:平成29年度電気通信大学学生表彰
受賞区分:その他の賞
受賞年月:2018年03月25日
受賞国:日本国
授与機関:電気通信大学
受賞者・受賞グループ名:上野史
-
受賞学術賞名:能代宇宙イベント2017 市民ポスター展第1位
受賞区分:その他の賞
受賞年月:2017年08月
受賞国:日本国
授与機関:大学宇宙コンソーシアム
受賞者・受賞グループ名:電気通信大学髙玉研究室チームマルチーズ
科研費(文科省・学振)獲得実績 【 表示 / 非表示 】
-
研究種目名:若手研究(スタートアップ)
研究題目:抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習
研究期間:2020年10月 ~ 2022年03月
資金支給機関:文部科学省
研究内容:本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.
-
研究種目名:特別研究員奨励費
研究題目:通信無し強化学習エージェント群による動的環境への追従
研究期間:2017年04月 ~ 2020年03月
資金支給機関:文部科学省
研究内容:マルチエージェント強化学習(Multi-Agent Reinforcement Learning: MARL)はロボットのような観測した状態に対し適切に振舞う複数の主体(エージェント)が協調的な振舞いを学習し,困難な課題を解決する手法である.しかしながら実用環境では協調的振舞いは変化するため,MARLによる追従は困難である.本研究は,MARLの実環境適用範囲の拡大のための基盤技術確立を目指し,3年間で1,動的変化に追従する協調行動学習法,2,協調行動学習の理論的補強,3,実問題への適用の3つのテーマに取り組む.