共同研究・競争的資金等の研究 - 上野 史
-
Enhancing XCS with Dual-Stream Identification for Perceptual Aliasing in Multi-Step Decision Making
2025年07月
公益財団法人ウエスコ学術振興財団 令和7年度海外渡航費助成事業
上野史
担当区分:研究代表者
-
IoT環境におけるAIエージェントの構築を支援するサービス基盤の研究
2025年04月 - 2029年03月
日本学術振興会 科学研究費補助金 基盤研究(B) 基盤研究(B)
林冬惠, 村上陽平, 丁世堯, 上野史
担当区分:研究分担者
-
最適化ベンチマーク問題自動生成のための大規模言語モデル駆動型進化的アルゴリズム
研究課題/領域番号:jh250063 2025年04月 - 2026年03月
一般財団法人 高度情報科学技術研究機構 2025年度学際大規模情報基盤共同利用・共同研究拠点(JHPCN)公募型共同研究
原田智広, 上野史, 髙玉圭樹
担当区分:研究分担者
-
多目的進化計算を用いたエージェント群の戦略的意思決定を実現する強化学習
2024年04月 - 2027年03月
日本学術振興会 科学研究費助成事業 基盤研究(B) 基盤研究(B)
上野史, 原田智広, 林冬惠
担当区分:研究代表者
-
次世代エッジAI半導体・フィジカルインテリジェンス(PI)の統合的研究開発
2024年
岡山大学グローバル最先端異分野融合研究機構 2024年度研究拠点形成支援事業
中澤篤志, 倉爪亮, 本田美和子, 伊野英男, 香田将英, 原田菜穂子, 明石卓也, 中川博之, 上野史, 高橋規一, 松野隆幸, 関本敦, 松田裕貴, 脇元修一, 山口大介, 山内利宏, 渡邊実, 渡邊誠也, 亀川哲志, 戸田雄一郎
-
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
2022年04月 - 2025年03月
日本学術振興会 科学研究費助成事業 基盤研究(B) 基盤研究(B)
太田学, 金澤輝一, 上野史
担当区分:研究分担者
-
物流倉庫最適化に向けた人とロボットの関係性を考慮したマルチエージェント強化学習
2022年04月 - 2024年03月
一般社団法人 アズビル山武財団 2022年度研究開発助成
上野史
担当区分:研究代表者
-
未知の協調・環境の動的性質に追従するエージェント群の協調戦略学習と知識進化
研究課題/領域番号:21KK0206 2022年 - 2024年
日本学術振興会 科学研究費助成事業 国際共同研究加速基金(国際共同研究強化(A)) 国際共同研究加速基金(国際共同研究強化(A))
上野 史
配分額:6890000円 ( 直接経費:5300000円 、 間接経費:1590000円 )
-
「福祉支援施設におけるインシデント発生予測モデルの構築」に関する研究
2021年06月 - 2025年03月
岡山システムサービス 共同研究
太田学, 上野史, 阿河孝英
担当区分:研究分担者
-
未知の協調・環境を想定したマルチエージェント強化学習の知識転移
研究課題/領域番号:21K17807 2021年04月 - 2024年03月
日本学術振興会 科学研究費助成事業 若手研究 若手研究
上野 史
配分額:4680000円 ( 直接経費:3600000円 、 間接経費:1080000円 )
本年度は,マルチエージェント強化学習の未知の協調,未知の環境への適応に向けた,(1)学習結果のモジュール化,(2)知識モジュールに基づく未知の協調行動学習法の提案,(3)未知環境を想定した知識の再構成法の提案の内,主にテーマ(1)(2)を実施した.具体的には,まず,従来提案したエージェント間の通信を介さずに環境変化に追従可能な協調行動学習法を,必要な協調行動が動的変化する迷路問題に適用し,協調の変化に追従可能であるかその性能を分析した.結果として協調の変化に対して各エージェントの目的を適切に変化させてそれに追従し学習することを確認した.また,問題領域が同一であれば必要な協調が異なっても適切に学習可能であることが明らかとなった.本成果により深層強化学習器による複数の協調行動の同時学習の可能性が示唆されており,重要な成果であるといえる.また,Coin Gameと呼ばれる他エージェントの学習目標を推定することで高い利得が得られる問題において,従来手法では他エージェントの情報を基に学習していたが,報酬設計によりそれに基づくことなく学習可能な手法を提案し,その有効性を示した.結果として深層強化学習器では直接的な情報を伴わなくとも未知の協調行動を学習し得ることが明らかとなった.本成果は,知識モジュールを抽出した際にそれを組み合わせることによる効果が示唆されており,本研究の前提を裏付ける点において重要である.これらの成果は,計測自動制御学会システム・情報部門学術講演会2021,およびSMASH22 Winter Symposiumにて発表した.
-
抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習
研究課題/領域番号:20K23326 2020年09月 - 2022年03月
日本学術振興会 科学研究費助成事業 研究活動スタート支援 研究活動スタート支援
上野 史
配分額:2860000円 ( 直接経費:2200000円 、 間接経費:660000円 )
本研究ではまず,深層強化学習をエージェント同士で入力情報の粒度が異なるマルチエージェント環境に展開し,深層学習によって情報粒度を抽象化していることを分析により明らかにした.また,従来提案した動的環境に追従可能なマルチエージェント強化学習法を深層強化学習に展開することで,入力情報の粒度が異なる複数のエージェントによる迷路問題において最適方策を獲得することを示した.また,動的環境においては,入力情報の粒度が異なる場合,エージェント間で同期的に動くことが難しいため,提案手法の隠れ層に時系列データを学習可能なLSTMを導入し,適切に同期的に協調行動をとる方策を獲得することを明らかにした.
-
通信無し強化学習エージェント群による動的環境への追従
研究課題/領域番号:17J08724 2017年04月 - 2020年03月
日本学術振興会 科学研究費助成事業 特別研究員奨励費 特別研究員奨励費
上野 史
担当区分:研究代表者
配分額:2500000円 ( 直接経費:2500000円 )
マルチエージェント強化学習(Multi-Agent Reinforcement Learning: MARL)はロボットのような観測した状態に対し適切に振舞う複数の主体(エージェント)が協調的な振舞いを学習し,困難な課題を解決する手法です.しかしながら実用環境では協調的振舞いは変化するため,MARLによる追従は困難です.本研究は,MARLの実環境適用範囲の拡大のための基盤技術確立を目指し,3年間で1,動的変化に追従する協調行動学習法,2,協調行動学習の理論的補強,3,実問題への適用の3つのテーマに取り組みます.平成30年度ではテーマ1,2に取り組み,主に(1)エージェント数,(2)目的状態及び目的数,(3)報酬値3種類の動的変化に追従可能な非通信協調行動学習法の提案及び理論的補強を行いました.また,テーマ3についても(3)実問題解決に向けた不正確なデータを用いた学習法を考案しました.特に本年度は理論的補強に主眼を置き,各提案手法における最適性とそのための条件,そして適用限界を理論的に示しました.加えて(3)については複数の機械学習法を取り入れ,実問題に向けた不正確な情報しか得られない環境における適切な学習法を考案する等,理論を主眼に置きつつMARLを展開し,今後に向けた準備を着々と進めております.課題(1)の成果は国際会議PRIMA2018にて発表しました.また,課題(2)の成果は,(1)のものと合わせて国際会議ECML PKDD2019に投稿中であり,英文ジャーナルJCMSIに現在条件付きで採録が決定しております.また,課題(3)の成果は国内学会SSI2018にてポスター発表を行い,国際ジャーナルMachine Learningへ現在投稿中です.そして課題(4)の成果は国際会議GECCO2018にて発表を行うなど,対外的に高い評価を受けています.