2021/10/11 更新

写真a

ウワノ フミト
上野 史
UWANO Fumito
所属
自然科学学域 助教
職名
助教
連絡先
メールアドレス
プロフィール
2017年4月~2020年3月 電気通信大学 博士後期課程 学生(日本学術振興会特別研究員DC1)

研究内容:静的・動的環境における通信なしマルチエージェント強化学習
本研究は,現実問題に起こる通信遅延や情報の不確かさに対処するために,複数のエージェント間の協調行動を通信なしで導く強化学習手法を提案するとともに,変化のない静的環境に加えて不測の事態などで変化する動的環境に対応できるように拡張した.迷路問題にて比較実験を行った結果,静的環境のみならず動的環境においても,提案手法は従来のQ学習よりも多くの報酬を早く獲得可能であることを明らかにした.

2020年4月~現在 岡山大学 助教

研究内容1:抽象度の異なる協調行動を学習可能なエージェントの提案
本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.

研究内容2:未知の協調・環境を想定したマルチエージェント強化学習の知識転移
本研究では,ロボットなどの活動主体(エージェント)が複数存在するときの協調制御ルールを,周囲環境から得た情報から各々が学習するマルチエージェント強化学習において,学習すべき協調や環境が未知であるときに適応した協調行動学習法を提案する.具体的には,他の環境などで今まで学習したエージェントの学習結果を各要素に分割し,階層的に抽象化することで生成した知識を組み合わせて学習することで未知の協調・環境に適応する.

学位

  • 博士(工学) ( 2020年3月   電気通信大学 )

研究キーワード

  • ヒューマンエージェントインタラクション

  • 宇宙工学

  • 進化的機械学習

  • 社会シミュレーション

  • 医療情報学

  • 進化計算

  • マルチエージェントシステム

  • 強化学習

研究分野

  • 情報通信 / 情報学基礎論

  • 情報通信 / 情報ネットワーク

  • 情報通信 / 知能ロボティクス

  • 情報通信 / 知能情報学

学歴

  • 電気通信大学     Department of Informatics

    2017年4月 - 2020年3月

      詳細を見る

  • 電気通信大学    

    2015年4月 - 2017年3月

      詳細を見る

  • 電気通信大学    

    2011年4月 - 2015年3月

      詳細を見る

経歴

  • 岡山大学   学術研究院自然科学学域   助教

    2021年4月 - 現在

      詳細を見る

    国名:日本国

    researchmap

  • 岡山大学   大学院自然科学研究科   助教

    2020年4月 - 2021年3月

      詳細を見る

    国名:日本国

    researchmap

  • 電気通信大学   非常勤職員

    2020年1月 - 2020年2月

      詳細を見る

  • 日本学術振興会   特別研究員 DC1

    2017年4月 - 2020年3月

      詳細を見る

所属学協会

  • 日本ロボット学会

    2020年8月 - 現在

      詳細を見る

  • 日本航空宇宙学会

    2020年7月 - 現在

      詳細を見る

  • 日本シミュレーション&ゲーミング学会

    2020年7月 - 現在

      詳細を見る

  • 電子情報通信学会

    2020年5月 - 現在

      詳細を見る

  • 電気学会

    2019年9月 - 現在

      詳細を見る

  • 進化計算学会

    2019年9月 - 現在

      詳細を見る

  • Association for Computing Machinery (ACM)

    2019年4月 - 現在

      詳細を見る

  • Institute of Electrical and Electronics Engineers (IEEE)

    2019年4月 - 現在

      詳細を見る

  • 情報処理学会

    2018年8月 - 現在

      詳細を見る

  • 人工知能学会

    2018年7月 - 現在

      詳細を見る

  • 計測自動制御学会

    2018年6月 - 現在

      詳細を見る

  • 大学宇宙コンソーシアム

    2014年4月 - 2018年3月

      詳細を見る

▼全件表示

委員歴

  • 情報処理学会   論文誌ジャーナル/JIP編集委員会委員  

    2021年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

  • 情報処理学会   中国支部運営委員  

    2021年6月 - 現在   

      詳細を見る

    団体区分:学協会

    researchmap

 

論文

  • A Cooperative Learning Method for Multi-Agent System with Different Input Resolutions 査読

    上野 史

    Proceedings of 4th International Symposium on Agents, Multi-Agent Systems and Robotics   2021年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • 多次元意見共有モデル上のシグモイド関数に基づく誤報防止アルゴリズム 査読

    上野 史, 北島瑛貴, 髙玉圭樹

    人工知能学会論文誌   36 ( 6 )   2021年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    researchmap

  • How to Emote for Consensus Building in Virtual Communication 査読

    前川佳幹, 上野 史, 北島瑛貴, 髙玉圭樹

    Proceedings of 22nd International Conference on Human-Computer Interaction   2020年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Reward Value-Based Goal Selection for Agents’ Cooperative Route Learning Without Communication in Reward and Goal Dynamism 査読

    上野史, 髙玉圭樹

    SN Computer Science   1 ( 3 )   2020年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s42979-020-00191-2

    researchmap

    その他リンク: http://link.springer.com/article/10.1007/s42979-020-00191-2/fulltext.html

  • Directionality Reinforcement Learning to Operate Multi-Agent System without Communication 査読

    上野 史, 髙玉圭樹

    Proceedings of 11th International Workshop on Optimization and Learning in Multiagent Systems (OptLearnMAS2020)   2020年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • How to Design Adaptable Agents to Obtain a Consensus with Omoiyari. 査読

    前川佳幹, 上野史, 北島瑛貴, 高玉圭樹

    Human Interface and the Management of Information. Visual Information and Knowledge Management - Thematic Area, HIMI 2019, Held as Part of the 21st HCI International Conference, HCII 2019, Orlando, FL, USA, July 26-31, 2019, Proceedings, Part I   462 - 475   2019年7月

     詳細を見る

    出版者・発行元:Springer  

    DOI: 10.1007/978-3-030-22660-2_34

    researchmap

  • How to Select Appropriate Craters to Estimate Location Accurately in Comprehensive Situations for SLIM Project 査読

    上野 史, 辰巳嵩豊, 村田暁紀, 髙玉圭樹, 鎌田弘之, 石田貴行, 福田盛介, 澤井秀次郎, 坂井真一郎

    Proceedings of the 32nd International Symposium on Space Technology and Science (ISTS) & 9th Nano-Satellite Symposium (NSAT)   2019年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Bat Algorithm with Dynamic Niche Radius for Multimodal Optimization 査読

    岩瀬拓哉, 高野諒, 上野史, 佐藤寛之, 高玉圭樹

    Proceedings of the 3rd International Conference on Intelligent Systems, Metaheuristics & Swarm Intelligence (ISMSI 2019)   2019年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Maximum Entropy Inverse Reinforcement Learning with Incomplete Experts 査読

    長谷川智, 上野 史, 髙玉圭樹

    Proceedings of the 24th International Symposium on Artificial Life and Robotics   2019年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Utilizing Observed Information for No-Communication Multi-agent Reinforcement Learning toward Cooperation in Dynamic Environment 査読

    上野 史, 髙玉圭樹

    SICE Journal of Control, Measurement, and System Integration   2019年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    researchmap

  • 目的制限に基づく通信なしマルチエージェント協調行動学習とその効果の証明 査読

    上野 史, 髙玉圭樹

    電気学会 論文誌C   140 ( 1 )   2019年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    researchmap

  • Niche Radius Adaptation in Bat Algorithm for Locating Multiple Optima in Multimodal Functions. 査読

    Takuya Iwase, Ryo Takano, Fumito Uwano, Hiroyuki Sato, Keiki Takadama

    IEEE Congress on Evolutionary Computation, CEC 2019, Wellington, New Zealand, June 10-13, 2019   800 - 807   2019年

     詳細を見る

    出版者・発行元:IEEE  

    DOI: 10.1109/CEC.2019.8790087

    researchmap

  • Novelty Search-based Bat Algorithm: Adjusting Distance among Solutions for Multimodal Optimization 査読

    岩瀬拓哉, 髙野諒, 上野 史, 佐藤寛之, 髙玉圭樹

    Proceedings of the 22nd Asia Pacific Symposium on Intelligent and Evolutionary Systems   2018年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Strategy for Learning Cooperative Behavior with Local Information for Multi-agent Systems 査読

    上野 史, 髙玉圭樹

    Proceedings of The 21st International Conference on Principles and Practice of Multi-Agent Systems   663 - 670   2018年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-030-03098-8_54

    researchmap

  • Multiple swarm intelligence methods based on multiple population with sharing best solution for drastic environmental change. 査読

    Yuta Umenai, Fumito Uwano, Hiroyuki Sato, Keiki Takadama

    Proceedings of the Genetic and Evolutionary Computation Conference Companion, GECCO 2018, Kyoto, Japan, July 15-19, 2018   97 - 98   2018年7月

     詳細を見る

  • Weighted Opinion Sharing Model for Cutting Link and Changing Information among Agents as Dynamic Environment 査読

    上野 史, 齋藤 嶺, 髙玉圭樹

    SICE Journal of Control, Measurement, and System Integration   11 ( 4 )   331 - 340   2018年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.9746/jcmsi.11.331

    researchmap

  • Multi-Agent Cooperation Based on Reinforcement Learning with Internal Reward in Maze Problem 査読

    上野 史, 建部尚樹, 田島友祐, 中田雅也, ティム・コバックス, 髙玉圭樹

    SICE Journal of Control, Measurement, and System Integration   11 ( 4 )   321 - 330   2018年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.9746/jcmsi.11.321

    researchmap

  • Correcting Wrongly Determined Opinions of Agents in Opinion Sharing Model. 査読

    Eiki Kitajima, Caili Zhang, Haruyuki Ishii, Fumito Uwano, Keiki Takadama

    Human Interface and the Management of Information. Interaction, Visualization, and Analytics - 20th International Conference, HIMI 2018, Held as Part of HCI International 2018, Las Vegas, NV, USA, July 15-20, 2018, Proceedings, Part I   658 - 676   2018年7月

     詳細を見る

    出版者・発行元:Springer  

    DOI: 10.1007/978-3-319-92043-6_52

    researchmap

  • Generalizing rules by random forest-based learning classifier systems for high-dimensional data mining. 査読

    Fumito Uwano, Koji Dobashi, Keiki Takadama, Tim Kovacs

    Proceedings of the Genetic and Evolutionary Computation Conference Companion, GECCO 2018, Kyoto, Japan, July 15-19, 2018   1465 - 1472   2018年7月

     詳細を見る

  • How to Detect Essential Craters in Camera Shot Image to Increase the Number of Spacecraft Location Estimation while Improving its Accuracy? 査読

    Haruyuki Ishii, Yuta Umenai, Kazuma Matsumoto, Fumito Uwano, Takato Tatsumi, Keiki Takadama, Hiroyuki Kamata, Takayuki Ishida, Seisuke Fukuda, Shujiro Sawai, Shinichiro Sakai

    Proceedings of The International Symposium on Artificial Intelligence, Robotics and Automation in Space, i-SAIRAS 2018   2018年6月

     詳細を見る

  • Analyzing Triangle Matching Method Based on Craters for Spacecraft Localization 査読

    Fumito Uwano, Haruyuki Ishii, Yuta Umenai, Kazuma Matsumoto, Takato Tatsumi, Akinori Murata, Keiki Takadama

    Proceedings of The International Symposium on Artificial Intelligence, Robotics and Automation in Space, i-SAIRAS 2018   2018年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Ensemble Heart Rate Extraction Method for Biological Data from Water Pressure Sensor 査読

    Fumito Uwano, Keiki Takadama

    Proceedings of 2018 AAAI Spring Symposium Series   304 - 309   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Improving Sleep Stage Estimation Accuracy by Circadian Rhythm Extracted from a Low Frequency Component of Heart Rate

    Akari Tobaru, Fumito Uwano, Takuya Iwase, Kazuma Matsumoto, Ryo Takano, Yusuke Tajima, Yuta Umenai, Keiki Takadama

    Proceedings of 2018 AAAI Spring Symposium Series   297 - 303   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Strategy for Learning Cooperative Behavior with Local Information for Multi-agent Systems. 査読

    Fumito Uwano, Keiki Takadama

    PRIMA 2018: Principles and Practice of Multi-Agent Systems - 21st International Conference, Tokyo, Japan, October 29 - November 2, 2018, Proceedings   663 - 670   2018年

     詳細を見る

    出版者・発行元:Springer  

    DOI: 10.1007/978-3-030-03098-8_54

    researchmap

  • Sleep Stage Estimation Comparing Own Past Heartrate or Others' Heartrate

    TAJIMA Yusuke, UWANO Fumito, MURATA Akinori, HARADA Tomohiro, TAKADAMA Keiki

    SICE Journal of Control, Measurement, and System Integration   11 ( 1 )   32‐39(J‐STAGE)   2018年

     詳細を見る

    記述言語:英語  

    DOI: 10.9746/jcmsi.11.32

    J-GLOBAL

    researchmap

  • 相似な三角形に基づくクレータマッチングによるSLIM探査機の自己位置推定とその精度向上

    石井 晴之, 村田 暁紀, 上野 史, 辰巳 嵩豊, 梅内 祐太, 高玉 圭樹, 原田 智広, 鎌田 弘之, 石田 貴行, 福田 盛介, 澤井 秀次郎, 坂井 真一郎

    航空宇宙技術   17 ( 0 )   69 - 78   2018年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 日本航空宇宙学会  

    This paper focuses on the Evolutional Triangle Similarity Matching (ETSM) method for estimating spacecraft location in Smart Lander for Investigating Moon (SLIM) mission and improves it by adding the functions of elimination of line symmetric triangles between crater map and camera shot image, comparison of rotation relationship of triangles and triangle formation method using Delaunay triangulation and introducing point group matching as a coordinate calculation function. To evaluate the robustness of the improved method, we conduct simulation experiments using the crater map and camera shot images in six situations. This experiments have revealed the following implications: (1) this method improved accuracy of location estimation within 5.1 pixels by the functions of elimination of line symmetric triangles between crater map and camera shot image, (2) this method slight got worse accuracy at low or high altitude of spacecraft, however, this method successfully reduced incorrect spacecraft location estimation by comparison of rotation relationship of triangles, (3) this method improved accuracy of location estimation by triangle formation method using Delaunay triangulation, but possibility of incorrect spacecraft location estimation is slight increased, and (4) integration method of these three mechanism can estimate spacecraft location within 5 pixels without being affected altitude difference and rotation of camera shot image.

    CiNii Article

    researchmap

  • Ensemble Heart Rate Extraction Method for Biological Data from Water Pressure Sensor. 査読

    Fumito Uwano, Keiki Takadama

    2018 AAAI Spring Symposia, Stanford University, Palo Alto, California, USA, March 26-28, 2018.   2018年

     詳細を見る

  • Improving Sleep Stage Estimation Accuracy by Circadian Rhythm Extracted from a Low Frequency Component of Heart Rate. 査読

    Akari Tobaru, Fumito Uwano, Takuya Iwase, Kazuma Matsumoto, Ryo Takano, Yusuke Tajima, Yuta Umenai, Keiki Takadama

    2018 AAAI Spring Symposia, Stanford University, Palo Alto, California, USA, March 26-28, 2018.   2018年

     詳細を見る

  • Recovery system based on exploration-biased genetic algorithm for stuck rover in planetary exploration 査読

    Fumito Uwano, Yusuke Tajima, Akinori Murata, Keiki Takadama

    Journal of Robotics and Mechatronics   29 ( 5 )   877 - 886   2017年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Fuji Technology Press  

    Contributing toward continuous planetary surface exploration by a rover (i.e., a space probe), this paper proposes (1) an adaptive learning mechanism as the software system, based on an exploration-biased genetic algorithm (EGA), which intends to explore several behaviors, and (2) a recovery system as the hardware system, which helps a rover exit stuck areas, a kind of immobilized situation, by testing the explored behaviors. We develop a rover-type space probe, which has a stabilizer with two movable joints like an arm, and learns how to use them by employing EGA. To evaluate the effectiveness of the recovery system based on the EGA, the following two field experiments are conducted with the proposed rover: (i) a small field test, including a stuck area created artificially in a park
    and (ii) a large field test, including several stuck areas in Black Rock Desert, USA, as an analog experiment for planetary exploration. The experimental results reveal the following implications: (1) the recovery system based on the EGA enables our rover to exit stuck areas by an appropriate sequence of motions of the two movable joints
    and (2) the success rate of getting out of stuck areas is 95% during planetary exploration.

    DOI: 10.20965/jrm.2017.p0877

    Web of Science

    Scopus

    researchmap

  • Supporting the exploration of the learning goals for a continuous learner toward creative learning 査読

    Takato Okudo, Tomohiro Yamaguchi, Akinori Murata, Takato Tatsumi, Fumito Uwano, Keiki Takadama

    Journal of Advanced Computational Intelligence and Intelligent Informatics   21 ( 5 )   907 - 916   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Fuji Technology Press  

    This paper proposes a learning goal space that visualizes the distribution of the obtained solutions to support the exploration of the learning goals for a learner. Subsequently, we examine the method for assisting a learner to present the novelty of the obtained solution. We conduct a learning experiment using a continuous learning task to identify various solutions. To assign the subjects space to explore the learning goals, several parameters related to the success of the task are not instructed to the subjects. In the comparative experiment, three types of learning feedbacks provided to the subjects are compared. These are presenting the learning goal space with obtained solutions mapped on it, directly presenting the novelty of the obtained solutions mapped on it, and presenting some value that is slightly related to the obtained solution. In the experiments, the subjects to whom the learning goal space or novelty of the obtained solution is shown, continue to identify solutions according to their learning goals until the final stage in the experiment is attained. Therefore, in a continuous learning task, our supporting method of directly or indirectly presenting the novelty of the obtained solution through the learning goal space is effective.

    DOI: 10.20965/jaciii.2017.p0907

    Web of Science

    Scopus

    researchmap

  • Comparison between reinforcement learning methods with different goal selections in multi-agent cooperation 査読

    Fumito Uwano, Keiki Takadama

    Journal of Advanced Computational Intelligence and Intelligent Informatics   21 ( 5 )   917 - 929   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Fuji Technology Press  

    This study discusses important factors for zero communication, multi-agent cooperation by comparing different modified reinforcement learning methods. The two learning methods used for comparison were assigned different goal selections for multi-agent cooperation tasks. The first method is called Profit Minimizing Reinforcement Learning (PMRL)
    it forces agents to learn how to reach the farthest goal, and then the agent closest to the goal is directed to the goal. The second method is called Yielding Action Reinforcement Learning (YARL)
    it forces agents to learn through a Q-learning process, and if the agents have a conflict, the agent that is closest to the goal learns to reach the next closest goal. To compare the two methods, we designed experiments by adjusting the following maze factors: (1) the location of the start point and goal
    (2) the number of agents
    and (3) the size of maze. The intensive simulations performed on the maze problem for the agent cooperation task revealed that the two methods successfully enabled the agents to exhibit cooperative behavior, even if the size of the maze and the number of agents change. The PMRL mechanism always enables the agents to learn cooperative behavior, whereas the YARL mechanism makes the agents learn cooperative behavior over a small number of learning iterations. In zero communication, multi-agent cooperation, it is important that only agents that have a conflict cooperate with each other.

    DOI: 10.20965/jaciii.2017.p0917

    Web of Science

    Scopus

    researchmap

  • The robust spacecraft location estimation algorithm toward the misdetection crater and the undetected crater in SLIM 査読

    Haruyuki Ishii, Keiki Takadama, Akinori Murata, Fumito Uwano, Takato Tatsumi, Yuta Umenai, Kazuma Matsumoto, Hiroyuki Kamata, Takayuki Ishida, Seisuke Fukuda, Shujiro Sawai, Shinichiro Sakai

    Proceedings of International Symposium on Space Technology and Science, ISTS 2017   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Strategies to improve cuckoo search toward adapting randomly changing environment 査読

    Yuta Umenai, Fumito Uwano, Hiroyuki Sato, Keiki Takadama

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   10385   573 - 582   2017年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Verlag  

    Cuckoo Search (CS) is the powerful optimization algorithm and has been researched recently. Cuckoo Search for Dynamic Environment (D-CS) has proposed and tested in dynamic environment with multi-modality and cyclically before. It was clear that has the hold capability and can find the optimal solutions in this environment. Although these experiments only provide the valuable results in this environment, D-CS not fully explored in dynamic environment with other dynamism. We investigate and discuss the find and hold capabilities of D-CS on dynamic environment with randomness. We employed the multi-modal dynamic function with randomness and applied D-CS into this environment. We compared D-CS with CS in terms of getting the better fitness. The experimental result shows the D-CS has the good hold capability on dynamic environment with randomness. Introducing the Local Solution Comparison strategy and Concurrent Solution Generating strategy help to get the hold and find capabilities on dynamic environment with randomness.

    DOI: 10.1007/978-3-319-61824-1_62

    Scopus

    researchmap

  • Communication-Less Cooperative Q-Learning Agents in Maze Problem 査読

    Fumito Uwano, Keiki Takadama

    INTELLIGENT AND EVOLUTIONARY SYSTEMS, IES 2016   8   453 - 467   2017年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:SPRINGER INT PUBLISHING AG  

    This paper introduces a reinforcement learning technique with an internal reward for a multi-agent cooperation task. The proposed method is an extension of Q-learning which changes the ordinary (external) reward to the internal reward for agent-cooperation under the condition of no communication. To increase the certainty of the proposed methods, we theoretically investigate what values should be set to select the goal for the cooperation among agents. In order to show the effectiveness of the proposed method, we conduct the intensive simulation on the maze problem for the agent-cooperation task, and confirm the following implications: (1) the proposed method successfully enable agents to acquire cooperative behaviors while a conventional method fails to always acquire such behaviors; (2) the cooperation among agents according to their internal rewards is achieved no communication; and (3) the condition for the cooperation among any number of agent is indicated.

    DOI: 10.1007/978-3-319-49049-6_33

    Web of Science

    researchmap

  • Adaptive Learning Based on Genetic Algorithm for Rover in Planetary Exploration 査読

    Fumito Uwano, Akinori Murata, Keiki Takadama

    Proceedings of The International Symposium on Artificial Intelligence, Robotics and Automation in Space, i-SAIRAS 2016   2016年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  • Reinforcement learning with internal reward for multi-Agent cooperation: A theoretical approach 査読

    Fumito Uwano, Naoki Tatebe, Masaya Nakata, Keiki Takadama, Tim Kovacs

    BICT 2015 - 9th EAI International Conference on Bio-Inspired Information and Communications Technologies   2 ( 8 )   e2   2016年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Association for Computing Machinery, Inc  

    This paper focuses on a multi-Agent cooperation which is generally difficult to be achieved without sufficient information of other agents, and proposes the reinforcement learning method that introduces an internal reward for a multi-Agent cooperation without sufficient information. To guarantee to achieve such a cooperation, this paper theoretically derives the condition of selecting appropriate actions by changing internal rewards given to the agents, and extends the reinforcement learning methods (Q-learning and Profit Sharing) to enable the agents to acquire the appropriate Q-values up- dated according to the derived condition. Concretely, the internal rewards change when the agents can only find better solution than the current one. The intensive simulations on the maze problems as one of test beds have revealed the following implications:(1) our proposed method successfully enables the agents to select their own appropriate cooperating actions which contribute to acquiring the minimum steps towards to their goals, while the conventional methods (i.e., Q-learning and Profit Sharing) cannot always acquire the minimum steps
    and (2) the proposed method based on Profit Sharing provides the same good performance as the proposed method based on Q-learning.

    DOI: 10.4108/eai.3-12-2015.2262878

    Scopus

    researchmap

  • Real-Time Sleep Stage Estimation from Biological Data with Trigonometric Function Regression Model. 査読

    Tomohiro Harada, Fumito Uwano, Takahiro Komine, Yusuke Tajima, Takahiro Kawashima, Morito Morishima, Keiki Takadama

    2016 AAAI Spring Symposia, Stanford University, Palo Alto, California, USA, March 21-23, 2016   2016年

     詳細を見る

  • A Modified Cuckoo Search Algorithm for Dynamic Optimization Problems 査読

    Yuta Umenai, Fumito Uwano, Yusuke Tajima, Masaya Nakata, Hiroyuki Sato, Keiki Takadama

    2016 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION (CEC)   1757 - 1764   2016年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    This paper proposes a simple modification of the Cuckoo Search called CS for a dynamic environment. In this paper, we consider a dynamic optimization problem where the global optimum can be cyclically changed depending on time. Our modified CS algorithm holds good candidates in order to effectively explore the search space near those candidates with an intensive local search. Our first experiment tests the prosed method on a set of static optimization problems, which aims at evaluating the potential performance of the proposed method. Then, we apply it to a dynamic optimization problem. Experimental results on the static problems show that the proposed method derives a better performance than the conventional method, which suggest the proposed method potentially has a good capability of finding a good solution. On the dynamic problem, the proposed method also performs well while the conventional method fails to find a better solution.

    DOI: 10.1109/CEC.2016.7744001

    Web of Science

    researchmap

  • Reinforcement Learning with Internal Reward for Multi-Agent Cooperation: A Theoretical Approach. 査読

    Fumito Uwano, Naoki Tatebe, Masaya Nakata, Keiki Takadama, Tim Kovacs

    BICT 2015, Proceedings of the 9th EAI International Conference on Bio-inspired Information and Communications Technologies (formerly BIONETICS), New York City, United States, December 3-5, 2015   332 - 339   2015年

     詳細を見る

▼全件表示

MISC

  • BERTを利用した煽りツイート検出の一手法

    松本典久, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 引用意図を利用した学術論文閲覧支援情報生成の一手法

    西海真祥, 金澤輝一, 高須淳宏, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • Twitterを利用した旅行者の状況推定と観光ルート推薦

    竹下知宏, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • Flickrとじゃらんnetを利用した穴場スポットの発見手法

    野本輝, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 文のマルチカテゴリ分散表現の獲得とその応用

    谷健太郎, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • ニューラルネットワークを用いた表構造解析の一手法

    青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 評判情報の特徴軸を考慮した可視化システム

    西川天帆路, 上野史, 太田学

    第13回データ工学と情報マネジメントに関するフォーラム講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • マルチエージェントシステムにおける協調行動の抽象度と深層強化学習器の関係性の考察

    上野 史, 坂本充生

    第48回知能システムシンポジウム講演論文集   2021年3月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • ユーザの興味を利用した学術論文閲覧支援の一手法

    岩本拓実, 金澤輝一, 上野 史, 太田 学

    情報処理学会第83回全国大会講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • BERTによる参考文献書誌情報抽出精度の向上

    荒川瞭平, 金澤輝一, 高須淳宏, 上野 史, 太田 学

    情報処理学会第83回全国大会講演論文集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • COVID-19の感染症対策を考慮した観光ルート推薦の一手法

    小波修斗, 上野史, 太田学

    2021年電子情報通信学会総合大会情報・システムソサイエティ特別企画ジュニア&学生ポスターセッション予稿集   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 楽天レビューデータの商品属性を利用した文の分散表現の学習

    谷健太郎, 上野史, 太田学

    NII-IDRユーザフォーラム2020   2020年11月

     詳細を見る

    記述言語:日本語  

    researchmap

  • マルチエージェント強化学習による目的数の異なるエージェント間の目的推定

    坂本充生, 前川佳幹, 北島瑛貴, 上野 史, 髙玉圭樹

    第47回知能システムシンポジウム講演論文集   2020年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 逆強化学習における準最適行動系列からの最適行動獲得に向けたエキスパート行動の修正

    長谷川智, 上野史, 高玉圭樹

    計測自動制御学会 システム・情報部門学術講演会2019 講演論文集   2019年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • クレータの座標ずれを利用したSLIM探査機の自己位置推定精度の向上

    藁谷由香, 上野史, 髙玉圭樹

    第63回宇宙科学技術連合講演会講演論文集   2019年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 多次元意見共有エージェントネットワークモデルにおける複数の環境情報発信源を考慮した誤報伝搬防止アルゴリズム

    北島瑛貴, 村田暁紀, 上野史, 高玉圭樹

    計測自動制御学会 システム・情報部門学術講演会2019 講演論文集   2019年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 非通信マルチエージェント強化学習における獲得報酬値の変動を用いたエージェント数の動的変化への追従

    上野史, 高玉圭樹

    第18回情報科学技術フォーラム講演資料集   2019年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • エージェント間通信を伴わず環境状態および報酬の包括的動的変化に追従する理論的マルチエージェント強化学習 査読

    上野史, 高玉圭樹

    合同エージェントワークショップ&シンポジウム2019講演資料集   2019年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 集団適応を導くギャップ補填に基づく「思いやり」

    前川佳幹, 上野史, 北島瑛貴, 高玉圭樹

    第33回人工知能学会全国大会   2019年6月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 故障に対して冗長性を備えた仮想ロボットのニューロ進化による持続可能な行動獲得

    速水陽平, 辰巳嵩豊, 上野史, 高玉圭樹

    知能システムシンポジウム講演資料(CD-ROM)   46th   ROMBUNNO.B4‐3   2019年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 好奇心を持つエージェントによる多様性のある情報伝搬シミュレーションモデルの提案

    北島瑛貴, 高玉圭樹, 村田暁紀, 上野史

    HAIシンポジウム講演論文集   2019年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究発表ペーパー・要旨(全国大会,その他学術会議)  

    researchmap

  • 報酬の動的変化に適応する通信なしマルチエージェント協調学習のための公平性に基づく内部報酬設定法

    上野史, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2018   ROMBUNNO.SS0802   2018年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数解探索を考慮した分散型Bat Algorithm

    岩瀬拓哉, 高野諒, 上野史, 佐藤寛之, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2018   ROMBUNNO.SS0410   2018年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • グリッドネットワーク上の誤報抑制意見共有アルゴリズム

    北島瑛貴, 辰巳嵩豊, 村田暁紀, 上野史, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2018   ROMBUNNO.SS0413   2018年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 行動系列分割に基づく不完全なエキスパートからの逆強化学習

    長谷川智, 上野史, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2018   ROMBUNNO.SS0804   2018年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 睡眠時無呼吸症候群患者のための無拘束型リアルタイム睡眠段階推定法

    田島友祐, 上野史, 原田智広, 髙玉圭樹

    ヘルスケア・医療情報通信技術研究会論文集   2018年11月

     詳細を見る

  • 睡眠時無呼吸症候群患者に対する無拘束型リアルタイム睡眠段階推定法の分析

    田島友祐, 高野諒, 上野史, 原田智広, 高玉圭樹

    電子情報通信学会技術研究報告   118 ( 286(MI2018 38-58)(Web) )   37‐40 (WEB ONLY)   2018年10月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 負の報酬生成による環境変化に適応可能な逆強化学習

    長谷川智, 梅内祐太, 上野史, 佐藤寛之, 高玉圭樹, 山口智浩

    知能システムシンポジウム講演資料(CD-ROM)   45th   ROMBUNNO.C4‐2   2018年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 相似な三角形に基づくクレータマッチングによるSLIM探査機の自己位置推定とその精度向上

    石井晴之, 村田暁紀, 上野史, 辰巳嵩豊, 梅内祐太, 高玉圭樹, 原田智広, 鎌田弘之, 石田貴行, 福田盛介, 澤井秀次郎, 坂井真一郎

    航空宇宙技術(Web)   17   69‐78(J‐STAGE)   2018年

     詳細を見る

  • 包括的な撮影画像パターンに対するSLIM探査機の自己位置推定の評価と精度向上

    上野史, 村田暁紀, 辰巳嵩豊, 高玉圭樹, 鎌田弘之, 石田貴行, 福田盛介, 澤井秀次郎, 坂井真一郎

    宇宙科学技術連合講演会講演集(CD-ROM)   62nd   ROMBUNNO.1D11   2018年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 動的環境適応に向けた粒子群最適化とカッコウ探索の協働のための情報共有方法の検討

    梅内祐太, 上野史, 佐藤寛之, 高玉圭樹

    進化計算シンポジウム講演資料   2017年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Searching Multiple Local Optimal Solutions in Multimodal Function by Bat Algorithm based on Novelty Search

    Takuya Iwase, Ryo Takano, Fumito Uwano, Yuta Umenai, Haruyuki Ishii, Hiroyuki Sato, Keiki Takadama

    進化計算シンポジウム講演資料   2017年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 深層学習による次元圧縮ルールの学習分類子システムにおける初期ルールとしての可能性

    松本和馬, 高野諒, 上野史, 佐藤寛之, 高玉圭樹

    進化計算シンポジウム講演資料   2017年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 知識の忘却に基づく迷路形状の変化に追従する非通信マルチエージェント強化学習

    上野史, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2017   ROMBUNNO.SS13‐4   2017年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 複数解探索を考慮した分散型Bat Algorithm

    岩瀬拓哉, 高野諒, 上野史, 梅内祐太, 石井晴之, 佐藤寛之, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2017   ROMBUNNO.SS04‐10   2017年11月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 環境変化に向けたPSOとCuckoo Searchに基づく解集団混合進化計算

    梅内祐太, 上野史, 佐藤寛之, 高玉圭樹

    進化計算研究会講演資料   2017年9月

     詳細を見る

    記述言語:日本語  

    researchmap

  • Well―being Computing:身体的・心理的・社会的健康増進技術と睡眠からの展望

    高玉圭樹, 村田暁紀, 上野史, 田島友祐, 辰巳嵩豊, 原田智広

    人工知能   32 ( 1 )   81‐86   2017年1月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • Well-being Computing : 身体的・心理的・社会的健康増進技術と睡眠からの展望 (特集 Well-being Computing)

    髙玉 圭樹, 村田 暁紀, 上野 史, 田島 友祐, 辰巳 嵩豊, 原田 智広

    人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence   32 ( 1 )   81 - 86   2017年1月

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会 ; 2014-  

    CiNii Article

    researchmap

  • SLIM探査機の高度や姿勢の傾きによるクレータ検出位置ずれに対応する自己位置推定法

    石井晴之, 村田暁紀, 上野史, 辰巳嵩豊, 梅内裕太, 松本和馬, 高玉圭樹, 鎌田弘之, 石田貴行, 福田盛介, 澤井秀次郎, 坂井真一郎

    宇宙科学技術連合講演会講演集(CD-ROM)   61st   ROMBUNNO.1C10   2017年

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 可変長遺伝子型進化計算に基づく二輪ローバー型惑星探査機のスタック脱出行動最適化

    上野史, 村田暁紀, 高玉圭樹

    計測自動制御学会システム・情報部門学術講演会講演論文集(CD-ROM)   2016   ROMBUNNO.SS02‐6   2016年12月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • カッコウ探索に基づく複数のダイナミズムを含む動的環境への適応

    梅内祐太, 上野史, 佐藤寛之, 高玉圭樹

    進化計算シンポジウム講演資料   2016年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • 快眠を導く音とは─心拍・呼吸に連動した音の睡眠への影響─

    髙玉 圭樹, 村田 暁紀, 上野 史, 田島 友祐, 原田 智広

    人工知能   31 ( 3 )   2016年5月

     詳細を見る

    記述言語:日本語  

    CiNii Article

    researchmap

  • 「超高齢化社会とAI―健康増進支援編―」快眠を導く音とは―心拍・呼吸に連動した音の睡眠への影響―

    高玉圭樹, 村田暁紀, 上野史, 田島友祐, 原田智広

    人工知能   31 ( 3 )   383‐388   2016年5月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

  • 快眠を導く音とは : 心拍・呼吸に連動した音の睡眠への影響 (特集 超高齢化社会とAI : 健康増進支援編)

    髙玉 圭樹, 村田 暁紀, 上野 史, 田島 友祐, 原田 智広

    人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence   31 ( 3 )   383 - 388   2016年5月

     詳細を見る

    記述言語:日本語   出版者・発行元:人工知能学会 ; 2014-  

    CiNii Article

    researchmap

  • Real-time sleep stage estimation from biological data with trigonometric function regression model

    Tomohiro Harada, Fumito Uwano, Takahiro Komine, Yusuke Tajima, Takahiro Kawashima, Morito Morishima, Keiki Takadama

    AAAI Spring Symposium - Technical Report   SS-16-01 - 07   348 - 353   2016年1月

     詳細を見る

    Copyright © 2016, Association for the Advancement of Artificial Intelligence (www.aaai.org). All rights reserved. This paper proposes a novel method to estimate sleep stage in real-time with a non-contact device. The proposed method employs the trigonometric function regression model to estimate prospective heart rate from the partially obtained heart rate and calculates the sleep stage from the estimated heart rate. This paper conducts the subject experiment and it is revealed that the proposed method enables to estimate the sleep stage in realtime, in particular the proposed method has the equivalent estimation accuracy as the previous method that estimates the sleep stage according to the entire heart rate during sleeping.

    Scopus

    researchmap

  • A Modified Cuckoo Search Algorithm for Dynamic Optimization Problems

    Yuta Umenai, Fumito Uwano, Yusuke Tajima, Masaya Nakata, Hiroyuki Sato, Keiki Takadama

    2016 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION (CEC)   2016 ( CEC )   1757 - 1764   2016年

     詳細を見る

    記述言語:英語   出版者・発行元:IEEE  

    This paper proposes a simple modification of the Cuckoo Search called CS for a dynamic environment. In this paper, we consider a dynamic optimization problem where the global optimum can be cyclically changed depending on time. Our modified CS algorithm holds good candidates in order to effectively explore the search space near those candidates with an intensive local search. Our first experiment tests the prosed method on a set of static optimization problems, which aims at evaluating the potential performance of the proposed method. Then, we apply it to a dynamic optimization problem. Experimental results on the static problems show that the proposed method derives a better performance than the conventional method, which suggest the proposed method potentially has a good capability of finding a good solution. On the dynamic problem, the proposed method also performs well while the conventional method fails to find a better solution.

    DOI: 10.1109/CEC.2016.7744001

    Web of Science

    J-GLOBAL

    researchmap

  • 多峰性関数における局所探索に基づくCuckoo Search Algorithm

    梅内祐太, 上野史, 中田雅也, 佐藤寛之, 高玉圭樹

    進化計算シンポジウム講演資料   2015年12月

     詳細を見る

    記述言語:日本語  

    researchmap

  • ジレンマ問題におけるマルチエージェント間協調のための内部報酬推算

    上野史, 建部尚紀, 中田雅也, 高玉圭樹

    知能システムシンポジウム講演資料(CD-ROM)   42nd   ROMBUNNO.F-11   2015年3月

     詳細を見る

    記述言語:日本語  

    J-GLOBAL

    researchmap

▼全件表示

講演・口頭発表等

  • 未知の協調・環境を想定したマルチエージェント強化学習の知識転移

    上野 史

    境界と関係性を視座とするシステムズ・アプローチ調査研究会  2021年9月25日 

     詳細を見る

    開催年月日: 2021年9月25日 - 2021年9月26日

    記述言語:日本語  

    researchmap

  • 動的環境におけるマルチエージェント強化学習―不完全な情報から集団を動かす仕組み― 招待

    上野 史

    第6回岡山大学AI研究会  2021年3月4日 

     詳細を見る

    開催年月日: 2021年3月4日

    会議種別:口頭発表(招待・特別)  

    researchmap

  • 非通信マルチエージェント協調行動学習に向けた目的価値と内部報酬に基づく強化学習

    上野 史

    関係論的システムデザイン調査研究会  2018年1月22日  下原勝憲

     詳細を見る

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:滋賀県 同志社大学 びわこリトリートセンター  

    researchmap

産業財産権

受賞

  • DEIM学生プレゼンテーション賞

    2021年3月   DEIM2021   Flickrとじゃらんnetを利用した穴場スポットの発見手法

    野本輝, 上野史, 太田学

     詳細を見る

  • DEIM学生プレゼンテーション賞

    2021年3月   DEIM2021   ニューラルネットワークを用いた表構造解析の一手法

    青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学

     詳細を見る

  • 令和元年度学生表彰

    2020年3月   電気通信大学   研究業績

    上野 史

     詳細を見る

  • SSI優秀論文賞

    2019年11月   計測自動制御学会   多次元意見共有エージェントネットワークモデルにおける複数の環境情報発信源を考慮した誤報伝搬防止アルゴリズム

    北島瑛貴, 村田暁紀, 上野史, 髙玉圭樹

     詳細を見る

  • 平成30年度 学生表彰

    2019年3月   電気通信大学  

    上野 史

     詳細を見る

  • 平成29年度 学生表彰

    2018年3月   電気通信大学  

    上野 史

     詳細を見る

  • 能代宇宙イベント2017, ミッション部門能代CanSat大賞

    2017年8月   大学宇宙工学コンソーシアム  

     詳細を見る

  • 能代宇宙イベント2017, 市民ポスター展第1位

    2017年8月   大学宇宙工学コンソーシアム  

     詳細を見る

  • 平成28年度 学生表彰

    2017年3月   電気通信大学  

    上野 史

     詳細を見る

  • UNISON賞 口頭発表部門 第2位

    2016年12月   大学宇宙工学コンソーシアム   惑星探査の新時代~未知の環境へ向けて~

     詳細を見る

  • UNISON賞 ポスター発表部門 第1位

    2016年12月   大学宇宙工学コンソーシアム   惑星探査の新時代

     詳細を見る

  • ARLISS 2016 UNISEC Award

    2016年9月   大学宇宙工学コンソーシアム  

     詳細を見る

  • 平成27年度 学生表彰

    2016年3月   電気通信大学  

    高玉研究室, ARLISS, 村田暁紀, 齋藤嶺, 上野史

     詳細を見る

  • UNISON賞 ポスター発表部門

    2015年12月   大学宇宙工学コンソーシアム   行動を学び・子どもたちに学ばせる新たなローバー

     詳細を見る

  • UNISON賞 学生口頭発表部門

    2015年12月   大学宇宙工学コンソーシアム   行動を学び・子どもたちに学ばせる新たなローバー

     詳細を見る

  • BICT Student Participation Grants

    2015年12月   European Alliance for Innovation (EAI)   Reinforcement Learning with Internal Reward for Multi-Agent Cooperation: A Theoretical Approach

    上野 史

     詳細を見る

  • ARLISS 2015 Comeback Competition Accuracy Award 1st Place

    2015年9月   大学宇宙工学コンソーシアム  

    上野 史, 高玉研究室, チームGAIA

     詳細を見る

  • ARLISS 2015 Comeback Competition Technology Award Comeback Algorithm

    2015年9月   大学宇宙工学コンソーシアム  

    上野 史, 高玉研究室, チームGAIA

     詳細を見る

  • ARLISS 2015 Comeback Competition Technology Award Ground Locomotion Mechanism

    2015年9月   大学宇宙工学コンソーシアム  

    上野 史, 高玉研究室, チームGAIA

     詳細を見る

  • UNISEC Work Shop ベストポスター賞

    2014年12月   大学宇宙工学コンソーシアム   二輪ローバー型惑星探査機の新たなる形を探求して

     詳細を見る

  • ARLISS 2014 Comeback Competition Precision Award

    2014年9月   大学宇宙工学コンソーシアム  

     詳細を見る

▼全件表示

共同研究・競争的資金等の研究

  • 「福祉支援施設におけるインシデント発生予測モデルの構築」に関する研究

    2021年06月 - 2022年02月

    岡山システムサービス  共同研究 

    太田学, 上野史, 阿河孝英

      詳細を見る

    担当区分:研究分担者 

    researchmap

  • 未知の協調・環境を想定したマルチエージェント強化学習の知識転移

    研究課題/領域番号:21K17807  2021年04月 - 2024年03月

    文部科学省  科学研究費助成事業  若手研究

    上野 史

      詳細を見る

    担当区分:研究代表者 

    researchmap

  • 抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習

    研究課題/領域番号:20K23326  2020年10月 - 2022年03月

    文部科学省  科学研究費助成事業  研究活動スタート支援

    上野 史

      詳細を見る

    担当区分:研究代表者 

    researchmap

  • 通信無し強化学習エージェント群による動的環境への追従

    研究課題/領域番号:17J08724  2017年04月 - 2020年03月

    日本学術振興会  科学研究費助成事業 特別研究員奨励費  特別研究員奨励費

    上野 史

      詳細を見る

    担当区分:研究代表者 

    配分額:2500000円 ( 直接経費:2500000円 )

    マルチエージェント強化学習(Multi-Agent Reinforcement Learning: MARL)はロボットのような観測した状態に対し適切に振舞う複数の主体(エージェント)が協調的な振舞いを学習し,困難な課題を解決する手法です.しかしながら実用環境では協調的振舞いは変化するため,MARLによる追従は困難です.本研究は,MARLの実環境適用範囲の拡大のための基盤技術確立を目指し,3年間で1,動的変化に追従する協調行動学習法,2,協調行動学習の理論的補強,3,実問題への適用の3つのテーマに取り組みます.平成30年度ではテーマ1,2に取り組み,主に(1)エージェント数,(2)目的状態及び目的数,(3)報酬値3種類の動的変化に追従可能な非通信協調行動学習法の提案及び理論的補強を行いました.また,テーマ3についても(3)実問題解決に向けた不正確なデータを用いた学習法を考案しました.特に本年度は理論的補強に主眼を置き,各提案手法における最適性とそのための条件,そして適用限界を理論的に示しました.加えて(3)については複数の機械学習法を取り入れ,実問題に向けた不正確な情報しか得られない環境における適切な学習法を考案する等,理論を主眼に置きつつMARLを展開し,今後に向けた準備を着々と進めております.課題(1)の成果は国際会議PRIMA2018にて発表しました.また,課題(2)の成果は,(1)のものと合わせて国際会議ECML PKDD2019に投稿中であり,英文ジャーナルJCMSIに現在条件付きで採録が決定しております.また,課題(3)の成果は国内学会SSI2018にてポスター発表を行い,国際ジャーナルMachine Learningへ現在投稿中です.そして課題(4)の成果は国際会議GECCO2018にて発表を行うなど,対外的に高い評価を受けています.

    researchmap

 

担当授業科目

  • プログラミング (2021年度) 3・4学期  - 水1,水2

  • プログラミング (2021年度) 3・4学期  - 水1,水2

  • プログラミング1 (2021年度) 第3学期  - 水1,水2

  • プログラミング2 (2021年度) 第4学期  - 水1,水2

  • プログラミング演習1 (2021年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2021年度) 第2学期  - 水1,水2,水3

  • 専門英語 (2021年度) 第1学期  - 火5,火6,木1,木2

  • 工学倫理 (2021年度) 第4学期  - 火1,火2,金5,金6

  • 工学倫理 (2021年度) 第4学期  - 火1~2,金5~6

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 月1~2

  • 情報処理入門2(情報機器の操作を含む) (2021年度) 第2学期  - 木1~2

  • 技術英語 (2021年度) 後期  - その他

  • 表現技法1 (2021年度) 前期  - その他

  • 表現技法2 (2021年度) 後期  - その他

  • 電子情報システム工学特別研究 (2021年度) 通年  - その他

  • プログラミング (2020年度) 3・4学期  - 水1,水2

  • プログラミング1 (2020年度) 第3学期  - 水1,水2

  • プログラミング2 (2020年度) 第4学期  - 水1,水2

  • プログラミング演習 (2020年度) 1・2学期  - 水1,水2,水3

  • プログラミング演習1 (2020年度) 第1学期  - 水1,水2,水3

  • プログラミング演習2 (2020年度) 第2学期  - 水1,水2,水3

  • 専門英語 (2020年度) 第1学期  - 火5,火6,木1,木2

  • 専門英語 (2020年度) 第1学期  - 火5,火6,木1,木2

  • 工学倫理 (2020年度) 第4学期  - 火1,火2,金5,金6

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 月1,月2

  • 情報処理入門2(情報機器の操作を含む) (2020年度) 第2学期  - 木1,木2

  • 表現技法1 (2020年度) 前期  - その他

  • 表現技法2 (2020年度) 後期  - その他

  • 電子情報システム工学特別研究 (2020年度) 通年  - その他

▼全件表示

 

学術貢献活動

  • 第8回 IoT時代を担う世代による情報処理技術研究会

    役割:企画立案・運営等

    太田学,上野史  2021年7月20日

     詳細を見る

    種別:学会・研究会等 

    researchmap