宮下恵

宮下恵, 矢野史朗, 近藤敏之, テンソル分解と動的グラフ構造推定を用いた睡眠時EEGデータの解析, 第36回自律分散システム・シンポジウム, 東京農工大学, (2/16-17, 2024)
宮下恵, 矢野史朗, 近藤敏之, 代理モデルを用いた CoMirror アルゴリズムに基づく制約付き強化学習, 第35回自律分散システム・シンポジウム, オンライン, (1/22-23, 2023)
Megumi Miyashita, Shiro Yano and Toshiyuki Kondo, Evaluation of Safe Reinforcement Learning with CoMirror Algorithm in a Non-Markovian Reward Problem, 17th International Conference on Intelligent Autonomous Systems (IAS-17), Zagreb, Croatia, (6/13-16, 2022).
宮下恵, 矢野史朗, 近藤敏之, 鏡像降下法に基づく安全性を考慮した強化学習アルゴリズム, 第34回自律分散システム・シンポジウム, オンライン, (1/25-26, 2022)
Megumi Miyashita, Toshiyuki Kondo, Shiro Yano, Reinforcement Learning with Constraint based on Mirror Descent Algorithm, Results in Control and Optimization, doi: 10.1016/j.rico.2021.100048, 2021.
宮下恵, 矢野史朗, 近藤敏之, 制約つき問題のための鏡像降下法に基づく強化学習アルゴリズム, 第38回日本ロボット学会学術講演会, (10/11, 2020)
宮下恵, 加速鏡像降下法を用いた強化学習と応用, 平成30年度東京農工大学工学府情報工学専攻, 修士論文
Megumi Miyashita, Shiro Yano, Toshiyuki Kondo, Mirror Descent Search and its Acceleration, Robotics and Autonomous Systems, Vol.106, pp.107-116, 2018. DOI: 10.1016/j.robot.2018.04.009. Journal site
Megumi Miyashita, Ryo Hirotani, Shiro Yano, and Toshiyuki Kondo, Direct Policy Search with Extremum Seeking, SICE Annual Conference 2017, Kanazawa University, Japan. (9/22, 2017)
宮下恵, 廣谷亮, 矢野史朗, 近藤敏之, 最適化手法に基づくPI^2アルゴリズム, 第23回創発システム・シンポジウム, p.42, (9/8-10, 2017)

Megumi Miyashita, Ryo Hirotani, Shiro Yano, and Toshiyuki Kondo, Experiment of Reinforcement Learning with Extremum Seeking, The 2017 6th ICT International Student Project Conference (ICT-ISPC2017), hosted by the Faculty of Computing, Universiti Teknologi Malaysia (UTM), Malaysia (5/23, 2017)
宮下恵, 矢野史朗, 近藤敏之, 強化学習とブラックボックス最適化の関係および新しいアルゴリズムの提案, 第4回身体性システム全体会議, 霧島, (2/27-3/1, 2017)
宮下恵, 鏡像降下法に基づいた高次元強化学習, 平成28年度東京農工大学工学部情報工学科卒業論文
宮下恵, 廣谷亮, 矢野史朗, 近藤敏之, ブラックボックス最適化としてのPI2アルゴリズム導出, システム・情報部門学術講演会2016, 滋賀県立体育館，滋賀, (12/6-8, 2016)
廣谷亮, 宮下恵, 矢野史朗, 近藤敏之, Extremum Seekingによる強化学習, システム・情報部門学術講演会2016, 滋賀県立体育館，滋賀, (12/6-8, 2016)

宮下恵

メニュー

Operations

宮下 恵

メニュー

Operations

Find item in this site

宮下恵