- 宮下 恵, 矢野史朗, 近藤敏之, テンソル分解と動的グラフ構造推定を用いた睡眠時EEGデータの解析, 第36回自律分散システム・シンポジウム, 東京農工大学, (2/16-17, 2024)
- 宮下 恵, 矢野史朗, 近藤敏之, 代理モデルを用いた CoMirror アルゴリズムに基づく制約付き強化学習, 第35回自律分散システム・シンポジウム, オンライン, (1/22-23, 2023)
- Megumi Miyashita, Shiro Yano and Toshiyuki Kondo, Evaluation of Safe Reinforcement Learning with CoMirror Algorithm in a Non-Markovian Reward Problem, 17th International Conference on Intelligent Autonomous Systems (IAS-17), Zagreb, Croatia, (6/13-16, 2022).
- 宮下 恵, 矢野史朗, 近藤敏之, 鏡像降下法に基づく安全性を考慮した強化学習アルゴリズム, 第34回自律分散システム・シンポジウム, オンライン, (1/25-26, 2022)
- Megumi Miyashita, Toshiyuki Kondo, Shiro Yano, Reinforcement Learning with Constraint based on Mirror Descent Algorithm, Results in Control and Optimization, doi: 10.1016/j.rico.2021.100048, 2021.
- 宮下 恵, 矢野史朗, 近藤敏之, 制約つき問題のための鏡像降下法に基づく強化学習アルゴリズム, 第38回 日本ロボット学会学術講演会, (10/11, 2020)
- 宮下 恵, 加速鏡像降下法を用いた強化学習と応用, 平成30年度東京農工大学工学府情報工学専攻, 修士論文
- Megumi Miyashita, Shiro Yano, Toshiyuki Kondo, Mirror Descent Search and its Acceleration, Robotics and Autonomous Systems, Vol.106, pp.107-116, 2018. DOI: 10.1016/j.robot.2018.04.009. Journal site
- Megumi Miyashita, Ryo Hirotani, Shiro Yano, and Toshiyuki Kondo, Direct Policy Search with Extremum Seeking, SICE Annual Conference 2017, Kanazawa University, Japan. (9/22, 2017)
- 宮下 恵, 廣谷 亮, 矢野史朗, 近藤敏之, 最適化手法に基づくPI^2アルゴリズム, 第23回創発システム・シンポジウム, p.42, (9/8-10, 2017)
- Megumi Miyashita, Ryo Hirotani, Shiro Yano, and Toshiyuki Kondo, Experiment of Reinforcement Learning with Extremum Seeking, The 2017 6th ICT International Student Project Conference (ICT-ISPC2017), hosted by the Faculty of Computing, Universiti Teknologi Malaysia (UTM), Malaysia (5/23, 2017)
- 宮下 恵, 矢野史朗, 近藤敏之, 強化学習とブラックボックス最適化の関係および新しいアルゴリズムの提案, 第4回身体性システム全体会議, 霧島, (2/27-3/1, 2017)
- 宮下 恵, 鏡像降下法に基づいた高次元強化学習, 平成28年度東京農工大学工学部情報工学科 卒業論文
- 宮下 恵, 廣谷 亮, 矢野史朗, 近藤敏之, ブラックボックス最適化としてのPI2アルゴリズム導出, システム・情報部門学術講演会2016, 滋賀県立体育館,滋賀, (12/6-8, 2016)
- 廣谷 亮, 宮下 恵, 矢野史朗, 近藤敏之, Extremum Seekingによる強化学習, システム・情報部門学術講演会2016, 滋賀県立体育館,滋賀, (12/6-8, 2016)