宮下 恵

  1. 宮下 恵, 矢野史朗, 近藤敏之, テンソル分解と動的グラフ構造推定を用いた睡眠時EEGデータの解析, 第36回自律分散システム・シンポジウム, 東京農工大学, (2/16-17, 2024)
  2. 宮下 恵, 矢野史朗, 近藤敏之, 代理モデルを用いた CoMirror アルゴリズムに基づく制約付き強化学習, 第35回自律分散システム・シンポジウム, オンライン, (1/22-23, 2023)
  3. Megumi Miyashita, Shiro Yano and Toshiyuki Kondo, Evaluation of Safe Reinforcement Learning with CoMirror Algorithm in a Non-Markovian Reward Problem, 17th International Conference on Intelligent Autonomous Systems (IAS-17), Zagreb, Croatia, (6/13-16, 2022).
  4. 宮下 恵, 矢野史朗, 近藤敏之, 鏡像降下法に基づく安全性を考慮した強化学習アルゴリズム, 第34回自律分散システム・シンポジウム, オンライン, (1/25-26, 2022)
  5. Megumi Miyashita, Toshiyuki Kondo, Shiro Yano, Reinforcement Learning with Constraint based on Mirror Descent Algorithm, Results in Control and Optimization, doi: 10.1016/j.rico.2021.100048, 2021.
  6. 宮下 恵, 矢野史朗, 近藤敏之, 制約つき問題のための鏡像降下法に基づく強化学習アルゴリズム, 第38回 日本ロボット学会学術講演会, (10/11, 2020)
  7. 宮下 恵, 加速鏡像降下法を用いた強化学習と応用, 平成30年度東京農工大学工学府情報工学専攻, 修士論文
  8. Megumi Miyashita, Shiro Yano, Toshiyuki Kondo, Mirror Descent Search and its Acceleration, Robotics and Autonomous Systems, Vol.106, pp.107-116, 2018. DOI: 10.1016/j.robot.2018.04.009. Journal site
  9. Megumi Miyashita, Ryo Hirotani, Shiro Yano, and Toshiyuki Kondo, Direct Policy Search with Extremum Seeking, SICE Annual Conference 2017, Kanazawa University, Japan. (9/22, 2017)
  10. 宮下 恵, 廣谷 亮, 矢野史朗, 近藤敏之, 最適化手法に基づくPI^2アルゴリズム, 第23回創発システム・シンポジウム, p.42, (9/8-10, 2017)