宮下 恵 のバックアップ差分(No.7)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
#menu(jMenu)

- [[宮下 恵]], ''加速鏡像降下法を用いた強化学習と応用'', 平成30年度東京農工大学工学府情報工学専攻, 修士論文~
- [[Megumi Miyashita]], [[Shiro Yano]], [[Toshiyuki Kondo]], ''Mirror Descent Search and its Acceleration'', Robotics and Autonomous Systems, Vol.106, pp.107-116, 2018. DOI: 10.1016/j.robot.2018.04.009. [[Journal site>https://www.sciencedirect.com/science/article/pii/S0921889017307546]]
- [[Megumi Miyashita]], [[Ryo Hirotani]], [[Shiro Yano]], and [[Toshiyuki Kondo]], ''Direct Policy Search with Extremum Seeking'', SICE Annual Conference 2017, Kanazawa University, Japan. (9/22, 2017)
- [[宮下 恵]], [[廣谷 亮]], [[矢野史朗]], [[近藤敏之]], ''最適化手法に基づくPI^2アルゴリズム'', 第23回創発システム・シンポジウム, p.42, (9/8-10, 2017)
- [[Megumi Miyashita]], [[Ryo Hirotani]], [[Shiro Yano]], and [[Toshiyuki Kondo]], ''Experiment of Reinforcement Learning with Extremum Seeking'', [[The 2017 6th ICT International Student Project Conference (ICT-ISPC2017)>http://comp.utm.my/ict-ispc2017/]], hosted by the Faculty of Computing, Universiti Teknologi Malaysia (UTM), Malaysia (5/23, 2017) 
- [[宮下 恵]], [[矢野史朗]], [[近藤敏之]], ''強化学習とブラックボックス最適化の関係および新しいアルゴリズムの提案'', 第4回身体性システム全体会議, 霧島, (2/27-3/1, 2017)
- [[宮下 恵]], ''鏡像降下法に基づいた高次元強化学習'',  平成28年度東京農工大学工学部情報工学科 卒業論文
- [[宮下 恵]], [[廣谷 亮]], [[矢野史朗]], [[近藤敏之]], ''ブラックボックス最適化としてのPI2アルゴリズム導出'', システム・情報部門学術講演会2016, 滋賀県立体育館,滋賀, (12/6-8, 2016)
- [[廣谷 亮]], [[宮下 恵]], [[矢野史朗]], [[近藤敏之]], ''Extremum Seekingによる強化学習'', システム・情報部門学術講演会2016, 滋賀県立体育館,滋賀, (12/6-8, 2016)