あなたの研究内容、もしくは勉強してきた内容を、自らが実際に行った役割を交えて、詳しく教えてください。(200字以上)

私は現在、人工知能の一分野である強化学習の研究に励んでいます。強化学習とは、エージェントが試行錯誤を通じて適切な行動を獲得していくための学習シミュレーション方法であり、ロボットの移動動作の制御にも応用されています。強化学習では、エージェントが学習を進めていく際、既存の知識の「活用」と、新しい知識を得るための「探索」はトレードオフの関係にあり、それらのバランスを上手く調節する必要があります。その実現を目的として、私は強化学習にUCBアルゴリズムを取り入れました。UCBアルゴリズムとは、多腕バンディット問題という、カジノ等の複数台あるスロットマシンの中からどの台が最も当たる確率が高いかを見つけるという問題において、シンプルなアルゴリズムで「活用」と「探索」のバランスを図れるものです。これにより、従来手法と比べ劇的に性能は向上し、効率的な学習を実現することができました。
私は大学院から現在の研

新規会員登録はこちら
ページトップ