技能を伝える仮想変形ロボ〜日経サイエンス2023年3月号より
既存の作業法を別の形のロボットへ効果的に移転できる
工場から手術室まで多くの仕事場に,様々な形状とサイズのロボットが導入されている。その多くは機械学習を通じた試行錯誤によって技能を習得しており,新たな仕事をさせるには作業を毎回ゼロから学ばせる必要がある。これを回避するため,そうした技能を異なる形状のロボットの間で伝承する新手法が開発された。「実用上で重要な考案だ」と,去る夏の機械学習国際会議で発表されたこの研究を率いたカーネギー・メロン大学のコンピューター科学者リュウ(Xingyu Liu)はいう。「そして学術研究としても,根本的で魅力的な課題だと思う」。
人間のような5本指の手を持つロボットアームがあるとしよう。ハンマーを持ち上げて板に釘を打ち付けるよう,その5本指を訓練した。次に2本指のグリッパーに同じ仕事をさせたいとする。研究チームはこの2つのロボットを橋渡しする一連の仮想ロボットをコンピューター上に作り出した。元のロボットの形状からスタートして徐々に形を変え,他方のロボットに近づいていく。これら中間段階にある各ロボットに目的の作業をさせ,ニューラルネットワークを微調整する。こうして所定の成功率に達したところで,その制御プログラムを次の段階の仮想ロボットに引き継ぐ。
これら仮想ロボットの移行を進めるため,チームは共有の「キネマティック樹形図」を作った。手足の各部を点で表し,関節を表す線でそれらをつないだ図だ。ハンマーで釘を打つ技能を2本指のグリッパーに移転するために,チームは5本指のうち3本に対応する点のサイズと重みをゼロに調整した。それぞれの中間段階ロボットで指の大きさと重みを少しずつ小さくしていき,それらを制御するネットワークを学習させて変形に合わせた。また,各段階のロボット間で変化が過大にも過小にもならないように,訓練法を微調整した。
その名は「リボルバー」
リボルバー(REvolveR;Robot-Evolve-Robotから)と名づけられたこのシステムは,対象のロボットをゼロから教育する基本的な訓練法をしのいだ。ハンマー作業のほか,ボールを動かしたりドアを開けたりする実験で,グリッパーに成功率90%を達成させるのに,他の訓練法では最も優れたものでもリボルバーに比べ29~108%多くの試行を要した。従来法のほうが訓練に有益なフィードバックを使っているのに,こうなった。(続く)
続きは現在発売中の2023年3月号誌面でどうぞ。