国際的な研究者グループが、中枢パターン発生器 (CPG) と深層強化学習 (DRL) を組み合わせて人間の動作を模倣する新しいアプローチを開発しました。この方法は、歩行や走行の動作を模倣するだけでなく、動作データが存在しない周波数の動作を生成し、歩行から走行へのスムーズな移行動作を可能にし、不安定な表面の環境への適応を可能にします。
彼らの画期的な成果の詳細は、2024年4月15日にIEEE Robotics and Automation Letters誌に掲載されました。
あまり意識することはないかもしれませんが、歩いたり走ったりするには、環境に適応したり、歩く/走る速度を変えたりすることを可能にする、生来の生物学的冗長性が伴います。この複雑さと複雑さを考えると、ロボットで人間のような動きを再現することは非常に困難です。
現在のモデルは、未知の環境や困難な環境への適応に苦労することが多く、効率や効果が低下します。これは、AI が 1 つまたは少数の正しい解決策を生成するのに適しているためです。生物とその動きには、従うべき正しいパターンが 1 つだけあるわけではありません。さまざまな動きが考えられ、どれが最良または最も効率的であるかは必ずしも明らかではありません。
DRL は、研究者がこれを克服しようとしてきた方法の 1 つです。DRL は、ディープ ニューラル ネットワークを活用して従来の強化学習を拡張し、より複雑なタスクを処理し、生の感覚入力から直接学習することで、より柔軟で強力な学習機能を実現します。DRL の欠点は、特にシステムの自由度が高い場合に、広大な入力空間を探索するための膨大な計算コストがかかることです。
もう 1 つのアプローチは、模倣学習です。これは、ロボットが同じ動作タスクを実行する人間の動作測定データを模倣することで学習するものです。模倣学習は安定した環境での学習には適していますが、トレーニング中に遭遇したことのない新しい状況や環境に直面すると苦労します。学習した動作の範囲が狭いため、効果的に変更してナビゲートする能力が制限されます。
「これら 2 つのアプローチを組み合わせることで、多くの限界を克服しました」と、東北大学大学院工学研究科の林部光弘教授は説明します。「模倣学習は CPG のようなコントローラーのトレーニングに使用され、CPG 自体にディープラーニングを適用する代わりに、CPG をサポートする反射ニューラル ネットワークの形式に適用しました。」
CPG は脊髄にある神経回路で、生物の導体のように、筋肉活動のリズミカルなパターンを生成します。動物では、反射回路が CPG と連携して適切なフィードバックを提供し、地形に合わせて速度や歩行/走行動作を調整します。
CPG とその反射型対応物の構造を採用することにより、適応型模倣 CPG (AI-CPG) 方式は、人間の動作を模倣しながら、動作生成において優れた適応性と安定性を実現します。
「この画期的な進歩は、前例のない環境適応能力を備えたロボット工学における人間のような動きの生成において新たなベンチマークを確立しました」と林部氏は付け加えます。「私たちの方法は、さまざまな業界での応用が期待される、ロボット制御のための生成AI技術の開発における大きな前進を表しています。」
研究グループは、東北大学大学院工学研究科とスイス連邦工科大学ローザンヌ校のメンバーで構成された。
タイトル: AI-CPG: 強化反射ニューラル ネットワークを通じて学習した二足歩行のための適応型模倣中枢パターン ジェネレーター
著者: G. Li、A. Ijspeert、M. Hayashibe
ジャーナル: IEEE ロボティクスおよびオートメーションレター