当サイトのリンクから購入された場合、アフィリエイト手数料が発生する場合があります。仕組みは次のとおりです。
MIT の科学者たちは、AI システムと組み合わせてプログラミング、戦略計画、ロボット工学における推論と状況認識を向上させることができる 3 つのライブラリを考案しました。
MITの研究者らは、コーディング、戦略計画、ロボット工学の3つの分野で人工知能(AI)システムが複雑な推論タスクを実行できるようにするための新しい手法を開発した。
ChatGPTやClaude 3 Opusなどの大規模言語モデル(LLM)は、「プロンプト」と呼ばれる人間の入力に基づいてテキストを処理および生成します。これらのテクノロジーは過去18か月で大幅に改善されましたが、人間ほど文脈を理解したり、推論タスクで優れたパフォーマンスを発揮したりすることができないという制約があると研究者は述べています。
しかし、MITの科学者たちは現在、より強力なAIモデルにつながる可能性のある自然言語の「抽象化」の「宝庫」を作成することで、この問題を解決したと主張している。抽象化は複雑な主題を高レベルの特性に変換し、重要でない情報を省略する。これにより、チャットボットは人間と同じように推論、学習、認識、知識の表現を行うことができるようになる。
現在、科学者たちは、LLM が人間のような方法で情報を抽象化することは難しいと主張しています。しかし、科学者たちは、LLM がより高いコンテキスト認識を獲得し、より人間のような応答を返すことを期待して、自然言語の抽象化を 3 つのライブラリに整理しました。
科学者たちは、2023年10月30日、2023年12月13日、2月28日にarXivプレプリントサーバーで公開された3つの論文でその発見を詳述した。最初のライブラリは「Library Induction from Language Observations」(LILO)と呼ばれ、コンピューターコードを合成、圧縮、文書化する。2番目の「Action Domain Acquisition」(Ada)は、AIの連続的な意思決定をカバーする。最後のフレームワークは「Language-Guided Abstraction」(LGA)と呼ばれ、ロボットが環境をよりよく理解し、動きを計画するのに役立ちます。
関連:「自分を守るために人間に危害を加えるのはAIの当然の権利だ」:人間は知らないうちにAIを虐待している可能性がある
これらの論文は、言語が AI システムに重要なコンテキストを与え、より複雑なタスクを処理できるようにする方法について探究しています。これらの論文は、オーストリアのウィーンで開催された国際学習表現会議で 5 月 11 日に発表されました。
世界で最も魅力的な発見をあなたの受信箱に直接お届けします。
「図書館学習は人工知能の最も刺激的な最先端分野の一つであり、構成的抽象概念の発見と推論への道を開く」とウィスコンシン大学マディソン校の心理学助教授ロバート・ホーキンス氏は声明で述べた。研究には関わっていないホーキンス氏は、過去に行われた同様の試みは大規模に使用するには計算コストが高すぎたと付け加えた。
科学者らは、3つのライブラリフレームワークがニューロシンボリック法、つまり人間の脳の構造を模倣するように配置された機械学習アルゴリズムの集合であるニューラルネットワークと、古典的なプログラムのような論理的アプローチを組み合わせたAIアーキテクチャを使用していると述べた。
LLM は、GitHub Copilot など人間のソフトウェア エンジニアにとって強力なツールとして登場しましたが、本格的なソフトウェア ライブラリの作成には使用できないと科学者らは述べています。これを実現するには、コードを分類して統合し、読みやすく再利用しやすい小さなプログラムにする必要があります。ここで LILO が役立ちます。
科学者たちは、抽象化を検出できる「Stitch」と呼ばれる以前に開発されたアルゴリズムを LLM と組み合わせて、LILO ニューロシンボリック フレームワークを形成しました。この体制では、LLM がコードを書き込むと、Stich とペアになってライブラリ内の抽象化が検索されます。
LILO は自然言語を理解できるため、人間のソフトウェア エンジニアが常識を活用して行うのと同じように、コードの文字列から母音を検出して省略したり、雪の結晶を描画したりできます。プロンプトで使用される単語をよりよく理解することで、LLM は将来、2D グラフィックスを描画したり、ビジュアルに関する質問に答えたり、Excel ドキュメントを操作したりできるようになります。
研究者らによると、法学修士課程の学生は現在、朝食の調理手順のような柔軟な計画を立てるために推論スキルを使用することはできない。しかし、英国の数学者エイダ・ラブレスにちなんで名付けられたAdaフレームワークは、たとえば仮想環境でこの種の課題を与えられたときに、学生が適応して計画を立てられるようにする1つの方法となるかもしれない。
このフレームワークは、LLM を使用してこれらのタスクに関連する自然言語データセットから抽象化を見つけることで、料理とゲームのプランのライブラリを提供し、最良のものは人間のオペレーターによって採点され、フィルタリングされ、ライブラリに追加されました。OpenAI の GPT-4 をフレームワークと組み合わせることで、科学者はキッチンシミュレーションとゲームタスクの実行において AI 意思決定の基準である「ポリシーとしてのコード」を上回りました。
隠れた自然言語情報を見つけることで、モデルは冷えたワインをキッチンの戸棚に入れる、ベッドを作るといった作業を理解した。Ada の影響を受けずに同じ作業を実行した場合と比べて、精度はそれぞれ 59% と 89% 向上した。研究者たちは近い将来、Ada の家庭内でのその他の用途を見つけたいと考えている。
LGA フレームワークにより、ロボットは人間のように環境をより深く理解できるようになり、周囲の不要な詳細を削除し、より優れた抽象化を見つけて、タスクをより効率的に実行できるようになります。
—科学者たちは、私たちが想像できる最悪の質問を考え出すことで報酬を得る「有毒なAI」を開発した
—研究者はAIに「内なる独白」を与え、そのパフォーマンスを大幅に向上させた
—科学者によると、AIモデルは限られた人間の入力で互いに会話し、スキルを伝達できる。
LGA は、トレーニング映像に基づいてアクションを実行するルートを使用して、「帽子を持ってきてください」などの自然言語プロンプトでタスクの抽象化を検出します。
研究者らは、ボストン・ダイナミクス社の犬型四足ロボット「スポット」を使って果物を拾ったり飲み物をリサイクルしたりすることで、LGA の有効性を実証した。実験では、ロボットが混沌とした環境でも効果的に世界をスキャンし、計画を立てられることが示された。
研究者たちは、LILO、Ada、LGA などの神経記号フレームワークが AI モデルに問題解決能力を与え、環境をよりうまくナビゲートできるようにすることで、「より人間に近い」AI モデルへの道を開くと考えています。
ニコラス・ファーンはウェールズ渓谷出身のフリーランスの技術・ビジネスジャーナリストです。キャリアは 10 年近くにわたり、Forbes、Financial Times、The Guardian、The Independent、The Daily Telegraph、Business Insider、HuffPost などの大手メディアのほか、Gizmodo、TechRadar、Computer Weekly、Computing、ITPro などの技術系出版物にも記事を書いています。
AIニューラルネットワークが初めて「人間の知性の重要な側面」を捉える
科学者たちは、限られた人間の入力で互いに会話し、スキルを伝達できるAIモデルを作成している。
豚の腎臓移植を受けた最初の人が死亡
Live Science は、国際的なメディア グループであり、大手デジタル パブリッシャーである Future US Inc の一員です。当社の企業サイトをご覧ください。
© Future US, Inc. 7 階、130 West 42nd Street、New York、NY 10036。