AI は人間と同等の能力を持っているのでしょうか? 人工知能はここまで進歩しました。
2021年初頭、インターネットは「アボカドアームチェア」の写真に釘付けになった。
OpenAI の DALL-E 人工知能システムによって生成された画像は、ユーザーが「アボカド アームチェア」と入力するという最も簡単なプロンプトの後に画面に表示されました。結果は非現実的で、衝撃的なほどリアルで、AI にとっての転換点となりました。珍しい要求にもかかわらず、DALL-E は問題なく要求に合う画像を作り出しました。
3年経った今も、AIは進化を続けています。Verbitは学術研究のデータを活用して、AIがどれだけ進歩しているかを調べました。
今日の AI は、写真や人間が作成した絵と区別がほとんど不可能な画像を作成できるため、当然の懸念が生じている。アーティストたちは経済的な将来を心配しており、一方で、実在の人物を人工的に作成した画像や動画の急増により、議員たちは合意のない「ディープフェイク」に対抗するための法案を起草し始めている。
画像生成は、AI の使用が爆発的に増加している分野の 1 つにすぎません。コンピューターは、テキスト生成やコーディングから音楽の作成まで、他の分野でも大きな進歩を遂げています。AI が特に優れているのは、そのスピードです。曲を書いたり、アートワークを制作したり、電子メールを書いたりするとき、人間は AI の処理速度に太刀打ちできません。他の分野では、AI はまだ不十分です。共感、人間の感情の深さ、自己認識、創造性など、AI が追いつかないと多くの人が願う分野はどれも同じです。
AI システムの発展を追跡する方法の 1 つは、時間の経過とともにその技術がベンチマーク テストでどの程度優れたパフォーマンスを発揮したかを確認することです。Contextual AI の研究者は、さまざまなタスク グループにおける複数の AI システムのパフォーマンスを追跡しました。データを見ると、近年の能力の著しい向上がわかります。
AIシステムは、画像や音声の認識、さらには読解といったタスクにおいて人間を上回るようになっている。また、推論やコンピュータープログラミングといった分野では、機械が依然として人間に遅れをとっていることも、数字から明らかになっている。
AI のパフォーマンスを測る別の方法は、学術試験でどれだけ良い成績を収めるかを見ることです。ミネソタ大学ロースクールの研究者が行ったある実験では、研究者が ChatGPT (当時は GPT-3.5 システムを使用) に多肢選択問題とエッセイ問題を与え、実際の学生の試験と合わせて回答を盲検で採点しました。研究者は、AI がクラスを合格するのに十分な C+ のスコアを獲得したことを発見しました。
別の研究者グループは、ChatGPT が司法試験でどのような成績を収めるかを調査しました。GPT-3.5 は不合格となり、スコアは 10 パーセンタイルにとどまりました。一方、より新しく強力な AI モデルである GPT-4 は、試験ではるかに良い成績を収め、90 パーセンタイルのスコアを獲得しました。
これらのベンチマークで AI と同等の成績を収める人は天才のように見えるでしょう。しかし、これらすべての指標で優れた成績を収めているにもかかわらず、現代の AI システムは、人間と比較するといくつかの重要な点でまだ劣っています。
現在の AI システムの明らかな欠点の 1 つは、いわゆる「幻覚問題」です。これは、システムが…
画像生成は、AI の使用が急増している分野の 1 つにすぎません。Verbit は、学術研究のデータを使用して、AI がどのように進歩しているかを調べました。