アストン大学工学部および物理科学部、アストンデジタルフューチャーズ研究所教授兼所長

アブドゥル サドカ教授は、アストン デジタル フューチャーズ インスティテュートの創設ディレクターです。同研究所は、研究とイノベーションの専門知識で国内トップクラスの中心機関であり、業界のワークフローを自動化し、顧客の体験の質を高める画期的な生成 AI ソリューションを開発しています。
アストン大学はThe Conversation UKのメンバーとして資金を提供しています。
最近、OpenAIのChatGPT AI搭載チャットボットと、FacebookやInstagram上の同社のチャットボットを動かすMetaのLlamaシステムの計画的なアップグレードについて、盛んに宣伝されている。
これらのシステムの背後にある技術は、大規模言語モデル (LLM) として知られています。これらは人工ニューラル ネットワークであり、人間の脳を模倣するように設計された AI の一種です。チャットボット用の汎用テキストを生成したり、概念の分類、データの分析、テキストの翻訳などの言語処理タスクを実行したりできます。
こうした能力は、トレーニングと呼ばれる集中的なプロセスを通じて獲得されます。トレーニングでは、AI システムが膨大な量のデータにさらされ、その機能が向上します。OpenAI と Meta は、2024 年夏の終わりまでに、それぞれ GPT-5 と Llama 3 と呼ばれるチャットボットの新しいバージョンをリリースする予定です。しかし、これらは以前のバージョンとどう異なり、どのような価値を追加するのでしょうか。
前身のGPT-4と同様に、GPT-5は画像とテキストを理解できるようになります。たとえば、ユーザーは画像の説明をGPT-5に依頼できるため、視覚障害を持つ人々にとってさらに使いやすくなります。
しかし、GPT-5 はさまざまな言語で優れた機能を備えているため、英語を母国語としない人でもシステムとコミュニケーションしたり対話したりできるようになります。これには、言語翻訳の習熟度の向上も含まれます。このアップグレードにより、会話の文脈を解釈したり、言語のニュアンスを解釈したりする能力も向上します。
GPT-5 は前バージョンと比べてより高度な推論機能を備えており、より複雑なデータセットを分析し、より高度な問題解決を実行できるようになります。この推論機能により、AI システムは新しい経験から学習して、情報に基づいた意思決定を行うことができます。
したがって、より正確な情報をユーザーに提供できるようになります。たとえば、システムの分析機能が向上したことで、ユーザーが説明した症状から考えられる病状を提案できるようになります。GPT-5 は一度に最大 50,000 語を処理できます。これは GPT-4 の 2 倍であり、大規模なドキュメントの処理にさらに適しています。
GPT-5 は、より高いレベルの感情的知能を備え、ユーザーとのより共感的なやり取りが可能になります。これは、カスタマー サービスを含むさまざまな環境で役立つ可能性があります。GPT-5 は、情報の検索と取得の精度も大幅に向上し、より信頼性の高い学習ソースになります。
これは、既存の情報リポジトリから関連情報を検索して抽出する一般的な検索エンジンの機能をはるかに超えて、新しいコンテンツを生成する機能であると言われています。
また、OpenAI が言語モデルの偏りを減らすために追加で努力しているため、GPT-5 が生成するコンテンツはより高いレベルの公平性と包括性を示すことが期待されています。
GPT-5 は、家庭内のスマート システムを含む他のデバイスやマシンと、よりインテリジェントな方法で対話できるようになります。GPT-5 は、これらの他のマシンによって生成されたデータを分析および解釈し、それをユーザーの応答に組み込むことができるはずです。また、よりカスタマイズされた回答を提供することを目的として、そこから学習することもできます。
これにより、家庭や職場でよりスマートな環境を実現できます。GPT-5 は、家庭やその他の場所でデバイスが接続され、情報を共有する、いわゆるモノのインターネットとの互換性が高まります。また、人間と機械が同じ職場内でインタラクティブに作業する、インダストリー 5.0 という概念のサポートにも役立つはずです。
GPT-5 は、より強力なセキュリティ プロトコルを備えており、悪意のある使用や誤った取り扱いに対してより強固なバージョンになります。これにより、ユーザーが潜在的なデータ セキュリティ侵害やフィッシング攻撃を認識できるようになり、電子メールのセキュリティを強化できます。
全体的に、OpenAI のアップグレードは、計算においてより汎用性が高く、エネルギー効率が高く、より適応性とパーソナライズされたサービスを提供するはずです。
Llama-3 は Meta の GPT-5 のライバルです。前身の Llama-2 と比べていくつかの改良が加えられています。前身の Llama-2 の最大 700 億個に対して、最終的には 4000 億個のパラメータを持つ、より高性能なモデルです。機械学習において、パラメータとは AI システム内の変数を表す用語であり、トレーニング プロセス中に調整することで、正確な予測を行う能力を向上させることができます。
Llama-3 はマルチモーダルでもあり、テキスト、画像、ビデオを処理および生成できます。したがって、画像を入力として取り込んで、画像の内容の詳細な説明を提供することができます。同様に、ユーザーのプロンプトやテキストの説明に一致する新しい画像を自動的に作成することもできます。
このモデルは英語以外の言語でタスクを実行でき、Llama 2 よりも大きなコンテキスト ウィンドウを備えています。コンテキスト ウィンドウは、情報が生成された時点で LLM が処理できるテキストの範囲を反映します。これは、予測を行って応答を生成するように求められた場合、モデルがより短い時間内に大量のテキストまたはデータを処理できることを意味します。
Meta は、Google Cloud を含むさまざまなアプリケーションと連携できるように、Llama-3 をいくつかの異なるバージョンでリリースする予定です。Meta は、来年の夏に予定されている最も高度なバージョンのリリースに先立ち、Llama-3 のより基本的なバージョンを近日中にリリースすると発表しました。
この新世代のチャットボットへの移行は、生成型 AI に革命をもたらすだけでなく、人間と機械の相互作用における新しい時代の幕開けとなり、世界規模で産業や社会を変革する可能性があります。これは、人々の働き方、学習方法、医療を受ける方法、世界や他者とのコミュニケーション方法に影響を与えます。企業や組織の効率と効果を高め、変化に機敏に対応し、収益性を高めることになります。

著作権 © 2010–2024、The Conversation

元記事: https://theconversation.com/what-to-expect-from-the-next-generation-of-chatbots-openais-gpt-5-and-metas-llama-3-228217