当サイトのリンクから購入された場合、アフィリエイト手数料が発生する場合があります。仕組みは次のとおりです。
マイクロソフトは、OpenAIとの契約にもかかわらず、最大規模のものに匹敵する新しい社内開発の大規模言語モデルであるMAI-1に取り組んでいる。
Microsoft は、Google Gemini や GPT-4 など、現在利用可能な最大の構築済みモデルに匹敵するほどの規模を持つ可能性がある新しい大規模言語モデル (LLM) MAI-1 に取り組んでいることを確認しました。
The Information の報道によると、新しい 5000 億パラメータ モデルは MAI-1 と呼ばれ、Microsoft AI の CEO である Mustafa Suleyman 氏が監督しているとのこと。
マイクロソフトの消費者向けAI開発部門の責任者として最近採用されたスレイマン氏は、AI企業インフレクションの共同設立者であり、英国のAIの先駆者であるディープマインドの設立者の一人でもある。
この動きは、これまでグーグルやAWSなどの主要な競合企業との生成AI競争で攻勢をかけるためにOpenAIが開発したモデルに大きく依存してきたマイクロソフトにとって、大きな変化となる。
MAI-1 が 5000 億のパラメータで構築されている場合、それは現在知られている中で最大のモデルの 1 つになります。
たとえば、OpenAI の ChatGPT-4 には約 1 兆個のパラメータがあると考えられており、Elon Musk の xAI の Grok には 3,140 億個のパラメータがあります。
Google や Anthropic などの他の大手 AI 企業は、LLM のパラメータの数を秘密にしています。
最新ニュース、業界の最新情報、注目のリソースなどを受け取ってください。2024 年に向けて新たに更新された AI サイバー犯罪とセキュリティに関する無料レポートを受け取るには、今すぐサインアップしてください。
マイクロソフトがなぜ新たな LLM を構築する必要があるのかは完全には明らかではない。なぜなら同社はすでに OpenAI に 100 億ドルという巨額の投資を行っており、同社の ChatGPT モデルはこれまで生成 AI 分野を支配してきたからだ。
マイクロソフトの最高技術責任者ケビン・スコット氏は、LinkedIn への投稿でこの件を軽視しようとしたが、同社には MAI と呼ばれるモデルがあることも認めたようだ。
「簡単にまとめると、私たちはAIモデルを訓練するために大型スーパーコンピューターを構築し、パートナーのOpen AIはこれらのスーパーコンピューターを使用して最先端のモデルを訓練し、そして私たちはこれらのモデルを製品やサービスで利用できるようにして、多くの人がその恩恵を受けられるようにするのです。私たちはこの取り決めをかなり気に入っています」と彼は語った。
スコット氏は、OpenAI向けに構築された各スーパーコンピューターは以前のものよりもはるかに大きく、それらがトレーニングする各最先端モデルは以前のものよりもはるかに強力であると述べた。
「私たちは今後もこの道を歩み続けます。オープン AI 向けのますます強力なスーパーコンピューターを構築し、この分野全体のペースを決めるモデルをトレーニングしていきます。私たちの共同作業がもたらす影響は今後も拡大し続けるでしょう」と同氏は語った。
スコット氏は、マイクロソフトも「何年も何年も」独自の AI モデルを構築しており、AI モデルはマイクロソフトのほぼすべての製品、サービス、運用プロセスで使用されていると述べた。
「ものを作って運用するチームは、モデルをゼロからトレーニングするにしても、他の誰かが構築したモデルを微調整するにしても、独自のカスタム作業を行う必要があります。今後もこうした作業が増えるでしょう。こうしたモデルには、Turing や MAI などの名前が付けられているものもあります。たとえば Phi のように、オープンソース化しているものもあります」と彼は語った。
すべての AI モデルが膨大な数のパラメータを持つ必要はありません。Microsoft は最近、小型言語モデル Phi-3 を発表しました。同社によると、このモデルはさまざまな言語、推論、コーディング、数学のベンチマークで、同サイズおよび 1 サイズ上のモデルよりも優れた性能を発揮し、生成型 AI アプリケーションの構築を検討している顧客にとってより実用的な選択肢となる可能性があるとのことです。
膨大な数のパラメータを持つ LLM を構築することは、物語の一部に過ぎません。AI 企業は、生成 AI ツールをトレーニングするための最良のデータ ソースを確保するため、競争も繰り広げています。
今週、OpenAI は Stack Overflow との契約を発表し、同ナレッジ サイトで開発者が投稿した何百万もの質問と回答を利用して ChatGPT からの応答を強化することを発表しました。
スティーブ・レンジャーは、テクノロジーとビジネスに関する記事を執筆する、受賞歴のある記者兼編集者です。以前は、ZDNET の編集ディレクターと silicon.com の編集者を務めていました。
Red Hat CEO: AI の旅のどの段階でも私たちはあなたに会います
OpenAI と Stack Overflow の契約により、開発者データの金鉱が手に入りました。これが LLM 開発を変革する理由です。
「不正なAIと戦うには独自のボットが必要だ」とVaronisのVPが警告
IT Pro は、国際的なメディア グループであり、大手デジタル パブリッシャーである Future US Inc の一部です。当社の企業サイトをご覧ください。
© Future US, Inc. 7 階、130 West 42nd Street、New York、NY 10036。

元記事: https://www.itpro.com/technology/artificial-intelligence/microsoft-is-building-a-new-ai-model-to-rival-some-of-the-biggest

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください