InfoWorld シニアライター |
Microsoft は、Google の Gemini や OpenAI の GPT-4 に対抗する新しい大規模言語モデル (LLM) に取り組んでいると報じられています。
コードネーム「MAI-1」と呼ばれるこの新しいLLMは現在開発段階にあり、Google DeepMindとInflection AIの共同設立者であるムスタファ・スレイマン氏が主導していると、The Informationは2つの情報源を引用して報じた。
マイクロソフトの最高経営責任者サティア・ナデラ氏のブログ投稿によると、スレイマン氏は、同社の副操縦士の取り組みを率いるために、インフレクションAIのもう一人の共同創設者カレン・シモニャン氏とともに3月にマイクロソフトに入社した。
マイクロソフトは、Inflection AI にソフトウェアのライセンス料として 6 億 5,000 万ドルを支払っている。Suleyman 氏と Simonyan 氏、そしてマイクロソフトに加わる他の Inflection AI スタッフも、同じ契約の一部である。
インフォメーションが引用した情報筋は、5000億パラメータのLLM構築の目的を明らかにしなかったが、新しいLLMは今月下旬に同社のBuildカンファレンスで発表される可能性があると述べた。
伝えられるところによると、同社はインターネットからのデータやGPT-4から生成されたデータの使用を含め、モデルのトレーニングに膨大な量のコンピューティングリソースを投入しているという。
状況を理解するために、OpenAI の GPT-4 には 1 兆 7,600 億のパラメータがあると報告されており、同社はこれをトレーニングするために 1 億ドルを超える計算リソースを費やしました。
マイクロソフトは巨大モデルの開発に取り組んでいるかもしれないが、先月同社は、軽量でありながら高性能な生成AIテクノロジーをモバイルデバイスを含むより多くのプラットフォームで利用できるようにするための計画の一環として、新しい小型言語モデル(SLM)ファミリーであるPhi-3ファミリーをリリースした。
Phi-3 ファミリーは、38 億パラメータの Phi-3 Mini、70 億パラメータの Phi-3 Small、および 140 億パラメータの Phi-3 Medium の 3 つのモデルで構成されています。
ここ数か月、Snowflake、Databricks、Cohere、Mistral、Anthropic、Meta、Google、AWS など、複数のベンダーから LLM が次々と発表されています。
Snowflake が Arctic LLM をリリースした一方で、Databricks は DBRX モデルをリリースしました。それとは別に、Meta は Llama 3 モデルをリリースしました。そのわずか数日後には、Cohere が Command モデル ファミリの反復をリリースしました。
Anirban Ghoshal 氏は、CIO.com のエンタープライズ ソフトウェアと InfoWorld のデータベース、クラウド、AI を担当するシニア ライターです。
著作権 © 2024 IDG Communications, Inc.
著作権 © 2024 IDG Communications, Inc.