IBM がこれらの生成 AI コーディングモデルをオープンソース化

当サイトのリンクから購入された場合、アフィリエイト手数料が発生する場合があります。仕組みは次のとおりです。
IBMは116のプログラミング言語で書かれたコードで訓練されたモデルをオープンソース化しており、企業の開発者の作業を大幅に楽にすることができる。
IBM は、エンタープライズ開発者をサポートするために適切な機能の組み合わせを提供するというコーディング用の生成 AI モデルのセットをオープンソース化しました。
このテクノロジー大手は、116 のプログラミング言語で書かれたコードでトレーニングされた、コード生成タスク用の一連のモデルをリリースしています。
IBM によれば、これらのモデルに基づいて構築されたツールには、開発者向けのコードを書くエージェントから、コードが機能しない理由とその修正方法を説明できるツールまで、さまざまな使用例があるという。
「ユニットテストの生成からドキュメントの作成、脆弱性テストの実行まで、開発者の日常業務の一部である他の多くの日常的だが重要なタスクは、これらのモデルによって自動化できる可能性がある」と同社は述べた。
ソフトウェアコードのトレーニングを受けた開発者向けのツールは、生成 AI の大きな成功例の 1 つです。これらのツールは、コーディングに関するアドバイスや実際のコードスニペットの提案などを提供することで、開発者の効率性を向上させることを目的としています。ガートナーによると、数年以内に開発者の 4 分の 3 がこれらのアシスタントを使用するようになるとのことです。
IBM はすでに独自の生成 AI コーディングアシスタントスイートを提供しています。これは、IT 自動化用の WCA for Ansible Lightspeed と、アプリケーションモダナイゼーション用の WCA for IBM Z を含む、watsonx Code Assistant (WCA) ファミリーです。たとえば、WCA for Z は、IBM の 200 億パラメータの Granite LLM を使用して、開発者が COBOL アプリケーションを IBM メインフレームのサービスに変換できるように支援します。
IBM は現在、IBM Granite コードモデルの 4 つのバリエーションをオープンソース化しています。
最新ニュース、業界の最新情報、注目のリソースなどを受け取ってください。2024 年に向けて新たに更新された AI サイバー犯罪とセキュリティに関する無料レポートを受け取るには、今すぐサインアップしてください。
これらのモデルは、30 億から 340 億のパラメータのサイズに及び、エンタープライズソフトウェア開発ワークフロー向けに最適化されています。つまり、コード生成、修正、説明などのタスクがあり、アプリケーションの最新化やメモリが限られたデバイスでの実行などのユースケースが考えられます。
同社によれば、これらの Granite コードモデルは、現在利用可能なオープンソース LLM の中で最先端のパフォーマンスに一貫して匹敵するという。
モデルは、Hugging Face、GitHub、watsonx.ai、RHEL AI で入手できます。基盤となるベースコードモデルは、WCA のトレーニングに使用されたものと同じです。
生成 AI 市場は急速に拡大していますが、ビジネスユーザーにとって正しい方向を見つけることは必ずしも容易ではありません。
最大規模の LLM の多くは、現在ではパラメーターの規模が数百億、数千億にまで成長しています。
幅広いテーマをカバーできるチャットボットを構築したい場合にはこれらは良いかもしれないが、これらのモデルのトレーニングと実行には計算コストがかかる、とIBMは述べた。
「企業にとって、大規模なモデルは、より具体的なタスクを実行するには扱いにくくなり、無関係な情報でいっぱいになり、推論コストが高くなります。」
さらに、これらのモデルのライセンスが不明確であることが多く、これらのモデルがどのようにトレーニングされたか、または憎悪、虐待、冒涜的な言葉などについてデータがどのようにクリーンアップされフィルタリングされたかの詳細が不明であることが多いため、多くの企業は LLM を商用目的で採用することに消極的でした。
IBM リサーチの主任科学者である Ruchir Puri 氏は、多くのエンタープライズユースケースにとって、IBM がリリースした 8B Granite コードモデルバリアントは、重量、実行コスト、機能の適切な組み合わせになると述べています。
「Granite モデル上に構築された生成システムにより、開発者は COBOL などのレガシーコードベースを Java などのより現代的な言語に変換する新しい方法を作成できます。これは、IBM がコード向け AI の世界に初めて参入したときに目にしたコードモデルの主な用途の 1 つであり、今でも最も重要な用途の 1 つです」と同社は述べています。
これらの Granite コードモデルは、Apache 2.0 ライセンスの下でリリースされています。
IBMは、HumanEvalPack、HumanEvalPlus、RepoBenchなどのベンチマークテスト中に、Python、JavaScript、Java、Go、C++、Rustなど、ほとんどの主要プログラミング言語でコードの合成、修正、説明、編集、翻訳において優れたパフォーマンスが見られたと述べています。
「当社のモデルは、Code Llama など、その 2 倍の規模のモデルよりも優れたパフォーマンスを発揮できます。また、他のモデルはコード生成などの一部のタスクでわずかに優れたパフォーマンスを発揮するかもしれませんが、Granite を除いて、生成、修正、説明のすべてで高いレベルのパフォーマンスを発揮できるモデルはありません」と同社は述べています。
IBM は、コードモデルの詳細を説明した完全な技術論文も発表しました。IBM によると、特にエンタープライズソフトウェア開発のコンテキストにおいて、コードに関する LLM の現在の分野には重要なギャップがあるということです。
「まず、非常に大規模な汎用 LLM は優れたコーディングパフォーマンスを実現できますが、そのサイズのために導入コストが高くなります。コードに重点を置いた小規模なモデルは、より小型で柔軟なパッケージで優れたコード生成パフォーマンスを実現できますが、生成以外のコーディングタスク (修正や説明など) のパフォーマンスはコード生成パフォーマンスに遅れをとる可能性があります」と研究者らは書いています。
研究者らは、これらのモデルのパフォーマンスを向上させるためにアップデートをリリースする予定であり、近い将来にはロングコンテキストやPythonおよびJavaに特化したモデルのバリエーションをリリースする予定であると述べた。
スティーブ・レンジャーは、テクノロジーとビジネスに関する記事を執筆する、受賞歴のある記者兼編集者です。以前は、ZDNET の編集ディレクターと silicon.com の編集者を務めていました。
Java 17 の成長が「爆発的」である理由
開発者の燃え尽き症候群は「流行病」レベルに達しており、手作業による労働が主な要因となっている
ネットワーク需要の急増により、通信事業者のクラウド投資は2028年までに2,000億ドルに達する見込み
IT Pro は、国際的なメディアグループであり、大手デジタルパブリッシャーである Future US Inc の一部です。当社の企業サイトをご覧ください。
© Future US, Inc. 7 階、130 West 42nd Street、New York、NY 10036。

元記事: https://www.itpro.com/software/development/ibm-just-open-sourced-these-generative-ai-coding-models

IBM がこれらの生成 AI コーディングモデルをオープンソース化 | ITPro

ByManagetech

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY