当サイトのリンクから購入された場合、アフィリエイト手数料が発生する場合があります。仕組みは次のとおりです。
IBMは116のプログラミング言語で書かれたコードで訓練されたモデルをオープンソース化しており、企業の開発者の作業を大幅に楽にすることができる。
IBM は、エンタープライズ開発者をサポートするために適切な機能の組み合わせを提供するというコーディング用の生成 AI モデルのセットをオープンソース化しました。
このテクノロジー大手は、116 のプログラミング言語で書かれたコードでトレーニングされた、コード生成タスク用の一連のモデルをリリースしています。
IBM によれば、これらのモデルに基づいて構築されたツールには、開発者向けのコードを書くエージェントから、コードが機能しない理由とその修正方法を説明できるツールまで、さまざまな使用例があるという。
「ユニットテストの生成からドキュメントの作成、脆弱性テストの実行まで、開発者の日常業務の一部である他の多くの日常的だが重要なタスクは、これらのモデルによって自動化できる可能性がある」と同社は述べた。
ソフトウェア コードのトレーニングを受けた開発者向けのツールは、生成 AI の大きな成功例の 1 つです。これらのツールは、コーディングに関するアドバイスや実際のコード スニペットの提案などを提供することで、開発者の効率性を向上させることを目的としています。ガートナーによると、数年以内に開発者の 4 分の 3 がこれらのアシスタントを使用するようになるとのことです。
IBM はすでに独自の生成 AI コーディング アシスタント スイートを提供しています。これは、IT 自動化用の WCA for Ansible Lightspeed と、アプリケーション モダナイゼーション用の WCA for IBM Z を含む、watsonx Code Assistant (WCA) ファミリーです。たとえば、WCA for Z は、IBM の 200 億パラメータの Granite LLM を使用して、開発者が COBOL アプリケーションを IBM メインフレームのサービスに変換できるように支援します。
IBM は現在、IBM Granite コード モデルの 4 つのバリエーションをオープンソース化しています。
最新ニュース、業界の最新情報、注目のリソースなどを受け取ってください。2024 年に向けて新たに更新された AI サイバー犯罪とセキュリティに関する無料レポートを受け取るには、今すぐサインアップしてください。
これらのモデルは、30 億から 340 億のパラメータのサイズに及び、エンタープライズ ソフトウェア開発ワークフロー向けに最適化されています。つまり、コード生成、修正、説明などのタスクがあり、アプリケーションの最新化やメモリが限られたデバイスでの実行などのユースケースが考えられます。
同社によれば、これらの Granite コード モデルは、現在利用可能なオープン ソース LLM の中で最先端のパフォーマンスに一貫して匹敵するという。
モデルは、Hugging Face、GitHub、watsonx.ai、RHEL AI で入手できます。基盤となるベース コード モデルは、WCA のトレーニングに使用されたものと同じです。
生成 AI 市場は急速に拡大していますが、ビジネス ユーザーにとって正しい方向を見つけることは必ずしも容易ではありません。
最大規模の LLM の多くは、現在ではパラメーターの規模が数百億、数千億にまで成長しています。
幅広いテーマをカバーできるチャットボットを構築したい場合にはこれらは良いかもしれないが、これらのモデルのトレーニングと実行には計算コストがかかる、とIBMは述べた。
「企業にとって、大規模なモデルは、より具体的なタスクを実行するには扱いにくくなり、無関係な情報でいっぱいになり、推論コストが高くなります。」
さらに、これらのモデルのライセンスが不明確であることが多く、これらのモデルがどのようにトレーニングされたか、または憎悪、虐待、冒涜的な言葉などについてデータがどのようにクリーンアップされフィルタリングされたかの詳細が不明であることが多いため、多くの企業は LLM を商用目的で採用することに消極的でした。
IBM リサーチの主任科学者である Ruchir Puri 氏は、多くのエンタープライズ ユース ケースにとって、IBM がリリースした 8B Granite コード モデル バリアントは、重量、実行コスト、機能の適切な組み合わせになると述べています。
「Granite モデル上に構築された生成システムにより、開発者は COBOL などのレガシー コードベースを Java などのより現代的な言語に変換する新しい方法を作成できます。これは、IBM がコード向け AI の世界に初めて参入したときに目にしたコード モデルの主な用途の 1 つであり、今でも最も重要な用途の 1 つです」と同社は述べています。
これらの Granite コード モデルは、Apache 2.0 ライセンスの下でリリースされています。
IBMは、HumanEvalPack、HumanEvalPlus、RepoBenchなどのベンチマークテスト中に、Python、JavaScript、Java、Go、C++、Rustなど、ほとんどの主要プログラミング言語でコードの合成、修正、説明、編集、翻訳において優れたパフォーマンスが見られたと述べています。
「当社のモデルは、Code Llama など、その 2 倍の規模のモデルよりも優れたパフォーマンスを発揮できます。また、他のモデルはコード生成などの一部のタスクでわずかに優れたパフォーマンスを発揮するかもしれませんが、Granite を除いて、生成、修正、説明のすべてで高いレベルのパフォーマンスを発揮できるモデルはありません」と同社は述べています。
IBM は、コード モデルの詳細を説明した完全な技術論文も発表しました。IBM によると、特にエンタープライズ ソフトウェア開発のコンテキストにおいて、コードに関する LLM の現在の分野には重要なギャップがあるということです。
「まず、非常に大規模な汎用 LLM は優れたコーディング パフォーマンスを実現できますが、そのサイズのために導入コストが高くなります。コードに重点を置いた小規模なモデルは、より小型で柔軟なパッケージで優れたコード生成パフォーマンスを実現できますが、生成以外のコーディング タスク (修正や説明など) のパフォーマンスはコード生成パフォーマンスに遅れをとる可能性があります」と研究者らは書いています。
研究者らは、これらのモデルのパフォーマンスを向上させるためにアップデートをリリースする予定であり、近い将来にはロングコンテキストやPythonおよびJavaに特化したモデルのバリエーションをリリースする予定であると述べた。
スティーブ・レンジャーは、テクノロジーとビジネスに関する記事を執筆する、受賞歴のある記者兼編集者です。以前は、ZDNET の編集ディレクターと silicon.com の編集者を務めていました。
Java 17 の成長が「爆発的」である理由
開発者の燃え尽き症候群は「流行病」レベルに達しており、手作業による労働が主な要因となっている
ネットワーク需要の急増により、通信事業者のクラウド投資は2028年までに2,000億ドルに達する見込み
IT Pro は、国際的なメディア グループであり、大手デジタル パブリッシャーである Future US Inc の一部です。当社の企業サイトをご覧ください。
© Future US, Inc. 7 階、130 West 42nd Street、New York、NY 10036。

元記事: https://www.itpro.com/software/development/ibm-just-open-sourced-these-generative-ai-coding-models