ジェネレーティブ AI (gen AI) の蜜月期は終わりました。ほとんどの組織が学んでいるように、驚異的な gen AI パイロットを構築するのは比較的簡単ですが、それを大規模な機能に変えるのは別の話です。その飛躍の難しさは、当社の最新の技術トレンド調査によると、大規模に gen AI を導入している企業がわずか 11% に過ぎない理由を大いに説明しています。1「McKinsey Technology Trends Outlook 2024」、McKinsey.com で近日公開予定。
この記事は、Aamer Baig、Douglas Merrill、Megha Sinha と Danesha Mead および Stephen Xu の共同作業であり、McKinsey Technology および QuantumBlack、AI by McKinsey の見解を代表しています。
この成熟段階は、CIO にジェネレーション AI の可能性をビジネス価値に変える機会を与えるため、歓迎すべき展開です。しかし、パイロットが現実世界のシナリオを反映していないことをほとんどの CIO が認識している一方で (結局のところ、それがパイロットの目的ではない)、ジェネレーション AI の実稼働準備に必要な作業量を過小評価しているケースが多くあります。最終的に、ジェネレーション AI から最大限の価値を引き出すには、企業が業務のやり方を再構築する必要があり、スケーラブルなテクノロジー基盤を導入することがそのプロセスの重要な部分となります。
gen AI を使用するには、主に 3 つのアプローチがあります。
ほとんどの企業は、コモディティ サービスに迅速にアクセスするための Taker と、基盤モデルの上に独自の機能を構築するための Shaper の組み合わせに頼ることになります。ただし、最も価値の高い gen AI イニシアチブは、通常 Shaper アプローチに依存しています。13 つのアプローチの詳細については、「テクノロジの世代交代と生成 AI: CIO と CTO 向けガイド」(McKinsey、2023 年 7 月 11 日) を参照してください。
以前の記事で、初期の重要なテクノロジー問題の多くについて検討しました。2「ジェネレーティブ AI によるテクノロジーの世代交代: CIO と CTO 向けガイド」、マッキンゼー、2023 年 7 月 11 日。この記事では、「シェイパー」アプローチ向けにジェネレーティブ AI をスケーリングすることに関する 7 つの真実について検討します。このアプローチでは、企業は大規模言語モデル (LLM) を社内アプリケーションやデータ ソースに接続することで競争上の優位性を獲得します (詳細については、サイドバー「ジェネレーティブ AI を使用する 3 つのアプローチ」を参照してください)。シェイパーが知っておく必要のある 7 つのことは次のとおりです。
多くのビジネスリーダーは、パイロットや実験から脱却する必要性を認識していますが、それが現場で起こっていることに必ずしも反映されているわけではありません。ジェネレーション AI の採用が増えているにもかかわらず、実際の収益への影響を示す例はほとんどありません。最新の AI 調査では、ジェネレーション AI の使用が自社の EBIT に有意な影響を与えていると回答した企業はわずか 15% でした。3つまり、組織の EBIT の 5% 以上がジェネレーション AI の使用によるものであるということです。2024 年初頭の AI の現状に関する McKinsey Global Survey は、2024 年 2 月 22 日から 3 月 5 日まで McKinsey.com で公開予定です。
この問題をさらに悪化させているのは、リーダーたちが実験から誤った教訓を引き出していることです。リーダーたちは、本質的にはチャット インターフェイスのパイロットをアプリケーションに移行しようとしますが、これは典型的な「ソリューションを探す技術者」の罠です。あるいは、パイロットは「成功」したとみなされたかもしれませんが、ビジネスの重要な部分に適用されませんでした。
スケールアップに失敗する理由は数多くありますが、最も大きな理由は、数十の進行中の AI 世代の取り組みに、リソースと経営陣の焦点が分散しすぎていることです。これは新しい展開ではありません。クラウドから高度な分析まで、他のテクノロジーが登場したときにも同様のパターンが見られました。しかし、それらのイノベーションから得た教訓は定着していません。
CIO が下す必要がある最も重要な決定は、成果の出ないパイロットを排除し、技術的に実現可能で、リスクを最小限に抑えながら重要なビジネス領域に対応できるパイロットを拡大することです (図 1)。CIO は、優先順位の設定と選択の技術的影響の処理について、ビジネス ユニットのリーダーと緊密に連携する必要があります。
多くの議論で、テクノロジーリーダーが、LLM、API など、世代 AI ソリューションの提供に必要なコンポーネント部分に関する決定について苦心しているのを耳にします。しかし、私たちが学んでいるのは、これらの個々の部分を解決するのは比較的簡単ですが、それらを統合するのは決して簡単ではないということです。これは、世代 AI の拡張に大きな障害を生み出します。
戦略から規模まで、テクノロジーの約束を実現しましょう。
課題は、さまざまなインタラクションと統合を大規模にオーケストレーションすることです。各ユースケースでは、多くの場合、複数のモデル、ベクター データベース、プロンプト ライブラリ、アプリケーションにアクセスする必要があります (図 2)。企業は、さまざまなソース (クラウド、オンプレミス、ベンダー、またはそれらの組み合わせのアプリケーションやデータベースなど)、忠実度のレベル (レイテンシと回復力を含む)、既存のプロトコル (アクセス権など) を管理する必要があります。ソリューションを提供するために新しいコンポーネントが追加されると、システム内の他のすべてのコンポーネントに波及効果が生じ、ソリューション全体の複雑さが指数関数的に増加します。
オーケストレーションは、複雑な AI ワークフローを管理するために、さまざまなデータ、変換、AI コンポーネントを調整するプロセスです。API (または LLM) ゲートウェイ レイヤーは、ユーザーまたはアプリケーションと基盤となる gen AI モデル間の安全で効率的なインターフェイスとして機能します。オーケストレーション エンジン自体は、次のコンポーネントで構成されています。
効果的なオーケストレーションの鍵は、クラウド基盤で実行されるアプリケーションのモデル、データ、およびシステム インタラクションのステップごとのフローとシーケンスの管理に、組織のドメインとワークフローの専門知識を組み込むことです。効果的なオーケストレーション エンジンのコア コンポーネントは API ゲートウェイです。API ゲートウェイは、ユーザーを認証し、コンプライアンスを確保し、リクエストとレスポンスのペアをログに記録し (たとえば、チームの使用料を請求するため)、サード パーティが提供するモデルを含む最適なモデルにリクエストをルーティングします。ゲートウェイはコスト追跡も可能にし、リスク チームとコンプライアンス チームにスケーラブルな方法で使用状況を監視できる手段を提供します。このゲートウェイ機能は、チームがベスト プラクティスに従いながら独立して操作できるようにするため、拡張性にとって非常に重要です (サイドバー「gen AI モデル オーケストレーションの主なコンポーネント」を参照)。
しかし、ジェネレーション AI 機能を提供するために必要な多くのインタラクションのオーケストレーションは、効果的なエンドツーエンドの自動化なしには不可能です。ここでのキーワードは「エンドツーエンド」です。企業はワークフローの要素を自動化することがよくありますが、その価値は、データ ラングリング (クリーニングと統合) とデータ パイプラインの構築から、モデル監視と「ポリシー アズ コード」によるリスク レビューまで、ソリューション全体を自動化することによってのみ得られます。当社の最新の調査では、ジェネレーション AI のハイ パフォーマーは、各モデルのリリース プロセスにテストと検証が組み込まれている可能性が、同業他社の 3 倍以上であることがわかりました。4ジェネレーション AI のハイ パフォーマーとは、組織の EBIT の 10% 以上がジェネレーション AI の使用によるものであると定義しています。2024 年初頭の AI の現状に関する McKinsey Global Survey、2024 年 2 月 22 日から 3 月 5 日まで、McKinsey.com で近日公開予定。最新の MLOps プラットフォームは、この自動化されたフローを管理する上で非常に重要であり、マッキンゼーの分析によると、生産を 10 倍加速できるだけでなく、クラウド リソースをより効率的に使用できるようになります。
Gen AI モデルは、その確率的な性質や基盤となるモデルの頻繁な変更により、一貫性のない結果を生成する可能性があります。モデル バージョンは毎週のように更新される可能性があるため、企業はオーケストレーション機能をセットアップしてバックグラウンドで実行させる余裕はありません。迅速かつ安全に Gen AI を実装するには、非常に注意深い監視およびトリアージ機能を開発する必要があります。可観測性ツールは、Gen AI アプリケーションとユーザーのやり取りをリアルタイムで監視し、応答時間、精度、ユーザー満足度スコアなどの指標を追跡します。アプリケーションが不正確または不適切な応答を生成し始めると、ツールは開発チームに警告を発し、モデル パラメーター、プロンプト テンプレート、またはオーケストレーション フローを調査して必要な調整を行うように指示します。
ジェネレーティブ AI のデータ使用量とモデルの相互作用の規模が膨大であるため、コストがすぐに制御不能になる可能性があります。これらのコストを管理することは、CIO が大規模なジェネレーティブ AI プログラムを管理できるかどうかに大きな影響を与えます。ただし、コストの要因を理解することは、ジェネレーティブ AI プログラムにとって非常に重要です。たとえば、モデル自体は、一般的なプロジェクト作業の約 15% を占めるだけです。5「製薬業界におけるジェネレーティブ AI: 誇大広告から現実へ」、マッキンゼー、2024 年 1 月 9 日。LLM コストは時間の経過とともに大幅に低下し、引き続き低下しています。
CIO は次の 4 つの現実に注力する必要があります。
変更管理は最大のコストです。私たちの経験から、ジェネレーション AI のコスト管理に関する目安は、モデルの開発に 1 ドルを費やすごとに、変更管理に約 3 ドルを費やす必要があるということです。(比較すると、デジタル ソリューションの場合、この比率は開発に 1 ドル、変更管理に 1 ドルに近づく傾向があります。6Eric Lamarre、Kate Smaje、Rodney Zemmel、「Rewired to outcompete」、McKinsey、2023 年 6 月 20 日) 人材のトレーニングからロール モデリング、積極的なパフォーマンス追跡まで、さまざまな変更アクションを管理する規律は、ジェネレーション AI にとって非常に重要です。私たちの分析によると、高業績企業は、ジェネレーション AI の価値を測定および追跡するための主要業績評価指標 (KPI) などの強力なパフォーマンス管理インフラストラクチャを備えている可能性が他の企業よりも約 3 倍高いことがわかりました。また、職場で次世代 AI を使用することの潜在的な価値とリスクを理解できるほど十分に非技術者をトレーニングしている可能性も 2 倍高くなります。7 2024 年初頭の AI の現状に関する McKinsey Global Survey、2024 年 2 月 22 日から 3 月 5 日まで、McKinsey.com で公開予定。
企業は、2 つの領域に重点を置くことで、変更管理のコストに対処することに特に成功しています。1 つ目は、エンド ユーザーを初日からソリューション開発に参加させること (多くの場合、企業はデフォルトで、ジェネレーション AI アプリケーション用のチャット インターフェイスを作成するだけに留まります)、2 つ目は、モデルが正しく迅速に学習できるように、最も優秀な従業員をモデルのトレーニングに参加させることです。
多くのチームが依然として独自のユースケースを推進しており、独自の環境をセットアップしていることが多く、その結果、企業は複数のインフラストラクチャ、LLM、ツール、スケーリングのアプローチをサポートする必要があります。実際、最近のマッキンゼーの調査では、回答者は、大規模な生成 AI を実装する際の最大の技術的障害として「プラットフォームが多すぎる」ことを挙げています。8 マッキンゼーの運用における生成 AI に関する調査、2023 年 11 月。インフラストラクチャとツールが増えるほど、運用の複雑さとコストが高まり、大規模な展開が不可能になります。この状況は、クラウドとサービスとしてのソフトウェア (SaaS) の初期の頃に似ています。当時は、テクノロジへのアクセスが非常に簡単で (多くの場合、クレジットカードだけで済みました)、ツールが急増する「無法地帯」が混乱とリスクを生み出していました。
企業が規模を拡大するには、管理しやすいツールとインフラストラクチャのセットが必要です。それはそれで結構ですが、どのプロバイダー、ホスト、ツール、モデルを選択すればよいのか、どうすればわかるのでしょうか。重要なのは、あまり重要でない決定 (たとえば、LLM の選択は、コモディティ化が進むにつれて重要性が薄れています) や、そもそも選択肢があまりない場合 (たとえば、主要なクラウド サービス プロバイダー (CSP) にほとんどのデータが保存されており、人材が CSP との連携方法を知っている場合、その CSP の gen AI サービスを選択する必要があります) について、延々と分析を行って時間を無駄にしないことです。実際、大手 CSP は、企業が一部のユース ケースの経済性を改善し、新しいユース ケースへのアクセスを開放するのに役立つ、新世代の AI サービスを展開しています。企業がこれらのサービスをどれだけ活用できるかは、自社のクラウド成熟度やクラウド基盤の強さなど、多くの変数に依存します。
詳細な検討が必要なのは、プロバイダーやモデルを比較的簡単に切り替えられる柔軟性を備えたインフラストラクチャとアプリケーションを構築する方法です。プロバイダーが広く使用している標準 (KFServing、gen AI モデルをデプロイするためのサーバーレス ソリューションなど)、コードとしてのインフラストラクチャ用の Terraform、オープンソース LLM の採用を検討してください。
柔軟性のために過剰にエンジニアリングすると、最終的には収益が減少することにつながることを強調しておく価値があります。ソリューションが多すぎると、維持コストが高くなり、プロバイダーが提供するサービスを最大限に活用することが難しくなります。
企業が直面している最大の問題の 1 つは、ジェネレーション AI を依然として広範なビジネス優先事項としてではなく、テクノロジー プログラムとして扱っていることです。しかし、過去のテクノロジーへの取り組みは、価値の創造が「単なるテクノロジー」の問題ではないことを示しています。ジェネレーション AI が真の効果を発揮するには、企業は IT 機能を超えてビジネスに組み込むことができるチームを構築する必要があります。過去の教訓はここでも当てはまります。たとえば、アジャイル プラクティスは技術開発を加速させました。しかし、より大きな効果は、リスクやビジネスの専門家など、組織の他の部分が製品管理やリーダーシップとともにチームに統合されて初めて得られました。
この広範な組織統合を確実に行うためのアーキタイプは複数あります。一部の企業は、ユースケースの優先順位付け、リソースの割り当て、パフォーマンスの監視を行う情報センターとして機能するセンター オブ エクセレンスを構築しています。他の企業は、戦略的な職務と戦術的な職務をチーム間で分割しています。特定のビジネスにとってどのアーキタイプが適切であるかは、利用可能な人材と現地の実情によって異なります。しかし、重要なのは、この集中化された機能によって、テクノロジー、ビジネス、リスクのリーダー間の緊密なコラボレーションが可能になり、プログラムを成功に導くための実証済みのプロトコルに従う規律が確立されていることです。たとえば、特定の目標と主要な結果 (OKR) に対するイニシアチブを追跡するための四半期ごとのビジネス レビューや、問題の解決、リソースの再割り当て、パフォーマンスの低いイニシアチブの停止のための介入などが含まれます。
この統治構造の重要な役割は、効果的なリスク プロトコルが実装され、遵守されるようにすることです。たとえば、ビルド チームは、各ユース ケースに関連する潜在的なリスクをマッピングする必要があります。また、技術プロトコルと「人間が関与する」プロトコルをユース ケースのライフ サイクル全体にわたって実装する必要があります。この監督機関には、リスクを評価し、リスクを軽減する戦略を実装することで、ジェネレーション AI リスクを管理する権限も必要です。
警戒すべき問題の 1 つは、特に大量の場合の戦術的なユース ケースのフローを管理することです。この中央組織には、大規模な影響を確保し、大きなアイデアを推進するために、関連するユース ケースをクラスター化する権限が必要です。このチームは、作業の管理者としてだけでなく、価値の守護者として行動する必要があります。
ある金融サービス企業は、上級管理職向けに明確に定義されたガバナンス プロトコルを導入しました。CIO と最高戦略責任者が後援する運営グループは、企業のガバナンス、戦略、コミュニケーションに重点を置き、ユースケースの特定と承認を推進しました。CTO が後援する有効化グループは、データ アーキテクチャ、データ サイエンス、データ エンジニアリング、およびコア有効化機能の構築に関する決定に重点を置きました。また、CTO は、ユースケース チームが確立された標準とツール セットを確実に使用できるように、プロセスの早い段階で経験豊富なアーキテクトを少なくとも 1 人ユースケース チームに加入させることを義務付けました。この監視とガバナンスの明確化は、パイプラインで管理するユースケースの数を 5 件から 50 件以上に増やすうえで、ビジネスにとって非常に重要でした。
マッキンゼーの AI 部門である QuantumBlack は、テクノロジー、専門知識、業界の専門家の力を活用して企業の変革を支援します。QuantumBlack (データ エンジニア、データ サイエンティスト、製品マネージャー、設計者、ソフトウェア エンジニア) とマッキンゼー (業界およびドメインの専門家) の何千人もの実務者とともに、私たちは世界で最も重要な AI の課題の解決に取り組んでいます。QuantumBlack Labs は、世界中の拠点を通じて AI の最先端の進歩と開発を推進してきた当社の技術開発とクライアント イノベーションの中心です。
ジェネレーション AI は必要なデータを簡単に収集して理解できるという誤解が、いまだに広く信じられています。しかし、クリーンで正確なデータがなければ、高性能なジェネレーション AI ソリューションは実現不可能であり、そのためには実際の作業と集中力が必要です。良質なデータを生成するためにデータ基盤に投資する企業は、その取り組みを慎重に行っています。
ラベル付けのプロセスは、すべてのデータに対して完璧さを求めることと、まったく無視することの間で揺れ動くことがよくあります。私たちは、特に検索拡張生成 (RAG) に使用されるデータに対して、ターゲットを絞ったラベル付けに投資すると、生成 AI クエリに対する回答の品質に大きな影響を与える可能性があることを発見しました。同様に、コンテンツ ソースの重要性を評価する (「権威の重み付け」) ために時間を投資することも重要です。これは、モデルがさまざまなソースの相対的な価値を理解するのに役立ちます。これを正しく行うには、関連する専門知識を持つ人々による多大な人的監視が必要です。
ジェネレーション AI モデルは非常に不安定であるため、新しいデータが追加されるたびに企業はプラットフォームをメンテナンスする必要があります。これは頻繁に発生し、モデルのパフォーマンスに影響を与える可能性があります。関連データがさまざまな場所に存在するため、ほとんどの企業ではこれが非常に困難になっています。データ製品の作成に投資した企業は、時間の経過とともにモデルのトレーニングに使用できる整理されたデータ ソースを持っているため、競争で優位に立っています。
たとえば、ある材料科学製品会社では、さまざまなチームが製品情報にアクセスしていましたが、それぞれバージョンが異なっていました。研究開発部門には材料安全シートがあり、アプリケーションエンジニアリングチーム(技術営業/サポートチーム)は、独自のバージョンを開発して、ユニークなクライアントの問い合わせに対するソリューションを見つけ、商品化チームには製品の説明があり、カスタマーサポートチームには問い合わせに回答するための一連の具体的な製品詳細がありました。各チームが製品情報のバージョンを更新すると、競合が発生し、gen AI モデルがデータを使用することが困難になりました。この問題に対処するため、同社は関連するすべての製品情報を 1 か所にまとめています。
再利用可能なコードにより、ジェネレーティブ AI ユースケースの開発速度が 30 ~ 50 パーセント向上します。9Eric Lamarre、Alex Singla、Alexander Sukharevsky、および Rodney Zemmel、「ジェネレーティブ AI リセット: 2024 年に潜在能力を価値に変える再構築」、McKinsey、2024 年 3 月 4 日。しかし、意味のあるブレークスルーを急いで実現しようとするあまり、チームは個々のユースケースに集中することが多く、スケールアップの望みが消えてしまいます。CIO は、ビジネスのエネルギーを、多くのユースケースに対応できる横断的なソリューションの構築にシフトする必要があります。実際、ジェネレーティブ AI のハイ パフォーマーは、ソリューション間での再利用を可能にするために戦略的にジェネレーティブ AI 基盤を構築している可能性が、同業他社のほぼ 3 倍であることがわかりました。10McKinsey Global Survey on the state of AI in early 2024、2024 年 2 月 22 日から 3 月 5 日まで、McKinsey.com で近日公開予定。
しかし、再利用性に注力すると、技術的には簡単に構築できるにもかかわらず、使用されない抽象的な世代の AI 機能の構築に陥りがちです。再利用可能な資産を構築するより効果的な方法は、一連のユースケース (通常は 3 ~ 5 個) を規律正しくレビューして、共通のニーズや機能を確認することです。その後、チームはこれらの共通要素を資産またはモジュールとして構築し、簡単に再利用したり、連結して新しい機能を作成したりできます。たとえば、データの前処理と取り込みには、データ チャンク化メカニズム、構造化データおよびメタデータ ローダー、およびデータ トランスフォーマーを個別のモジュールとして含めることができます。あるヨーロッパの銀行は、どの機能を幅広いケースで使用できるかを検討し、合成モジュール、翻訳モジュール、および感情分析モジュールの開発に投資しました。
CIO は、これが自然に起こることを期待することはできません。プラットフォーム所有者などの役割と、承認されたツール、コード、フレームワークなど、製品チーム向けの再利用可能な資産を開発する権限を持つ部門横断的なチームを割り当てる必要があります (図 4)。
ジェネレーション AI が生み出す価値は変革的です。しかし、その価値を最大限に引き出すには、企業がジェネレーション AI を大規模に活用する必要があります。そのためには、CIO が厳しい現実を認めるだけでなく、それに基づいて行動し、ビジネスを前進させる準備が必要です。
Aamer Baig 氏はマッキンゼーのシカゴ オフィスのシニア パートナー、Douglas Merrill 氏は南カリフォルニア オフィスのパートナー、Megha Sinha 氏はベイエリア オフィスのパートナー、Danesha Mead 氏はデンバー オフィスのコンサルタント、Stephen Xu 氏はトロント オフィスの製品管理ディレクターです。
著者は、この記事に貢献してくれた Mani Gopalakrishnan、Mark Gu、Ankur Jain、Rahil Jogani、Asin Tavakoli に感謝の意を表します。

元記事: https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/moving-past-gen-ais-honeymoon-phase-seven-hard-truths-for-cios-to-get-from-pilot-to-scale