ご来場いただきありがとうございます。月曜日から金曜日まで、TNS の最高のコンテンツが届き、最新ニュースやゲームでのトップの座を維持できます。

受信トレイで確認メールを確認し、設定を調整したり、追加のグループに参加したりすることができます。

お気に入りのソーシャル メディア ネットワークで TNS をフォローしてください。

LinkedIn で TNS のフォロワーになりましょう。

最初の TNS ニュースレターを待つ間に、最新の特集記事やトレンド記事をチェックしてください。

ガートナーによれば、熟練したITスタッフの募集は世界規模で行われており、一部の組織ではITスタッフのほぼ4分の1が「ボーダーレス」、つまり海外で調達・拠点を置いていると定義されています。
しかし、このように広範囲に網を張ると、必要な人材を見つけること、そして何よりも、彼らを迅速かつ確実に、そして安全に採用することが難しくなります。
これは、さまざまなスキルと期待を持つ人材を見つけて分析し、多数の要件に従いながら、限られた数の求人とマッチングさせるという、機械知能向けに作られた仕事です。
どちらの人にも、役立ちそうな共通の構文に近づくものは何もありません。それに、言語やタイムゾーンなどの課題も加わります。
これは膨大なデータ分析作業ですが、私たちは大規模言語モデル (LLM) を使用せずに、AI 駆動型の雇用および募集プラットフォーム Andela Talent Cloud (ATC) を構築しました。実際、私たちはパイプラインから ChatGPT を取り除き、構造化データに基づくシステムを構築しました。私たちのエンジニアは、採用プロセスのニュアンスに特化した分類法を開発しました。
当社の Talent Decision Engine (TDE) は、スキルや経験から場所や言語能力に至るまで、何千ものデータ ポイントを分析し、AI とデータ駆動型のマッチング アルゴリズムを使用して人材とポジションを組み合わせます。このエンジンには、迅速に応答する可能性が最も高い人材を優先する Talent Response Service、役割に対する全体的な適合性に基づいて人材をマッチングしてランク付けする推奨エンジン、入札合戦を回避しながら可能な限り多くのマッチングを成功させるように最適化する AutoMatch など、多数の関連サービスが組み込まれています。
TDE は高品質のマッチングを提供しますが、これは ChatGPT では提供できませんでした。まず、LLM は表形式のデータを適切に処理できず、そのようなデータ表現から意味のある洞察を引き出すのに苦労する場合があります。また、ChatGPT には適切な数値処理機能がありません。LLM は主にテキスト データを処理するため、人材のタイム ゾーンと労働時間が、それぞれ異なるタイム ゾーンと固有の最小労働時間を持つ複数の職務要件とどの程度一致するかなど、数値を含む構造化データ間の関係を推測できない場合があります。
さらに、LLM は、意思決定に不可欠な説明可能性の課題に直面しています。テキスト出力を生成できる一方で、構造化データに対する予測の背後にある理由を理解することは困難であり、たとえば SHAP (Shapley Additive exPlanations 値) を使用して予測を簡単に説明できる XGBoost などの表形式データに重点を置いた手法と比較すると、大きな欠点となります。
4 つ目の欠点は、LLM には通常、コンテキスト ウィンドウが限られていることです。つまり、テキストを生成するときに、前のトークンの固定数しか考慮できません。この制限により、構造化データに存在する長距離の依存関係や複雑な関係をキャプチャすることが困難になります。
これらは、私たちが直面した表形式の問題に LLM を使用しないことにした理由のほんの 4 つにすぎません。基本的に、グラフ ニューラル ネットワークや、決定木やサポート ベクター マシンなどの従来の機械学習アルゴリズムなど、構造化データ処理用に明示的に設計された特殊なモデルと比較して、そのようなシナリオでは LLM ほど効果的または効率的に機能しません。
その結果、私たちはこの問題を回避するために構造化された分類法を尊重する表形式のデータに基づくモデルを作成しました。私たちの AI 主導のアプローチは、私たちのビジネス領域に固有の特異な要素をモデル化します。たとえば、スキルをその必要性 (重要、必須、オプション) に基づいて分類し、自動マッチング プロセスを微調整します。次に、人材のスキルと仕事の要件との一致を分析します。
次に、時間的制約やタイムゾーンの適合性、過去の経験、候補者の希望する役割などを考慮し、他の職務の前提条件と当社の人材プールの特性との整合性を綿密に評価します。さらに、当社の方法論には、トレーニング パイプラインの維持に不可欠なデータベースのキュレーションと注釈付けに不可欠な堅牢なプロトコルが組み込まれています。このような綿密な手順は、特にデータ不足が特徴の職種に直面する場合に非常に重要です。
もう 1 つの課題は品質でした。ATC のアルゴリズムが最適な候補者を見つけられるようにするにはどうすればよいのでしょうか。私たちは採用担当者や人材マッチング担当者と協力して、どのような品質を求めるべきかを検討しました。これにより、10,000 人を超える個人と約 800 のスキルに関する情報を使用して、マッチ フィットネス スコアと呼ばれるスコアを開発することができました。このスコアは、タイム ゾーン、経験年数、スキル、給与など 50 の属性に基づいています。
信頼できるマッチ フィットネス スコアを構築するには、人々のプロフィールの穴、つまり重要なデータの欠如を克服する必要もありました。たとえば、希望する収入額を指定しない人もいますが、これは人材のマッチングと顧客の予算期待を満たす料金設定の両方において重要です。この特定のケースでは、類似したスキルを持つ人を特定することで、そのスキルに基づいて人が求める金額のおおよその金額を生成する人材料金推奨サービスを開発しました。
ATC のさまざまなコンポーネントの構築と改良には、次元削減、単語埋め込み、ワンホットエンコーディング、データ標準化など、さまざまな手法の使用が必要でした。多くの場合、1 つの特定の問題を解決するために複数の手法を使用し、結果を比較して最も効果的なアプローチを選択します。
私たちは、テクノロジーの問題を解決する際に活用できる、機械学習の有用なテクニックや手法がたくさんあることを発見しました。本当の課題は、プロジェクト参加者が採用に関わる業務とプロセスを完全に把握し、明確に表現できるようにすることでした。非常に多くのニュアンスがあるため、ほんの小さな詳細を間違えただけでも、検索結果に欠陥が生じる可能性があります。
顧客向けアプリケーションに Match Fitness を提供するために、当社は Extensible Recommendation Service (ERS) を開発しました。これは、さまざまな職務に対する人材の適性を評価するエンドポイントを提供するように設計された Python ベースのフレームワークです。ERS を通じて、当社の顧客向けアプリケーションは、スキルベースのマッチ適性、人材の応答可能性、推定人材率などの洞察を得ることができます。これにより、当社のプラットフォームは、各職務に最も適した候補者を効率的に特定し、関与し、対話を開始することができます。
次は何か? LLM は製品ロードマップに取り上げられますが、基礎となるというよりは ATC をサポートするものになると思われます。たとえば、スキルなどの分野で LLM を人材プロファイルと組み合わせて、潜在的な採用担当者に対する候補者のプレゼンテーションを改善できるかどうかを検討しています。また、LLM を使用して職務記述書を解析し、スキルを分類法にマッピングして、求人作成プロセスを簡素化しています。
LLM は注目を集めています。多くの人がスキルアップを急ぐ一方で、AI での成功はテクノロジーではなく、解決しようとしているビジネス上の問題を理解することから生まれるということを振り返ることは価値があります。私たちの経験に基づくと、他の業界がデータから洞察を生み出すには、次のことが必要です。
これらの戦略を取り入れることで、構造化データを活用して洞察を得たいと考えている業界は、特定のニーズに合わせて調整された強力なデータ駆動型ソリューションを開発し、意思決定のプロセスと結果を改善できます。

コミュニティが作成したロードマップ、記事、リソース、開発者向けのジャーニーは、あなたの進路の選択とキャリアの成長に役立ちます。

元記事: https://thenewstack.io/how-andela-built-its-ai-based-platform-without-an-llm/