• VertexAiEmbeddingModel(モデル:textembedding-gecko)にアクセスしようとしているが、以下のエラーが発生している
  • エラーメッセージによると、データセットの連続したターンに問題があり、73行目に関連したJSONLファイルのフォーマットの問題がある可能性がある
  • Vertex AIの埋め込みモデルの使用量がGoogle Cloudプロジェクトのリクエストごとの割り当てクォータを超えていることを示している
  • 問題に対処するための手順:
    • Google Cloudコンソールに移動し、「IAM&管理」セクションにアクセス
    • 「Quotas」を選択し、「aiplatform.googleapis.com」に関連するクォータを確認
    • クォータの増加をリクエストする場合、Quotasページで超過しているクォータを選択し、「EDIT QUOTAS」をクリック
    • リクエストが承認されるまでに時間がかかる可能性があるので注意
    • リクエストが頻繁にクォータを超える場合、リクエストをバッチ処理してAPIコールの回数を減らす
    • 再試行ロジックを指数バックオフとともに実装して、一時的なクォータ超過をスムーズに処理
    • 複数のリージョンでアプリケーションを実行できる場合は、リクエストを分散して負荷を分散し、単一リージョンのクォータ制限に達する可能性を減らすことが考えられる
    • 使用状況を定期的にモニタし、クォータ超過のパターンを特定
    • Javaを使用して指数バックオフを実装する例が提供されている

上記の手順に従うことで、Google CloudのVertex AIで遭遇しているクォータ超過エラーを緩和し、管理することができます。

元記事: https://www.googlecloudcommunity.com/gc/AI-ML/Quota-exceeded-for-quota-metric-LLM-utility-requests-and-limit/m-p/758932