要約:

  • 新規のGoogle Cloudユーザーが、Vertex AIのtextembedding-geckoモデルにアクセスしようとした際に、リソースが枯渇したエラーが発生した。
  • エラーメッセージには、’LLM utility requests’のクォータメトリクおよび’service ‘aiplatform.googleapis.com’のリージョンごとの1分あたりのクォータリミットを超えたと記載されていた。
  • クォータ値を改善する方法についての情報は見つからず。

考察:

Google Cloudを利用する上でクォータの管理は重要であり、特に新規ユーザーが遭遇する問題の一つだ。エラーメッセージに示されたクォータの制限を理解し、必要なクォータの増加手続きを実施することが重要である。クォータの改善方法が不明確である場合は、Google Cloudのサポートサービスに問い合わせることが重要である。

元記事: https://www.googlecloudcommunity.com/gc/AI-ML/Quota-exceeded-for-quota-metric-LLM-utility-requests-and-limit/m-p/758045