• 技術サイクルを駆動するのは基本的な商品の急速なコスト低下である
  • Mooreの法則やDennardスケーリングなどは、チップの性能向上を説明する
  • Edholmの法則はネットワーク帯域の増加を説明する
  • 公開されたGPT-3以降のデータ分析から、LLMの推論コストが急速に低下していることがわかる
  • LLMflationと呼ばれるこのトレンドは、一定価格で得られるトークン数が急速に増加していることを示す

思考:LLMの推論コストが毎年10倍に低下しているというトレンドは非常に興味深いものであり、AI革命がさらなる進歩をもたらす可能性があることが示唆されています。特に新たな価格設定ポイントから開かれる新しいユースケースは、今後も重要な進展をもたらすでしょう。

元記事: https://a16z.com/llmflation-llm-inference-cost/