- GoogleのGemini 1.5 ProはオリジナルのGPT-4を凌駕する最古のAIモデルで、1度に100万トークンを処理できる
- Gemini 1.5 Proはコンテキストウィンドウを200万トークンに拡張し、AIモデルが解決できる問題の範囲を大幅に拡大
- Anthropicの「Claude 3.5」はGPT-4を凌駕し、画像とテキストを同時に処理できる日本語対応のマルチモーダルAIモデル
- 多くの主要AI企業がマルチモーダルモデルをリリースし、LLMの改善が遅れていると不満を述べている人々がいる
- Appleの機械学習フレームワーク「MLX」は優れているが、新しい個人AI「Apple Intelligence」は失望を招いている
- 中国のDeepSeek社が6710億のパラメータサイズを持つAIモデル「DeepSeek-V3」をリリースし、訓練コストが驚くほど低い
自然言語処理の分野では、AIモデルの性能向上と価格低下が進んでおり、マルチモーダルモデルの登場や効率の向上が注目されています。AppleのMLXライブラリの優れた性能とApple Intelligenceの不満足な性能、さらに中国のDeepSeek社が低コストで高性能なAIモデルを訓練するなど、AI技術の進歩が続いています。
元記事: https://gigazine.net/gsc_news/en/20250106-ai-2024/