要約:
- UK発のAIスタートアップCosineはSOMAとUphonestから250万ドル調達し、LakestarやFocalなどの資金も含まれたラウンドで成功を収め、人工開発者Genieと呼ばれるAI支援ソフトウェアの開発でブレークスルーを達成。
- CosineのGenieは、非常に優れた人間の開発者のように機能し、バグの解決、機能の構築、コードのリファクタリングなどを完全自律的にまたは他の開発者と協力して行うことができる。
- 2022年に設立されたCosineは、LLMsを使用してコーディング空間で複雑なタスクを実行する可能性に気付いた創業者たちによってソフトウェアが作成され、そのアプローチは現実的に「人間らしい」。主な目標は、さまざまな分野で開かれた問題に対処できる本当に強靭なAIを作成すること。
- 同社はSWE-Benchで30%のスコアを達成し、これはAIモデルのソフトウェアエンジニアリングスキルを評価する業界標準であり、これまでで最も高いスコアを記録。
- Cosineのアプローチは人間の推論をエミュレートするモデルを微調整することで、AWSのAmazon Q DeveloperやCognitionのDevinなどの競合他社を打ち負かしている。
考察:
人間の推論をコード化するCosineのブレークスルーは、AIモデルを狭い範囲のタスクや制限されたプロンプトから遠く離れた領域で操作できるように訓練することを可能にしています。彼らのアプローチは、開発ソフトウェアを行うチームが現在利用できるものよりも遥かに少ない時間と費用で、複雑なソフトウェアタスクを完了する能力を持つ製品を開発しました。