Cosine Genieは、ソフトウェアエンジニアリングのための先進的なAIモデルとして、SWE-Benchという包括的なベンチマークで世界最高スコアを達成しました。SWE-Benchは、大規模言語モデルのコーディング能力を様々なソフトウェアエンジニアリングタスクにわたって評価するために設計されています。Cosine Genieは、30.08%というスコアで首位を走り、その次にFactory Code Droidが19.27%、AutoCodeRoverが18.83%と続いています。
この驚異的な成果は、Cosine Genieが人間の推論を直接そのトレーニングデータに組み込むことによって得られた、比類のないソフトウェア直感によるものです。OpenAIの実験的アクセスプログラムによって駆動されるCosine Genieは、データ駆動の自律性を実現し、ソフトウェア開発の新たな地平を切り開いています。
Cosine Genieの力をあなたのプロジェクトで試してみたい場合は、何を構築しているのかを教えてください。私たちは、Cosine Genieがどのように創造的に使用されるのかを見ることを楽しみにしています。