Cosine Genie representa o estado da arte em modelos de engenharia de software com inteligência artificial, alcançando a pontuação mais alta do mundo no SWE-Bench. Este benchmark abrangente foi projetado para avaliar as habilidades de codificação de grandes modelos de linguagem em uma variedade de tarefas de engenharia de software. Com uma pontuação impressionante de 30.08%, Cosine Genie supera outros modelos notáveis, como Factory Code Droid (19.27%) e AutoCodeRover (18.83%).
A intuição de software sem paralelo do Genie é derivada da incorporação direta do raciocínio humano em seus dados de treinamento, uma abordagem que faz parte do Programa de Acesso Experimental da OpenAI. Essa metodologia permite ao Genie oferecer soluções de software que não apenas atendem, mas excedem as expectativas em termos de eficiência e inovação.
Para aqueles interessados em explorar as capacidades do Genie em seus próprios projetos, a equipe por trás do Cosine Genie está ansiosa para ver as maneiras criativas como a tecnologia será utilizada. Eles encorajam os desenvolvedores a compartilhar o que estão construindo para obter acesso ao poder do Genie.
Além disso, um relatório técnico detalhado está disponível para quem deseja mergulhar mais fundo nas descobertas e análises que posicionam o Cosine Genie como o modelo de engenharia de software com a pontuação mais alta. Este relatório é um recurso valioso para entender as capacidades e o potencial do Genie no cenário atual de desenvolvimento de software.