CodeT5 es un proyecto de Salesforce Research que presenta modelos para la comprensión y generación de código. Estos modelos, CodeT5 y CodeT5+, han sido introducidos en diferentes publicaciones académicas.
Los modelos CodeT5 y CodeT5+ pueden ser desplegados como un asistente de codificación impulsado por IA. En Salesforce, se ha construido un demo de asistente de codificación IA utilizando CodeT5 como un plugin de VS Code, ofreciendo tres capacidades principales.
La generación de texto a código permite generar código basado en la descripción en lenguaje natural. La autocompletación de código completa una función entera de código dado el nombre de la función objetivo. Y la resumen de código genera un resumen de una función en una descripción en lenguaje natural.
A lo largo del tiempo, se han presentado diversas novedades. En mayo de 2023, se publicaron el artículo y los modelos de CodeT5+. En septiembre de 2022, el artículo CodeRL fue aceptado en NeurIPS 2022. Y en julio de 2022, se lanzaron dos puntos de control de CodeT5 de gran tamaño en HuggingFace.
Además, se han realizado lanzamientos de puntos de control ajustados para diferentes tareas descendentes. Y se ha lanzado un punto de control ajustado de CodeT5-base para la resumen de código multilingüe.
El código se encuentra bajo la licencia BSD-3 (ver LICENSE.txt para detalles). Sin embargo, se pide a los usuarios que no utilicen este software para promover o obtener beneficios de la violencia, el odio, la división, la destrucción ambiental, el abuso de los derechos humanos o la destrucción de la salud física y mental de las personas.
Se anima a los usuarios a que nos comuniquen las aplicaciones en las que están utilizando este software enviando un correo electrónico a y a que utilicen una documentación adecuada al desarrollar aplicaciones de alto riesgo con este modelo.
Si tienes alguna pregunta, sugerencia, solicitud o reporte de error, se te anima a crear un issue en GitHub. También se dan la bienvenida las solicitudes de extracción (PRs).