Guía para usar modelos de lenguaje grandes preentrenados de código

Code

Descubre cómo utilizar Code-LMs para la generación automática de código y mejorar tu productividad en programación.

Visitar Sitio
Guía para usar modelos de lenguaje grandes preentrenados de código

Guía para usar modelos de lenguaje grandes preentrenados de código

Introducción

En el mundo del desarrollo de software, la generación automática de código es una de las áreas más emocionantes de la inteligencia artificial. Code-LMs es un repositorio que proporciona modelos de lenguaje grandes, como PolyCoder, diseñados específicamente para trabajar con código fuente. En esta guía, exploraremos cómo utilizar estos modelos para mejorar la productividad en la programación.

¿Qué es Code-LMs?

Code-LMs es un proyecto de VHellendoorn que se centra en el entrenamiento y la liberación pública de modelos de lenguaje neural grandes que pueden generar código. Estos modelos han sido entrenados en un corpus multilingüe de código, lo que les permite comprender y generar código en varios lenguajes de programación.

Modelos Disponibles

Los modelos disponibles incluyen:

  • PolyCoder-160M
  • PolyCoder-0.4B
  • PolyCoder-2.7B

Para usar estos modelos, simplemente puedes importar las bibliotecas necesarias y cargar el modelo deseado. Por ejemplo:

import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("NinedayWang/PolyCoder-2.7B")
model = AutoModelForCausalLM.from_pretrained("NinedayWang/PolyCoder-2.7B")

Generación de Código

Para generar código, puedes utilizar un prompt como el siguiente:

prompt = '''def binarySearch(arr, left, right, x): mid = (left +''' 
input_ids = tokenizer.encode(prompt, return_tensors='pt')
result = model.generate(input_ids, max_length=50, num_beams=4, num_return_sequences=4)
for res in result:
    print(tokenizer.decode(res))

Este código generará varias secuencias de código basadas en el prompt proporcionado.

Evaluación de Modelos

Los modelos han sido evaluados utilizando el benchmark HumanEval, donde se midieron las tasas de éxito en la generación de código correcto. Por ejemplo, el modelo PolyCoder (2.7B) logró un 5.59% de éxito en la primera prueba.

Conclusión

Code-LMs representa un avance significativo en la generación automática de código. Con su capacidad para trabajar en múltiples lenguajes de programación y su fácil integración en proyectos existentes, es una herramienta valiosa para desarrolladores y equipos de software. ¡Prueba Code-LMs hoy y lleva tu programación al siguiente nivel! 🚀

Recursos Adicionales

Preguntas Frecuentes

¿Qué lenguajes de programación soporta?
Los modelos han sido entrenados en 12 lenguajes de programación, incluyendo Python, Java, C++, y más.

¿Es gratuito usar estos modelos?
Sí, los modelos están disponibles de forma gratuita en el repositorio de Zenodo.

¿Cómo puedo contribuir al proyecto?
Puedes contribuir abriendo issues o pull requests en el repositorio de GitHub.

Mejores Alternativas a Code