Vicuna: Un Chatbot de Código Abierto que Impresiona a GPT-4

Vicuna

Descubre Vicuna, un chatbot de código abierto que alcanza un 90% de calidad de ChatGPT, ¡pruébalo ahora!

Visitar Sitio
Vicuna: Un Chatbot de Código Abierto que Impresiona a GPT-4

Vicuna: Un Chatbot de Código Abierto que Impresiona a GPT-4 con un 90%* de Calidad de ChatGPT

Introducción

Vicuna-13B es un chatbot de código abierto que ha sido entrenado mediante el ajuste fino de LLaMA utilizando conversaciones compartidas por usuarios recolectadas de ShareGPT. La evaluación preliminar usando GPT-4 como juez muestra que Vicuna-13B logra más del 90%* de calidad de OpenAI ChatGPT y Google Bard, superando a otros modelos como LLaMA y Stanford Alpaca en más del 90%* de los casos.

¿Qué es Vicuna?

Vicuna es un chatbot que ha sido diseñado para generar respuestas más detalladas y bien estructuradas en comparación con otros modelos. Después de afinar Vicuna con 70,000 conversaciones compartidas de ChatGPT, se ha demostrado que puede competir en calidad con ChatGPT. Sin embargo, la evaluación de chatbots nunca es una tarea sencilla.

Evaluación de Vicuna

La evaluación preliminar de Vicuna se realizó creando un conjunto de 80 preguntas diversas y utilizando GPT-4 para juzgar las salidas del modelo. Se descubrió que GPT-4 prefiere las respuestas de Vicuna en más del 90% de las preguntas, logrando un rendimiento competitivo con modelos propietarios como ChatGPT y Bard.

Comparación de Modelos

Nombre del ModeloLLaMAAlpacaVicunaBard/ChatGPT
DatasetDatasets disponibles públicamente (1T token)Auto-instrucción desde la API davinci-003 (52K muestras)Conversaciones compartidas por usuarios (70K muestras)N/A
Costo de Entrenamiento (13B)135K GPU-horasN/A$300 (entrenamiento)N/A

Cómo Evaluar un Chatbot

Evaluar chatbots de IA es un desafío, ya que implica examinar la comprensión del lenguaje, el razonamiento y la conciencia del contexto. Proponemos un marco de evaluación basado en GPT-4 para automatizar la evaluación del rendimiento de los chatbots.

Limitaciones

Vicuna, al igual que otros modelos de lenguaje grandes, presenta ciertas limitaciones. No es muy bueno en tareas que involucran razonamiento o matemáticas y puede tener dificultades para garantizar la precisión fáctica de sus salidas.

Conclusión

Vicuna representa un punto de partida abierto para futuras investigaciones que aborden estas limitaciones. Para más información y para probar la demostración en línea, visita Vicuna-13B Demo. ¡Únete a nuestra comunidad y mantente actualizado sobre nuestros últimos avances!

Llamado a la Acción

Si te interesa explorar el potencial de Vicuna, no dudes en probar la demostración y compartir tus experiencias. ¡El futuro de los chatbots está aquí!

Mejores Alternativas a Vicuna