Los 5 mejores LLM gratuitos de código abierto en 2024

Los LLM son omnipresentes hoy en día y no necesitan presentación. Tanto si te dedicas a la tecnología como si no, lo más probable es que te hayas encontrado o estés utilizando alguna forma de LLM a diario. Los LLM más destacados en la actualidad son GPT de OpenAI, Claude de Anthropic y Gemini de Google.

Sin embargo, estos populares LLM funcionan a menudo como sistemas abstractos o de caja negra, lo que suscita preocupación por la privacidad y la transparencia de los datos. Para solucionar estos problemas, existen varios LLM de código abierto que permiten a los usuarios implantarlos en máquinas o servidores privados con toda tranquilidad.

Por código abierto se entiende el software o los productos distribuidos con su código fuente disponible libremente para su inspección, modificación y distribución. Esta accesibilidad permite a los usuarios comprender, mejorar y contribuir al desarrollo del software.

Estos son algunos de los mejores LLM de código abierto disponibles en la actualidad:

Llama 2

LLaMA 2: el modelo de IA de código abierto de Meta

Llama 2 es un LLM de código abierto desarrollado por Meta, que se ofrece gratuitamente con fines comerciales y de investigación. Los modelos Llama 2 se han entrenado con dos billones de fichas y tienen el doble de longitud de contexto que Llama 1.

Los parámetros del modelo influyen directamente en su capacidad de comprensión del texto, y los modelos más grandes ofrecen un mejor rendimiento a costa de un aumento de tamaño y de los recursos necesarios.

Variantes disponibles: Parámetros 7B, 13B y 70B

Ventana de contexto: 4096 fichas

Idiomas admitidos: Funciona mejor en inglés

Mixtral 8x7B

Mistral AI presenta Mixtral 8x7B, un LLM de código abierto que, según afirma, está a la altura de GPT 3.5

Mixtral 8x7B, desarrollado por Mistral AI, es un LLM que contiene 46,7B parámetros totales. A pesar de su tamaño, mantiene una velocidad de inferencia y un coste similares a los modelos de un tercio de su tamaño. Este modelo de Transformador de Mezcla de Expertos (MoE) supera con creces a LLama 2 y GPT-3.5 en algunas pruebas.

Variantes disponibles: Pequeño, Pequeño, Mediano y Grande (desde económico hasta de alto rendimiento)

Ventana de contexto: 32000 fichas (en Mistral Large)

Idiomas admitidos: Inglés, francés, español, alemán, italiano (en Mistral Large)

Halcón

El Instituto de Innovación Tecnológica de los Emiratos Árabes Unidos lanza un modelo de gran lenguaje

Falcon, desarrollado por el Technology Innovation Institute (TII) de Abu Dhabi, es otro de los principales LLM de código abierto. Tras su lanzamiento, Falcon 40B ocupó durante dos meses el primer puesto en la clasificación de Hugging Face de grandes modelos lingüísticos (LLM) de código abierto. Con la variante 180B, TII mejora aún más los conocimientos y la capacidad de comprensión de datos del modelo. Falcon 180B es un modelo lingüístico superpotente entrenado con 3,5 billones de tokens.

Variantes disponibles: Falcon 40B y Falcon 180B

Ventana de contexto: 4096 fichas

Idiomas admitidos: Inglés, alemán, español, francés, con soporte limitado para italiano, portugués, polaco, holandés, rumano, checo y sueco.

BLOOM

BLOOM

BLOOM es un Large Language Model (LLM) autorregresivo desarrollado por Big Science. BLOOM, entrenado en 176B parámetros, destaca en la generación de continuaciones de texto a partir de prompts utilizando grandes cantidades de datos de texto y recursos computacionales a escala industrial.

Variantes disponibles: bloom-560m, bloom-1b1, bloom-1b7, bloom-3b, bloom-7b1, bloom 176B

Ventana de contexto: 2048 fichas

Lenguas admitidas: 46 lenguas naturales (con cantidades variables de datos, desde el 30% del inglés hasta el 0,00002% del chi tumbuka).

Gemma

Gemma] Construyendo un asistente de IA para la ciencia de datos 🤖

Gemma, el último LLM abierto de última generación de Google, es la continuación del éxito de Gemini. Gemma es una familia de Large Language Models (LLM) de ponderación abierta de Google DeepMind, basada en la investigación y la tecnología de Gemini. Aunque los pesos del modelo son de libre acceso, las condiciones específicas de uso, redistribución y propiedad de variantes pueden variar y podrían no estar basadas en una licencia de código abierto.

Variantes disponibles: Gemma 2B y Gemma 7B

Ventana de contexto: 8192 fichas

Idiomas admitidos: Inglés

Conclusión

En Cody priorizamos un enfoque agnóstico del modelo cuando se trata de LLMs, ofreciendo una plataforma que te permite construir bots personalizados adaptados a tu caso de uso único. Con una amplia gama de opciones de LLM disponibles, no estás restringido a un único proveedor, lo que te da la libertad de elegir el que mejor se adapte a tus necesidades.

A través de Cody, las empresas pueden aprovechar la IA para desarrollar asistentes inteligentes adaptados a sus necesidades concretas. Esta flexibilidad convierte a Cody en una prometedora incorporación al ámbito de las soluciones empresariales basadas en IA.

More From Our Blog

De chatbot a motor de búsqueda: cómo la búsqueda ChatGPT de OpenAI está cambiando el juego

De chatbot a motor de búsqueda: cómo la búsqueda ChatGPT de OpenAI está cambiando el juego

La evolución de las búsquedas web potenciadas por IA La última innovación de OpenAI, ChatGPT Search, marca un salto significativo en las capacidades de búsqueda web basadas en IA. Esta función integra la búsqueda web en tiempo real en la inter...

Read More
Lanzamiento del Nemotron 70B de Nvidia AI: ¿Deberían tener miedo OpenAI y Anthropic?

Lanzamiento del Nemotron 70B de Nvidia AI: ¿Deberían tener miedo OpenAI y Anthropic?

Nvidia ha presentado discretamente su último modelo de IA, el Nemotron 70B, que está causando sensación en el sector de la inteligencia artificial al superar a modelos bien establecidos como el GPT-4 de OpenAI y el Sonnet Claude 3.5 de Anthropic. ...

Read More

Build Your Own Business AI

Get Started Free
Top