Os 5 principais LLMs gratuitos de código aberto em 2024

Atualmente, os LLMs são onipresentes e dispensam apresentações. Quer você trabalhe com tecnologia ou não, é provável que já tenha encontrado ou esteja usando alguma forma de LLM diariamente. Os LLMs mais proeminentes atualmente incluem o GPT da OpenAI, o Claude da Anthropic e o Gemini do Google.

No entanto, esses LLMs populares geralmente operam como sistemas abstratos ou de caixa preta, o que gera preocupações sobre a privacidade e a transparência dos dados. Para resolver esses problemas, vários LLMs de código aberto estão disponíveis, permitindo que os usuários os implementem em máquinas ou servidores privados com tranquilidade.

Código aberto refere-se a software ou produtos distribuídos com seu código-fonte disponível gratuitamente para inspeção, modificação e distribuição. Essa acessibilidade permite que os usuários compreendam, aprimorem e contribuam para o desenvolvimento do software.

Aqui estão alguns dos melhores LLMs de código aberto disponíveis atualmente:

Lhama 2

LLaMA 2: Modelo de IA de código aberto do Meta

O Llama 2 é um LLM de código aberto desenvolvido pela Meta, oferecido gratuitamente para fins comerciais e de pesquisa. Os modelos da Llama 2 são treinados com dois trilhões de tokens e têm o dobro do comprimento do contexto da Llama 1.

Os parâmetros do modelo afetam diretamente sua capacidade de compreender o texto, sendo que modelos maiores oferecem melhor desempenho ao custo de maiores requisitos de tamanho e recursos.

Variantes disponíveis: Parâmetros 7B, 13B e 70B

Janela de contexto: 4096 tokens

Idiomas suportados: O melhor desempenho é em inglês

Mixtral 8x7B

A Mistral AI apresenta o Mixtral 8x7B, um LLM de código aberto que, segundo ela, está no mesmo nível do GPT 3.5

O Mixtral 8x7B, desenvolvido pela Mistral AI, é um LLM que contém um total de 46,7 bilhões de parâmetros. Apesar de seu tamanho, ele mantém a velocidade de inferência e o custo semelhantes aos modelos com um terço de seu tamanho. Esse modelo Transformer Mixture of Experts (MoE) somente para decodificador supera significativamente o LLama 2 e o GPT-3.5 em determinados benchmarks.

Variantes disponíveis: Tiny, Small, Medium e Large (classificadas de econômicas a de alto desempenho)

Janela de contexto: 32000 tokens (no Mistral Large)

Idiomas suportados: Inglês, francês, espanhol, alemão, italiano (no Mistral Large)

Falcão

O Instituto de Inovação Tecnológica dos Emirados Árabes Unidos lança o modelo de língua grande

O Falcon, desenvolvido pelo Technology Innovation Institute (TII) em Abu Dhabi, é outro LLM de código aberto líder. Após seu lançamento, o Falcon 40B ocupou a primeira posição na tabela de classificação da Hugging Face para modelos de linguagem grande (LLMs) de código aberto por dois meses. Com a variante 180B, o TII aprimora ainda mais o conhecimento do modelo e as habilidades de compreensão de dados. O Falcon 180B é um modelo de linguagem superpotente treinado em 3,5 trilhões de tokens.

Variantes disponíveis: Falcon 40B e Falcon 180B

Janela de contexto: 4096 tokens

Idiomas suportados: Inglês, alemão, espanhol, francês, com suporte limitado para italiano, português, polonês, holandês, romeno, tcheco e sueco.

BLOOM

BLOOM

O BLOOM é um modelo autorregressivo de linguagem grande (LLM) desenvolvido pela Big Science. Treinado com parâmetros 176B, o BLOOM se destaca na geração de continuações de texto a partir de prompts usando grandes quantidades de dados de texto e recursos computacionais em escala industrial.

Variantes disponíveis: bloom-560m, bloom-1b1, bloom-1b7, bloom-3b, bloom-7b1, bloom 176B

Janela de contexto: 2048 tokens

Idiomas suportados: 46 idiomas naturais (com quantidades variáveis de dados, de 30% para o inglês a 0,00002% para o Chi Tumbuka)

Gemma

Gemma] Criação de um assistente de IA para ciência de dados 🤖

O Gemma, o mais recente LLM aberto de última geração do Google, segue o sucesso do Gemini. Gemma é uma família de Modelos de Linguagem Grande (LLM) de pesos abertos do Google DeepMind, desenvolvida com base na pesquisa e na tecnologia Gemini. Embora os pesos do modelo sejam de livre acesso, os termos específicos de uso, redistribuição e propriedade de variantes podem variar e podem não se basear em uma licença de código aberto.

Variantes disponíveis: Gemma 2B e Gemma 7B

Janela de contexto: 8192 tokens

Idiomas suportados: Inglês

Conclusão

Na Cody, priorizamos uma abordagem agnóstica de modelo quando se trata de LLMs, oferecendo uma plataforma que permite que você crie bots personalizados, adaptados ao seu caso de uso exclusivo. Com uma gama diversificada de opções de LLM disponíveis, você não fica restrito a um único provedor, o que lhe dá a liberdade de escolher a melhor opção para suas necessidades.

Por meio da Cody, as empresas podem aproveitar a IA para desenvolver assistentes inteligentes personalizados de acordo com suas necessidades específicas. Essa flexibilidade faz com que a Cody seja uma adição promissora ao reino das soluções de negócios orientadas por IA.

More From Our Blog

Do chatbot ao mecanismo de busca: como o ChatGPT Search da OpenAI está mudando o jogo

Do chatbot ao mecanismo de busca: como o ChatGPT Search da OpenAI está mudando o jogo

A evolução das pesquisas na Web com tecnologia de IA A mais recente inovação da OpenAI, o ChatGPT Search, marca um salto significativo nos recursos de pesquisa na Web orientados por IA. Esse recurso integra a pesquisa na Web em tempo real à inte...

Read More
Lançado o Nemotron 70B da Nvidia AI: Você deve ter medo da OpenAI e da Anthropic?

Lançado o Nemotron 70B da Nvidia AI: Você deve ter medo da OpenAI e da Anthropic?

A Nvidia apresentou discretamente seu mais recente modelo de IA, o Nemotron 70B, que está causando impacto no setor de inteligência artificial ao superar modelos bem estabelecidos como o GPT-4 da OpenAI e o Claude 3.5 Sonnet da Anthropic. Esse lan...

Read More

Build Your Own Business AI

Get Started Free
Top