Os 5 principais LLMs gratuitos de código aberto em 2024
Atualmente, os LLMs são onipresentes e dispensam apresentações. Quer você trabalhe com tecnologia ou não, é provável que já tenha encontrado ou esteja usando alguma forma de LLM diariamente. Os LLMs mais proeminentes atualmente incluem o GPT da OpenAI, o Claude da Anthropic e o Gemini do Google.
No entanto, esses LLMs populares geralmente operam como sistemas abstratos ou de caixa preta, o que gera preocupações sobre a privacidade e a transparência dos dados. Para resolver esses problemas, vários LLMs de código aberto estão disponíveis, permitindo que os usuários os implementem em máquinas ou servidores privados com tranquilidade.
Código aberto refere-se a software ou produtos distribuídos com seu código-fonte disponível gratuitamente para inspeção, modificação e distribuição. Essa acessibilidade permite que os usuários compreendam, aprimorem e contribuam para o desenvolvimento do software.
Aqui estão alguns dos melhores LLMs de código aberto disponíveis atualmente:
Lhama 2
O Llama 2 é um LLM de código aberto desenvolvido pela Meta, oferecido gratuitamente para fins comerciais e de pesquisa. Os modelos da Llama 2 são treinados com dois trilhões de tokens e têm o dobro do comprimento do contexto da Llama 1.
Os parâmetros do modelo afetam diretamente sua capacidade de compreender o texto, sendo que modelos maiores oferecem melhor desempenho ao custo de maiores requisitos de tamanho e recursos.
Variantes disponíveis: Parâmetros 7B, 13B e 70B
Janela de contexto: 4096 tokens
Idiomas suportados: O melhor desempenho é em inglês
Mixtral 8x7B
O Mixtral 8x7B, desenvolvido pela Mistral AI, é um LLM que contém um total de 46,7 bilhões de parâmetros. Apesar de seu tamanho, ele mantém a velocidade de inferência e o custo semelhantes aos modelos com um terço de seu tamanho. Esse modelo Transformer Mixture of Experts (MoE) somente para decodificador supera significativamente o LLama 2 e o GPT-3.5 em determinados benchmarks.
Variantes disponíveis: Tiny, Small, Medium e Large (classificadas de econômicas a de alto desempenho)
Janela de contexto: 32000 tokens (no Mistral Large)
Idiomas suportados: Inglês, francês, espanhol, alemão, italiano (no Mistral Large)
Falcão
O Falcon, desenvolvido pelo Technology Innovation Institute (TII) em Abu Dhabi, é outro LLM de código aberto líder. Após seu lançamento, o Falcon 40B ocupou a primeira posição na tabela de classificação da Hugging Face para modelos de linguagem grande (LLMs) de código aberto por dois meses. Com a variante 180B, o TII aprimora ainda mais o conhecimento do modelo e as habilidades de compreensão de dados. O Falcon 180B é um modelo de linguagem superpotente treinado em 3,5 trilhões de tokens.
Variantes disponíveis: Falcon 40B e Falcon 180B
Janela de contexto: 4096 tokens
Idiomas suportados: Inglês, alemão, espanhol, francês, com suporte limitado para italiano, português, polonês, holandês, romeno, tcheco e sueco.
BLOOM
O BLOOM é um modelo autorregressivo de linguagem grande (LLM) desenvolvido pela Big Science. Treinado com parâmetros 176B, o BLOOM se destaca na geração de continuações de texto a partir de prompts usando grandes quantidades de dados de texto e recursos computacionais em escala industrial.
Variantes disponíveis: bloom-560m, bloom-1b1, bloom-1b7, bloom-3b, bloom-7b1, bloom 176B
Janela de contexto: 2048 tokens
Idiomas suportados: 46 idiomas naturais (com quantidades variáveis de dados, de 30% para o inglês a 0,00002% para o Chi Tumbuka)
Gemma
O Gemma, o mais recente LLM aberto de última geração do Google, segue o sucesso do Gemini. Gemma é uma família de Modelos de Linguagem Grande (LLM) de pesos abertos do Google DeepMind, desenvolvida com base na pesquisa e na tecnologia Gemini. Embora os pesos do modelo sejam de livre acesso, os termos específicos de uso, redistribuição e propriedade de variantes podem variar e podem não se basear em uma licença de código aberto.
Variantes disponíveis: Gemma 2B e Gemma 7B
Janela de contexto: 8192 tokens
Idiomas suportados: Inglês
Conclusão
Na Cody, priorizamos uma abordagem agnóstica de modelo quando se trata de LLMs, oferecendo uma plataforma que permite que você crie bots personalizados, adaptados ao seu caso de uso exclusivo. Com uma gama diversificada de opções de LLM disponíveis, você não fica restrito a um único provedor, o que lhe dá a liberdade de escolher a melhor opção para suas necessidades.
Por meio da Cody, as empresas podem aproveitar a IA para desenvolver assistentes inteligentes personalizados de acordo com suas necessidades específicas. Essa flexibilidade faz com que a Cody seja uma adição promissora ao reino das soluções de negócios orientadas por IA.