Assassino do ChatGPT? O que o Gemini 1.5 significa para o futuro da IA do Google

Google vs OpenAI: o Google está ganhando?

Depois de errar o alvo com o Bard no trem da propaganda da IA, o Google revelou recentemente seu mais recente produto de IA, o Gemini. Como parte desse lançamento, a Bard foi rebatizada como Gemini e agora incorpora o novo Gemini Pro LLM. Vamos nos aprofundar para entender a extensão dessas mudanças.

O que é a Gemini AI?

O Gemini representa o mais novo modelo de linguagem grande (LLM) do Google, após o lançamento do LaMDA e do PaLM. Ao contrário de seus antecessores, o Gemini é nativamente multimodal, capaz de compreender texto, imagens, fala e código, e apresenta habilidades aprimoradas de compreensão e raciocínio.

Variantes do Gemini AI

O Gemini AI consiste em três modelos de linguagem grandes:

  1. Gemini Nano: Otimizado para eficiência no dispositivo, oferecendo soluções rápidas de IA diretamente em seu dispositivo pessoal.
  2. Gemini Pro: Um modelo versátil e escalável, capaz de lidar com diversas tarefas com desempenho robusto. Acessível na versão gratuita da interface de bate-papo do Gemini.
  3. Gemini Ultra: o ápice da série Gemini, capacitando a solução de problemas complexos e avançando as fronteiras dos recursos de IA. Exclusivo para assinantes do Plano Premium do Google One AI.

Os modelos Gemini foram treinados usando TPUv5e e TPUv4, dependendo de seus tamanhos e configurações. O Training Gemini Ultra usou uma grande frota de aceleradores TPUv4 de propriedade do Google em vários centros de dados. Isso representa um aumento significativo na escala em relação ao modelo principal anterior, o PaLM-2, que apresentou novos desafios de infraestrutura.

Comparação do Gemini com outros LLMs

Compreensão textual

Comparação do Gemini com outros LLMs

Fonte: Google Deepmind

Compreensão da imagem

Comparação do Gemini com outros LLMs

Fonte: Google Deepmind

Leia mais sobre isso aqui.

Benefícios de Gêmeos

1. Integração perfeita com todos os aplicativos do Google

O Gemini agora se integra perfeitamente a todos os Google Apps, incluindo o Maps, o YouTube, o Gmail e muito mais. Para consultar aplicativos específicos, basta prefixar o nome do aplicativo com “@” seguido de sua consulta. Embora seja possível obter integrações semelhantes no ChatGPT usando GPTs e plug-ins, elas podem não oferecer o mesmo nível de perfeição que as integrações nativas do Gemini.

Integração de Gêmeos

A renomada experiência do Google em tecnologia de mecanismos de pesquisa sem dúvida se estende para aprimorar os recursos de navegação na Web do Gemini. Aproveitando os pontos fortes fundamentais dos algoritmos de pesquisa e indexação, o Gemini oferece aos usuários uma experiência de navegação perfeita e eficiente.

2. Recursos multimodais

O Gemini agora oferece recursos multimodais, incluindo a compreensão de imagens, na interface de bate-papo do Gemini, sem custo adicional. Embora seu desempenho durante os testes tenha sido decente, ele pode não ter a mesma precisão do GPT-4V. No entanto, como é gratuito, não podemos reclamar, não é mesmo? 😉 Há uma chance de que o Gemini Ultra supere o GPT-4V com base nas métricas

Gemini Multimodal

3. Acesso gratuito para hobbistas e estudantes

Para os aspirantes a desenvolvedores de LLM que desejam mergulhar no campo, mas enfrentam restrições no acesso às APIs de GPT devido aos custos, o Google oferece acesso gratuito à API Gemini Pro 1.0. Com isso, você pode fazer até 60 consultas por minuto no Google AI Studio, uma ferramenta de desenvolvimento gratuita baseada na Web. O Google AI Studio permite que você desenvolva rapidamente prompts e obtenha uma chave de API para o desenvolvimento de aplicativos. Ao fazer login no Google AI Studio com sua conta do Google, você pode aproveitar essa cota gratuita. É uma excelente oportunidade para iniciar sua jornada de LLM e explorar embeddings, bancos de dados vetoriais, pesquisa semântica e muito mais.

Estúdio de IA do Google

4. Valor para o dinheiro

Por US$ 20 por mês, os usuários podem acessar o GPT-4 via ChatGPT Plus. Como alternativa, pelo mesmo preço, eles podem acessar o Gemini Advanced com o Gemini Ultra 1.0, que inclui benefícios adicionais, como 2 TB de armazenamento em nuvem e integração com o Google Apps, como Gmail e Docs. No entanto, o acesso ao Gemini Advanced requer uma assinatura do Plano Premium do Google One AI. Apesar dessa exigência, ele oferece maior valor para seu dinheiro.

Planos do Google One

A introdução de um plano intermediário com 500 GB de armazenamento e acesso ao Gemini Advanced entre os planos Standard e Premium aumentaria significativamente a acessibilidade do Gemini, especialmente para estudantes e usuários com requisitos moderados de armazenamento. Google, se estiver ouvindo, considere esta sugestão.

O que vem por aí para a Gemini?

O DeepMind do Google está avançando continuamente no modelo Gemini, com o recente lançamento do Gemini Pro 1.5 há apenas uma semana. Nessa variante atualizada, a janela de contexto foi expandida para 128.000 tokens. Além disso, um grupo seleto de desenvolvedores e clientes corporativos agora pode experimentar janelas de contexto ainda maiores, de até 1 milhão de tokens, por meio de visualizações privadas no AI Studio e no Vertex AI. Para colocar isso em perspectiva, um livro típico de não ficção contém cerca de 300.000 tokens. Com a janela de contexto de 1 milhão de tokens do Gemini Pro 1.5, os usuários agora podem carregar livros inteiros em solicitações de consulta – um avanço notável em comparação com a janela de contexto de 128.000 tokens do GPT-4.

Em meio à saturação de LLMs no setor de IA, o Google parece ter conseguido o ouro com sua arquitetura aprimorada, respostas rápidas e integração perfeita no ecossistema do Google desta vez. De fato, poderia ser um passo na direção certa, mantendo a OpenAI e outros concorrentes atentos.

Nesta era da IA, é crucial que as empresas tenham funcionários bem formados, e incorporar a IA na formação dos funcionários pode ser um investimento significativo. Se você está buscando soluções de IA para treinar seus funcionários, a Cody é a ferramenta certa para você. Semelhante ao ChatGPT e ao Gemini, o Cody pode ser treinado em seus dados comerciais, equipe, processos e clientes, usando sua base de conhecimento exclusiva. A Cody é agnóstica em relação ao modelo, o que facilita a troca de modelos de acordo com suas necessidades.

Com o Cody, as empresas podem tirar partido do poder da IA para criar um assistente personalizado e inteligente que se adapta especificamente às suas necessidades, o que o torna uma adição promissora ao mundo das soluções empresariais orientadas para a IA.

More From Our Blog

Groq e Llama 3: uma dupla que muda o jogo

Groq e Llama 3: uma dupla que muda o jogo

Há alguns meses, uma nova empresa chamada “Groq” surgiu aparentemente do nada, fazendo um grande avanço no setor de IA. Eles forneceram uma plataforma para os desenvolvedores acessarem as LPUs como mecanismos de inferência para LLMs, e...

Read More
Os 5 principais LLMs gratuitos de código aberto em 2024

Os 5 principais LLMs gratuitos de código aberto em 2024

Atualmente, os LLMs são onipresentes e dispensam apresentações. Quer você trabalhe com tecnologia ou não, é provável que já tenha encontrado ou esteja usando alguma forma de LLM diariamente. Os LLMs mais proeminentes atualmente incluem o GPT ...

Read More

Build Your Own Business AI

Get Started Free
Top