Como automatizar tarefas com as ferramentas do Anthropic e o Claude 3?

Como começar a usar as ferramentas do Anthropic

O maior benefício de empregar LLMs para tarefas é sua versatilidade. Os LLMs podem ser solicitados de maneiras específicas para atender a uma infinidade de finalidades, funcionando como APIs para geração de texto ou conversão de dados não estruturados em formatos organizados. Muitos de nós recorremos ao ChatGPT para nossas tarefas diárias, seja para escrever e-mails ou para participar de debates divertidos com a IA.

A arquitetura dos plug-ins, também conhecidos como “GPTs”, gira em torno da identificação de palavras-chave de respostas e consultas e da execução de funções relevantes. Esses plug-ins permitem interações com aplicativos externos ou acionam funções personalizadas.

Embora a OpenAI tenha liderado o caminho para permitir chamadas de funções externas para a execução de tarefas, a Anthropic introduziu recentemente um recurso aprimorado chamado “Uso de ferramentas”, substituindo o mecanismo anterior de chamada de funções. Essa versão atualizada simplifica o desenvolvimento ao utilizar JSON em vez de tags XML. Além disso, o Claude-3 Opus apresenta uma vantagem sobre os modelos GPT com sua janela de contexto maior de 200 mil tokens, particularmente valiosa em cenários específicos.

Neste blog, exploraremos o conceito de “Uso de ferramentas”, discutiremos seus recursos e ofereceremos orientações para você começar.

O que é “uso de ferramentas”?

O Claude tem a capacidade de interagir com ferramentas e funções externas do lado do cliente, permitindo que você o equipe com suas próprias ferramentas personalizadas para uma variedade maior de tarefas.

O fluxo de trabalho para usar o Tools com o Claude é o seguinte:

  1. Fornecer ao Claude ferramentas e um prompt de usuário (solicitação de API)
    • Defina um conjunto de ferramentas para o Claude escolher.
    • Inclua-os junto com a consulta do usuário no prompt de geração de texto.
  2. Claude seleciona uma ferramenta
    • O Claude analisa o prompt do usuário e o compara com todas as ferramentas disponíveis para selecionar a mais relevante.
    • Utilizando o processo de “pensamento” do LLM, ele identifica as palavras-chave necessárias para a ferramenta relevante.
  3. Geração de respostas (resposta da API)
    • Após a conclusão do processo, o prompt de raciocínio, juntamente com a ferramenta e os parâmetros selecionados, é gerado como saída.

Após esse processo, você executa a função/ferramenta selecionada e utiliza sua saída para gerar outra resposta, se necessário.

Esquema geral da ferramenta

Esquema
Esse esquema serve como um meio de comunicar ao LLM os requisitos do processo de chamada de função. Ele não chama diretamente nenhuma função nem aciona nenhuma ação por conta própria. Para garantir a identificação precisa das ferramentas, você deve fornecer uma descrição detalhada de cada ferramenta. Properties dentro do esquema são utilizados para identificar os parâmetros que serão passados para a função em um estágio posterior.

Demonstração

Vamos criar ferramentas para raspar a Web e encontrar o preço de qualquer ação.

Esquema de ferramentas

Código 1

Na ferramenta scrape_website, você obterá o URL do site a partir do prompt do usuário. Quanto à ferramenta stock_price, ela identificará o nome da empresa a partir do prompt do usuário e o converterá em um ticker do yfinance.

Prompt do usuário

Código 2

Ao fazer duas consultas ao bot, uma para cada ferramenta, você obtém os seguintes resultados:

Código 3

O processo de raciocínio lista todas as etapas realizadas pelo LLM para selecionar com precisão a ferramenta correta para cada consulta e executar as conversões necessárias, conforme descrito nas descrições das ferramentas.

Selecionando a ferramenta relevante

Teremos que escrever algum código adicional que acionará as funções relevantes com base nas condições.

Código 4

Essa função serve para ativar o código apropriado com base no nome da ferramenta recuperado na resposta do LLM. Na primeira condição, extraímos o URL do site obtido da entrada da ferramenta, enquanto na segunda condição, buscamos o ticker das ações e o passamos para a biblioteca python yfinance.

Execução das funções

Passaremos o endereço ToolUseBlock inteiro na função select_tool() para acionar o código relevante.

Saídas

  1. Primeira solicitaçãoCódigo 5
  2. Segundo promptCódigo 4

Se quiser ver o código-fonte completo dessa demonstração, você pode ver este notebook.

Alguns casos de uso

O recurso de “uso de ferramentas” para o Claude eleva a versatilidade do LLM a um nível totalmente novo. Embora o exemplo fornecido seja fundamental, ele serve como base para expandir a funcionalidade. Aqui está uma aplicação real disso:

Para encontrar mais casos de uso, você pode visitar o repositório oficial do Anthropic
aqui
.

More From Our Blog

Do chatbot ao mecanismo de busca: como o ChatGPT Search da OpenAI está mudando o jogo

Do chatbot ao mecanismo de busca: como o ChatGPT Search da OpenAI está mudando o jogo

A evolução das pesquisas na Web com tecnologia de IA A mais recente inovação da OpenAI, o ChatGPT Search, marca um salto significativo nos recursos de pesquisa na Web orientados por IA. Esse recurso integra a pesquisa na Web em tempo real à inte...

Read More
Lançado o Nemotron 70B da Nvidia AI: Você deve ter medo da OpenAI e da Anthropic?

Lançado o Nemotron 70B da Nvidia AI: Você deve ter medo da OpenAI e da Anthropic?

A Nvidia apresentou discretamente seu mais recente modelo de IA, o Nemotron 70B, que está causando impacto no setor de inteligência artificial ao superar modelos bem estabelecidos como o GPT-4 da OpenAI e o Claude 3.5 Sonnet da Anthropic. Esse lanÃ...

Read More

Build Your Own Business AI

Get Started Free
Top