TRILHA 1

🧠 Capacidades do Opus 4.8

O modelo por dentro: o que é o Opus 4.8, como funciona o raciocínio híbrido, a janela de 1M de tokens, o controle de esforço e a codificação agêntica de longo horizonte.

7
Módulos
30
Tópicos
~3h
Duração
Básico
Nível

Mapa da trilha

Conteúdo detalhado

1.1~30 min

🚀 Apresentando o Opus 4.8

O que é, quando foi lançado, como se posiciona e por que ele importa.

O que é:

O Claude Opus 4.8 foi anunciado pela Anthropic em 28/05/2026 (uma quinta-feira), com disponibilidade imediata em todos os canais.

Por que aprender:

Saber a data e o contexto ajuda a entender o ritmo de evolução da família 4.x e a comparar com versões anteriores.

Conceitos-chave:

Lançamento "disponível em todos os lugares hoje"; ~42 dias após o Opus 4.7 — o ciclo mais rápido da família.

O que é:

A Anthropic posiciona o 4.8 como seu "modelo mais capaz geralmente disponível", construído sobre o Opus 4.7.

Por que aprender:

O posicionamento define para quais cargas o modelo é indicado: raciocínio complexo e tarefas autônomas longas.

Conceitos-chave:

"Most capable generally available model"; foco em coding agêntico e agentes de IA.

O que é:

Na API, o identificador do modelo é claude-opus-4-8. Pertence à família Opus 4.x (4.5 → 4.6 → 4.7 → 4.8).

Por que aprender:

Você precisa do ID correto para chamar o modelo na API, Bedrock e Vertex AI.

Conceitos-chave:

ID estável claude-opus-4-8; mesma família, evolução incremental.

O que é:

É um modelo de raciocínio híbrido: pode responder direto ou "pensar" antes, conforme a dificuldade.

Por que aprender:

Entender o modo híbrido é a base para usar bem o controle de esforço (módulo 1.4).

Conceitos-chave:

"Hybrid reasoning model"; pensamento adaptativo; uma única chamada decide quanto raciocinar.

O que é:

Disponível no claude.ai, na Claude API, no Amazon Bedrock, no Google Vertex AI, no Microsoft Foundry e no GitHub Copilot.

Por que aprender:

A escolha da plataforma afeta limites (ex.: contexto de 200k no Foundry) — detalhado na Trilha 3.

Conceitos-chave:

6 canais no dia 1; paridade de recursos com pequenas exceções por plataforma.

O que é:

O 4.8 mira tarefas autônomas que duram horas — coding agêntico, trabalho de conhecimento profundo e operação independente.

Por que aprender:

Saber o "para quê" do modelo evita usá-lo mal (ex.: pagar Opus para tarefas triviais).

Conceitos-chave:

Autonomia longa; menos ciclos de revisão; comportamento mais previsível em escala.

Ver Completo
1.2~30 min

🧩 Raciocínio híbrido & pensamento adaptativo

Como o modelo decide quando pensar mais e quando responder direto.

O que é:

Um único modelo que pode operar com ou sem raciocínio explícito, escolhendo conforme a tarefa.

Por que aprender:

Elimina a necessidade de trocar de modelo entre "rápido" e "pensante".

Conceitos-chave:

Híbrido = flexível; uma chamada, dois comportamentos.

O que é:

O modelo calibra a profundidade do raciocínio conforme a dificuldade percebida da tarefa.

Por que aprender:

Reduz desperdício de tokens em tarefas fáceis e melhora qualidade nas difíceis.

Conceitos-chave:

"Adaptive thinking"; calibração de esforço de raciocínio.

O que é:

Problemas de múltiplos passos, matemática e código complexo tendem a acionar mais raciocínio.

Por que aprender:

Ajuda a prever custo e latência conforme o tipo de tarefa.

Conceitos-chave:

Mais passos = mais pensamento; tarefas triviais = resposta direta.

O que é:

O raciocínio consome tokens de saída, então mais pensamento custa mais e demora mais.

Por que aprender:

Equilibrar qualidade × custo é decisão de engenharia diária.

Conceitos-chave:

Tokens de raciocínio contam como saída; use o controle de esforço para limitar.

O que é:

No claude.ai você ajusta o esforço (Low→Max); na prática, é um teto/piso para o pensamento adaptativo.

Por que aprender:

Saber combinar adaptativo + controle manual dá o melhor dos dois mundos.

Conceitos-chave:

Adaptativo decide sozinho; o dial te deixa intervir.

O que é:

Para a maioria das tarefas, o padrão adaptativo basta; ajuste só quando custo/latência ou qualidade exigirem.

Por que aprender:

Evita micro-otimização desnecessária.

Conceitos-chave:

Comece no padrão; meça; só então ajuste o esforço.

Ver Completo
1.3~30 min

📜 A janela de 1M de tokens

Contexto longo na prática: o que cabe, limites por plataforma e compactação.

O que é:

Suporte padrão a 1 milhão de tokens de contexto na Claude API, Bedrock e Vertex AI.

Por que aprender:

Permite analisar bases de código e documentos inteiros numa só chamada.

Conceitos-chave:

1M tokens por padrão; 128k de saída.

O que é:

No Microsoft Foundry o contexto é limitado a 200k tokens (não 1M).

Por que aprender:

A escolha de plataforma muda o que cabe no contexto.

Conceitos-chave:

Foundry = 200k; demais = 1M.

O que é:

O 4.8 melhora o manejo de contexto longo, com menos compactações e melhor recuperação após compactar.

Por que aprender:

Compactação afeta a continuidade de agentes longos.

Conceitos-chave:

"Fewer compactions, better compaction recovery".

O que é:

Benchmark de raciocínio em contexto de 1M; o 4.8 marca F1 de 68,1%.

Por que aprender:

Mostra que contexto longo é usável, não só grande.

Conceitos-chave:

GraphWalks mede recuperação em janela enorme.

O que é:

Repositórios inteiros, contratos longos, históricos de suporte e sessões de agente de horas.

Por que aprender:

Identificar onde o contexto grande paga a conta.

Conceitos-chave:

Menos chunking; mais visão global.

O que é:

Cada token de entrada é cobrado; encher 1M de contexto custa caro sem cache.

Por que aprender:

Prompt caching (Trilha 2) é essencial para contexto longo recorrente.

Conceitos-chave:

Grande ≠ grátis; combine com cache.

Ver Completo
1.4~25 min

🎚️ Controle de esforço (Low → Max)

Os cinco níveis de esforço no claude.ai e quando usar cada um.

O que é:

No claude.ai você controla quanto esforço o Claude aplica à tarefa.

Por que aprender:

É a alavanca direta entre velocidade/custo e profundidade.

Conceitos-chave:

Dial de esforço; padrão é "high".

O que é:

Cinco tiers: Low, Medium, High (padrão), Extra e Max.

Por que aprender:

Cada nível troca custo/latência por profundidade.

Conceitos-chave:

5 níveis; quanto mais alto, mais raciocínio.

O que é:

Tarefas simples, respostas rápidas e alto volume.

Por que aprender:

Economiza tokens e tempo quando não há complexidade.

Conceitos-chave:

Baixo esforço = rápido e barato.

O que é:

Problemas difíceis, raciocínio multi-passo e qualidade máxima.

Por que aprender:

Vale o custo extra quando o erro sai caro.

Conceitos-chave:

Alto esforço = mais lento e caro, porém mais preciso.

O que é:

Subir o esforço gera mais tokens de raciocínio (saída cobrada).

Por que aprender:

Permite orçar o gasto por tarefa.

Conceitos-chave:

Esforço ↑ = custo ↑; meça o retorno.

O que é:

Comece no High (padrão), baixe para volume/custo, suba para tarefas críticas.

Por que aprender:

Uma heurística simples cobre 90% dos casos.

Conceitos-chave:

Padrão → ajuste por exceção.

Ver Completo
1.5~35 min

🤖 Codificação agêntica de longo horizonte

Por que o 4.8 sustenta tarefas de horas sem perder o fio.

O que é:

Tarefas autônomas que se estendem por horas de operação independente.

Por que aprender:

É o diferencial central do 4.8 para agentes.

Conceitos-chave:

"Multi-stage autonomous tasks that span hours".

O que é:

O 4.8 precisa compactar o contexto menos vezes durante sessões longas.

Por que aprender:

Menos compactação = menos perda de informação no meio da tarefa.

Conceitos-chave:

Fewer compactions.

O que é:

Quando compacta, o 4.8 retoma o trabalho com menos perda de qualidade.

Por que aprender:

Crucial para agentes que rodam além do limite de contexto.

Conceitos-chave:

Better compaction recovery.

O que é:

O 4.8 aciona ferramentas de forma mais confiável, pulando menos chamadas necessárias.

Por que aprender:

Ferramentas puladas quebram fluxos de agente.

Conceitos-chave:

Tool triggering with fewer skipped calls.

O que é:

A Anthropic afirma comportamento mais previsível, com menor variância e menos revisões.

Por que aprender:

Menos revisão = mais automação confiável.

Conceitos-chave:

"Lower output variance and fewer review cycles".

O que é:

Segundo a Anthropic, é ~4x menos provável que deixe passar falhas no próprio código que o antecessor.

Por que aprender:

Autorrevisão reduz bugs em pipelines autônomos.

Conceitos-chave:

~4x menos falhas não detectadas (auto-reportado).

Ver Completo
1.6~30 min

✏️ Exercícios da Trilha 1

Questões com gabarito e desafios práticos para fixar as capacidades do 4.8.

O que é:

Múltipla escolha sobre data, model ID, posicionamento e família 4.x.

Por que aprender:

Verifica retenção dos fatos básicos antes de avançar.

Conceitos-chave:

Gabarito comentado ao final de cada questão.

O que é:

Afirmações verdadeiro/falso sobre quando o modelo pensa mais.

Por que aprender:

Treina a intuição de custo/latência.

Conceitos-chave:

Justificativa para cada V/F.

O que é:

Estime o custo de encher 500k tokens de contexto com e sem cache.

Por que aprender:

Conecta 1M de contexto com preço real.

Conceitos-chave:

Resolução passo a passo no gabarito.

O que é:

Para 5 tarefas dadas, escolha o nível de esforço ideal.

Por que aprender:

Aplica a heurística padrão→exceção.

Conceitos-chave:

Gabarito com justificativa por caso.

O que é:

Faça uma chamada ao claude-opus-4-8 e observe o comportamento adaptativo.

Por que aprender:

Transforma teoria em experiência real.

Conceitos-chave:

Roteiro passo a passo + critério de sucesso.

O que é:

Checklist do que você deveria conseguir explicar ao fim da trilha.

Por que aprender:

Identifica lacunas antes da Trilha 2.

Conceitos-chave:

Autodiagnóstico orientado a objetivos.

Ver Completo
1.7~20 min

📋 Prompts prontos da Trilha 1

Prompts copiáveis para explorar as capacidades do Opus 4.8.

O que é:

Prompt para revisar um repositório inteiro colado no contexto.

Por que aprender:

Aproveita o contexto de 1M sem chunking.

Conceitos-chave:

Prompt copiável na página completa.

O que é:

Prompt que pede raciocínio passo a passo explícito para problemas difíceis.

Por que aprender:

Mostra como guiar o esforço via instrução.

Conceitos-chave:

Combine com o nível Extra/Max.

O que é:

Esqueleto de prompt para uma tarefa de longo horizonte com checkpoints.

Por que aprender:

Estrutura tarefas longas para o 4.8.

Conceitos-chave:

Objetivo + restrições + critério de parada.

O que é:

Prompt que orienta quando chamar ferramentas e quando não.

Por que aprender:

Reduz chamadas puladas ou excessivas.

Conceitos-chave:

Regras claras de acionamento.

O que é:

Prompt que pede ao modelo revisar criticamente o próprio output.

Por que aprender:

Explora o ganho de ~4x menos falhas não detectadas.

Conceitos-chave:

Gerar → criticar → corrigir.

O que é:

Prompt para resumir documentos longos preservando citações.

Por que aprender:

Caso clássico de contexto grande.

Conceitos-chave:

Fidelidade + rastreabilidade.

Ver Completo
← Início do curso Trilha 2: O que mudou →