MÓDULO 1.5

🤖 Codificação agêntica de longo horizonte

O grande diferencial do 4.8: sustentar tarefas de horas com menos compactações, melhor recuperação, tool triggering confiável e autorrevisão.

6
Tópicos
35
Minutos
Inter.
Nível
Teoria
Tipo
1

⏱️ O que é "longo horizonte"

"Longo horizonte" são tarefas autônomas que duram horas de operação independente — não um único turno de pergunta-resposta.

🎯 Nas palavras da Anthropic

O 4.8 é posicionado para "multi-stage autonomous tasks that span hours of independent operation" — o tipo de carga que antes exigia supervisão humana constante.

2

🗜️ Menos compactações

Durante sessões longas, o 4.8 precisa compactar o contexto menos vezes — preservando mais informação ao longo da tarefa.

📊 Por que importa

  • Cada compactação é uma chance de perder contexto
  • Menos compactações = mais continuidade
3

♻️ Recuperação após compactar

Quando a compactação acontece, o 4.8 retoma o trabalho com menos perda de qualidade ("better compaction recovery").

💡 Dica prática

Em agentes que rodam além do limite de contexto, a recuperação após compactar é o que separa "continuou a tarefa" de "esqueceu o que estava fazendo".

4

🔧 Tool triggering confiável

O 4.8 aciona ferramentas de forma mais confiável, pulando menos chamadas necessárias ("fewer skipped calls").

✓ Com tool triggering confiável

  • Fluxos de agente completam etapas
  • Menos intervenção manual

✗ Quando ferramentas são puladas

  • O agente "alucina" o resultado da ferramenta
  • O fluxo quebra silenciosamente
5

📉 Menos ciclos de revisão

A Anthropic afirma comportamento mais previsível em escala, com menor variância de saída e menos ciclos de revisão humana.

📊 O argumento

"This should lead to more predictable behavior at scale with lower output variance and fewer review cycles." Menos revisão = mais automação confiável.

Ressalva: afirmação da própria Anthropic; benchmarks independentes em escala ainda eram escassos no lançamento.

6

🛡️ Pega os próprios erros

Segundo a Anthropic, o 4.8 é ~4× menos provável que o antecessor de deixar passar falhas no próprio código.

🔍 Autorrevisão

"Roughly four times less likely to let flaws in its own code pass." Em pipelines autônomos, isso reduz bugs que escapariam para produção.

Explore esse ganho com o prompt de autorrevisão no módulo 1.7.

📌 Resumo do Módulo

Longo horizonte — tarefas autônomas de horas.
Contexto — menos compactações, melhor recuperação.
Ferramentas — tool triggering mais confiável.
Qualidade — ~4× menos falhas não detectadas (auto-reportado).

Próximo:

1.6 — Exercícios da Trilha 1