Módulo 1.5 · Coding de longo horizonte

⏱️ O que é "longo horizonte"

"Longo horizonte" são tarefas autônomas que duram horas de operação independente — não um único turno de pergunta-resposta.

🎯 Nas palavras da Anthropic

O 4.8 é posicionado para "multi-stage autonomous tasks that span hours of independent operation" — o tipo de carga que antes exigia supervisão humana constante.

🗜️ Menos compactações

Durante sessões longas, o 4.8 precisa compactar o contexto menos vezes — preservando mais informação ao longo da tarefa.

📊 Por que importa

•Cada compactação é uma chance de perder contexto
•Menos compactações = mais continuidade

♻️ Recuperação após compactar

Quando a compactação acontece, o 4.8 retoma o trabalho com menos perda de qualidade ("better compaction recovery").

💡 Dica prática

Em agentes que rodam além do limite de contexto, a recuperação após compactar é o que separa "continuou a tarefa" de "esqueceu o que estava fazendo".

🔧 Tool triggering confiável

O 4.8 aciona ferramentas de forma mais confiável, pulando menos chamadas necessárias ("fewer skipped calls").

✓ Com tool triggering confiável

✓Fluxos de agente completam etapas
✓Menos intervenção manual

✗ Quando ferramentas são puladas

✗O agente "alucina" o resultado da ferramenta
✗O fluxo quebra silenciosamente

📉 Menos ciclos de revisão

A Anthropic afirma comportamento mais previsível em escala, com menor variância de saída e menos ciclos de revisão humana.

📊 O argumento

"This should lead to more predictable behavior at scale with lower output variance and fewer review cycles." Menos revisão = mais automação confiável.

Ressalva: afirmação da própria Anthropic; benchmarks independentes em escala ainda eram escassos no lançamento.

🛡️ Pega os próprios erros

Segundo a Anthropic, o 4.8 é ~4× menos provável que o antecessor de deixar passar falhas no próprio código.

🔍 Autorrevisão

"Roughly four times less likely to let flaws in its own code pass." Em pipelines autônomos, isso reduz bugs que escapariam para produção.

Explore esse ganho com o prompt de autorrevisão no módulo 1.7.

📌 Resumo do Módulo

✓

Longo horizonte — tarefas autônomas de horas.

✓

Contexto — menos compactações, melhor recuperação.

✓

Ferramentas — tool triggering mais confiável.

✓

Qualidade — ~4× menos falhas não detectadas (auto-reportado).

1.6 — Exercícios da Trilha 1

← Voltar para Trilha Próximo: Exercícios →