Desenvolvedores devem revisar código gerado por IA, mas Claude desafia essa perspectiva
A Anthropic inova ao automatizar a revisão de código gerado por IA.
A ascensão da inteligência artificial generativa no desenvolvimento de software trouxe uma nova dinâmica ao setor. A prática de programação intuitiva, que permite que desenvolvedores forneçam instruções em linguagem natural para a geração de código, acelerou a produção nas empresas. A Anthropic, uma das líderes nesse campo, reporta um aumento de 200% na quantidade de código gerado por seus engenheiros no último ano.
No entanto, essa explosão de código trouxe um desafio significativo: a revisão se tornou o principal gargalo do processo. Os desenvolvedores humanos estão sobrecarregados e muitas solicitações de pull são tratadas de forma superficial, resultando em uma revisão inadequada.
O que a Anthropic fez
Para enfrentar esse desafio, a Anthropic lançou o Code Review, uma ferramenta integrada ao Claude Code. Essa inovação permite que uma equipe de agentes de IA revise automaticamente o código assim que uma solicitação de pull request é aberta. A ferramenta já está disponível em versão prévia para clientes dos planos Team e Enterprise.
Segundo Cat Wu, gerente de produto da Anthropic, a demanda por soluções que garantam uma revisão eficiente do crescente número de solicitações de pull request se tornou uma constante entre os gerentes técnicos de seus clientes.
Como funciona por dentro
Os agentes de IA operam de maneira autônoma e em paralelo, analisando o código sob diferentes ângulos assim que uma solicitação de pull request é recebida. Um agente final agrega e prioriza os problemas identificados, eliminando duplicatas e organizando-os por gravidade.
Os resultados são apresentados ao desenvolvedor por meio de um comentário destacado, incluindo observações adicionais sobre bugs específicos. O foco da ferramenta está em erros lógicos, evitando problemas de estilo para reduzir o ruído no feedback. Os problemas são categorizados por cores: vermelho para críticos, amarelo para atenção e roxo para questões relacionadas ao código existente.
Números
Antes da implementação do Code Review, apenas 16% das solicitações de pull request recebiam feedback significativo. Com a nova ferramenta, essa taxa saltou para 54%. Em solicitações maiores, com mais de 1.000 linhas de código modificadas, 84% apresentaram resultados, com uma média de 7,5 problemas detectados. Menos de 1% desses resultados foram considerados incorretos pelos engenheiros.
Um caso notável envolveu uma alteração aparentemente simples que foi sinalizada como crítica pelo Code Review, pois poderia comprometer a autenticação do serviço. Esse erro foi corrigido antes da integração, e o engenheiro admitiu que não o teria identificado sem a ajuda da ferramenta.
O novo papel do programador
Nos últimos anos, a expectativa era que os desenvolvedores se tornassem mais como revisores ou supervisores do código gerado por IA. Com a introdução do Code Review, essa transição também está sendo automatizada, pelo menos em parte. Embora a ferramenta não substitua os humanos, ela transforma o papel do programador de revisor para árbitro final.
Preço
A ferramenta não é acessível a todos. O custo de cada revisão é baseado no consumo de tokens, com uma estimativa de preços variando de US$ 15 a US$ 25 (entre R$ 77 e R$ 129), dependendo da complexidade do código. A empresa justifica esse investimento considerando os altos custos que erros não detectados podem acarretar em grandes empresas de tecnologia.
