Kimi Code é oito vezes mais barato que Claude Code e desempenha 75% das funções necessárias, mas será que isso é suficiente
Moonshot AI lança Kimi K2.6, um novo modelo de aprendizado de máquina com preços competitivos.
Recentemente, a empresa chinesa Moonshot AI apresentou o Kimi K2.6, um novo modelo de lógica de aprendizado de máquina (LLM) que se junta à disputa com modelos renomados como Gemini, GPT e Claude. Além de suas capacidades técnicas, o Kimi K2.6 se destaca por oferecer preços muito acessíveis.
Em um lançamento anterior, a empresa também disponibilizou o Kimi Code, um agente de programação de IA que compete diretamente com o Gemini CLI, Codex e Claude Code. A dúvida que surge é se a combinação do Kimi Code com o Kimi K2.6 pode realmente rivalizar com a popular dupla Claude Code/Opus 4.7. A resposta a essa questão é multifacetada.
Um ótimo modelo (mas não perfeito)
O Kimi K2.6 é um modelo de pesos abertos que conta com um trilhão de parâmetros, dos quais 32 bilhões estão ativos, utilizando a arquitetura Mixture-of-Experts. Seu desempenho em benchmarks sintéticos é notável, apresentando resultados impressionantes quando comparado ao GPT-5.4 e ao Opus 4.6.
Até 8 vezes mais barato que o Opus 4.6
Os planos de assinatura do Kimi K2.6 são similares aos oferecidos pelo Claude Pro ou ChatGPT Plus, além de permitir uso via API. O preço é de US$ 0,60 por milhão de tokens de entrada e US$ 4 por milhão de tokens de saída. Em contrapartida, o Claude Opus 4.6 custa US$ 5 por milhão de tokens de entrada e US$ 25 para saída, representando uma diferença significativa de até oito vezes.
A magia do enxame de agentes de IA
O funcionamento do Claude Code é sequencial, analisando problemas e tomando decisões passo a passo. Em contraste, o Kimi Code adota uma abordagem inovadora, onde um “agente mestre” divide a tarefa em subtarefas independentes, permitindo a execução de até 300 “subagentes” em paralelo, coordenando até 4 mil etapas simultaneamente.
É melhor ter muitos trabalhando juntos do que apenas um?
Esse conceito, denominado “enxame de agentes”, é totalmente aproveitado no Kimi Code e pode ser ativado na versão gratuita disponível. O Kimi K2.5 permitia a execução de 100 subagentes e 1,5 mil etapas, mostrando um avanço significativo com o Kimi K2.6. Em testes internos, a Moonshot demonstrou que esses enxames conseguiram melhorar o desempenho médio em 185% ao trabalhar em um mecanismo financeiro de código aberto.
Além dos benchmarks
A Kilo.ai, que desenvolve ferramentas como o Kilo Code e o Kilo CLI, conduziu uma avaliação comparativa entre o Claude Opus 4.7 e o Kimi K2.6. Ambos os modelos foram solicitados a criar uma API complexa, e a comparação focou exclusivamente nos modelos em si.
Kimi foi mais barato, mas também apresentou mais falhas
O Claude Opus 4.7 completou a tarefa em 20 minutos, custando US$ 3,56, enquanto o Kimi K2.6, apesar de levar mais tempo, teve um custo de apenas US$ 0,67, cinco vezes menos. No entanto, o Kimi apresentou mais falhas durante a execução.
Kimi fez 75% do que Claude fez, a um custo 19% menor
Ambos os modelos acreditavam ter cumprido a tarefa corretamente, mas uma análise revelou que o Claude cometeu um erro, enquanto o Kimi teve seis falhas de gravidade variável. As pontuações finais foram de 91 para o Opus 4.7 e 68 para o Kimi K2.6.
Duas perspectivas sobre o assunto
A pontuação sugere que o Kimi é mais barato devido ao seu desempenho inferior. No entanto, engenheiros da Kilo.ai notaram que a diferença entre modelos de empresas chinesas e os de ponta, como os da Anthropic ou OpenAI, está diminuindo.
“Por US$ 0,67 e com uma revisão completa, o Kimi K2.6 é uma opção viável. Por US$
