Kimi Code é oito vezes mais barato que Claude Code e desempenha 75% das funções necessárias, mas será que isso é suficiente

Compartilhe essa Informação

Moonshot AI lança Kimi K2.6, um novo modelo de aprendizado de máquina com preços competitivos.

Recentemente, a empresa chinesa Moonshot AI apresentou o Kimi K2.6, um novo modelo de lógica de aprendizado de máquina (LLM) que se junta à disputa com modelos renomados como Gemini, GPT e Claude. Além de suas capacidades técnicas, o Kimi K2.6 se destaca por oferecer preços muito acessíveis.

Em um lançamento anterior, a empresa também disponibilizou o Kimi Code, um agente de programação de IA que compete diretamente com o Gemini CLI, Codex e Claude Code. A dúvida que surge é se a combinação do Kimi Code com o Kimi K2.6 pode realmente rivalizar com a popular dupla Claude Code/Opus 4.7. A resposta a essa questão é multifacetada.

Um ótimo modelo (mas não perfeito)

O Kimi K2.6 é um modelo de pesos abertos que conta com um trilhão de parâmetros, dos quais 32 bilhões estão ativos, utilizando a arquitetura Mixture-of-Experts. Seu desempenho em benchmarks sintéticos é notável, apresentando resultados impressionantes quando comparado ao GPT-5.4 e ao Opus 4.6.

Até 8 vezes mais barato que o Opus 4.6

Os planos de assinatura do Kimi K2.6 são similares aos oferecidos pelo Claude Pro ou ChatGPT Plus, além de permitir uso via API. O preço é de US$ 0,60 por milhão de tokens de entrada e US$ 4 por milhão de tokens de saída. Em contrapartida, o Claude Opus 4.6 custa US$ 5 por milhão de tokens de entrada e US$ 25 para saída, representando uma diferença significativa de até oito vezes.

A magia do enxame de agentes de IA

O funcionamento do Claude Code é sequencial, analisando problemas e tomando decisões passo a passo. Em contraste, o Kimi Code adota uma abordagem inovadora, onde um “agente mestre” divide a tarefa em subtarefas independentes, permitindo a execução de até 300 “subagentes” em paralelo, coordenando até 4 mil etapas simultaneamente.

É melhor ter muitos trabalhando juntos do que apenas um?

Esse conceito, denominado “enxame de agentes”, é totalmente aproveitado no Kimi Code e pode ser ativado na versão gratuita disponível. O Kimi K2.5 permitia a execução de 100 subagentes e 1,5 mil etapas, mostrando um avanço significativo com o Kimi K2.6. Em testes internos, a Moonshot demonstrou que esses enxames conseguiram melhorar o desempenho médio em 185% ao trabalhar em um mecanismo financeiro de código aberto.

Além dos benchmarks

A Kilo.ai, que desenvolve ferramentas como o Kilo Code e o Kilo CLI, conduziu uma avaliação comparativa entre o Claude Opus 4.7 e o Kimi K2.6. Ambos os modelos foram solicitados a criar uma API complexa, e a comparação focou exclusivamente nos modelos em si.

Kimi foi mais barato, mas também apresentou mais falhas

O Claude Opus 4.7 completou a tarefa em 20 minutos, custando US$ 3,56, enquanto o Kimi K2.6, apesar de levar mais tempo, teve um custo de apenas US$ 0,67, cinco vezes menos. No entanto, o Kimi apresentou mais falhas durante a execução.

Kimi fez 75% do que Claude fez, a um custo 19% menor

Ambos os modelos acreditavam ter cumprido a tarefa corretamente, mas uma análise revelou que o Claude cometeu um erro, enquanto o Kimi teve seis falhas de gravidade variável. As pontuações finais foram de 91 para o Opus 4.7 e 68 para o Kimi K2.6.

Duas perspectivas sobre o assunto

A pontuação sugere que o Kimi é mais barato devido ao seu desempenho inferior. No entanto, engenheiros da Kilo.ai notaram que a diferença entre modelos de empresas chinesas e os de ponta, como os da Anthropic ou OpenAI, está diminuindo.

“Por US$ 0,67 e com uma revisão completa, o Kimi K2.6 é uma opção viável. Por US$

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *