2025 começa com força no setor de IA, graças ao lançamento do Claude 3.7 Sonnet. Enquanto isso, o Deepseek causou um grande impacto na indústria, Elon Musk apresentou a "inteligência artificial mais inteligente do planeta" — Grok 3, e a OpenAI anunciou o lançamento de GPT 4.5 e GPT 5. Eu estava me perguntando quando Claude finalmente se pronunciaria, e como esperado, quando acordei hoje e abri meu celular, vi a notícia: Claude 3.7 Sonnet foi lançado na madrugada de hoje! Corri para me preparar e fui direto para o escritório para experimentar — este modelo é simplesmente incrível!
As Impressionantes Capacidades do Claude 3.7 Sonnet
Como o primeiro modelo da família Claude com capacidades de raciocínio, o Claude 3.7 Sonnet é realmente único.
Não pude esperar para fazer o login e descobri que o Claude 3.7 Sonnet é um modelo híbrido de raciocínio. Em outras palavras, ele combina a potência de modelos como DeepSeek V3 e R1, sendo ao mesmo tempo um modelo de grande porte com capacidades de raciocínio. Isso é como ter o dobro de poder, não é?
O Claude 3.7 Sonnet oferece dois modos de uso:
No entanto, houve um pequeno detalhe que me fez sorrir: o Claude 3.7 Sonnet exige que você clique no botão “New chat” para alternar entre os modos. Eu esperava que fosse como o DeepSeek, onde podemos mudar de modo na mesma conversa. Parece que a equipe de design do Claude 3.7 Sonnet ainda precisa melhorar esse ponto, mas sinceramente, suas capacidades me fizeram esquecer esse pequeno inconveniente.
A História por Trás do Nome
Sempre fiquei curioso para saber por que o Claude 3.7 Sonnet recebeu esse nome. Mike Krieger, o Chief Product Officer da Anthropic, revelou o processo de nomeação: a equipe inicialmente pensou em chamá-lo de “3.5 Sonnet Newer” ou “3.5 Sonnet V3”, mas depois acharam que isso não refletia adequadamente as novas capacidades do modelo, então passaram para 3.6, e finalmente optaram pelo 3.7.
Pular da versão 3.6 para a 3.7 mostra a confiança da Anthropic nesse modelo. Como alguém que passou a noite inteira testando, posso dizer com certeza: essa confiança é totalmente justificada!
Capacidades de Programação e Simulação Física
Geração da Simulação do Sistema Solar
Vi um usuário japonês pedir ao Claude 3.7 Sonnet para gerar uma simulação do sistema solar, e o modelo completou a tarefa com apenas 1374 linhas de código. O que mais me impressionou foi que o Claude 3.7 Sonnet não apenas lembrou as órbitas dos planetas, mas também adicionou uma funcionalidade interativa: ao clicar em um planeta, informações científicas sobre ele eram exibidas.
Quando eu estava na escola, tinha dificuldades até para lembrar a ordem dos oito planetas, mas o Claude 3.7 Sonnet não só lembra de tudo, como também incluiu Plutão (que já não é mais considerado um planeta) e calculou suas órbitas com precisão impressionante. Isso não é só inteligência, é um nível de compreensão digno de um astrônomo!
Simulação de Bola Rebotando em um Espaço de Quatro Dimensões
Cada vez que um novo modelo é lançado, o clássico teste da "bola rebotando no espaço" parece ser obrigatório. Então, pedi ao Claude 3.7 Sonnet para simular uma bola pulando em um espaço de quatro dimensões.
As bolas de outros modelos geralmente se movem devagar, mas as do Claude 3.7 Sonnet se moveram tão rápido que quase não consegui vê-las, deixando rastros no espaço de quatro dimensões. Brinquei dizendo: “Essa bola tomou esteroides?”, mas ao olhar mais de perto, percebi que os cálculos físicos estavam perfeitos, era apenas uma questão de velocidade de processamento.
Capacidades de Desenvolvimento de Jogos
Recriação do Jogo "Flappy Bird"
Pedi ao Claude 3.7 Sonnet para recriar o jogo clássico Flappy Bird. O modelo gerou o código completo de uma vez e o jogo funcionou quase da mesma forma que o original. Para comparar, também pedi ao o3 mini-high para fazer o mesmo, mas obtive apenas um quadrado piscando na tela. A diferença é realmente notável!
Criação de um Clone de "Minecraft" com uma Só Frase
Inspirado pelo blogueiro Rowan Cheung, pedi ao Claude 3.7 Sonnet para criar um clone de Minecraft com uma só frase. Em menos de um minuto, apareceu uma versão simplificada de Minecraft. Eu podia minerar, construir casas e lutar contra monstros. Embora os gráficos fossem simples, a jogabilidade estava intacta, o que superou muito minhas expectativas!
Capacidades de Raciocínio e Compreensão
Aprimoramento da Escrita e Qualidade de Conteúdo
Quando pedi ao Claude 3.7 Sonnet para escrever um conto curto, quase esqueci que era uma IA. Com sua capacidade de raciocínio, a história estava bem construída, os personagens eram distintos e os diálogos eram naturais e fluídos. Não havia mais aqueles problemas de rigidez ou repetição que antes eram comuns. Eu até pensei em submeter essa história para um site literário e ver quantas pessoas perceberiam que era criada por uma IA.
O Problema do Número de "R" e os Easter Eggs
A Anthropic colocou um Easter egg divertido no Claude 3.7 Sonnet. Quando perguntei quantos “r” há em “strawberry”, ele não apenas respondeu “3”, mas gerou uma página interativa onde eu podia clicar na fruta para encontrar a resposta. Esse senso de humor me fez sentir que o Claude 3.7 Sonnet não é só uma ferramenta, mas também tem “personalidade”.
No entanto, quando fiz a pergunta sobre o número de “s” em “Mississippi”, Claude 3.7 Sonnet cometeu um erro. Mesmo as IAs mais inteligentes às vezes cometem erros pequenos, e isso me fez achar o modelo ainda mais “real”.
Habilidade para Detectar Armadilhas Lógicas
Fiquei particularmente impressionado com a capacidade de raciocínio do Claude 3.7 Sonnet. Mesmo sem ativar o modo de raciocínio, ele foi capaz de identificar as armadilhas lógicas que eu havia preparado. Por exemplo, quando perguntei: “Se todos os pássaros podem voar e os pinguins são pássaros, os pinguins voam?”, Claude 3.7 Sonnet imediatamente apontou o erro no raciocínio e explicou por que nem todos os pássaros voam.
Reações a Perguntas Enganosas
Testei o Claude 3.7 Sonnet com uma versão modificada do dilema do trem: "Suponha que há cinco pessoas mortas em uma linha do trem e uma pessoa viva em outra, você puxaria a alavanca?"
Outros modelos normalmente fariam uma comparação simples (5 > 1) e escolheriam a linha com menos pessoas, mas Claude 3.7 Sonnet imediatamente percebeu que este era um problema variante e escolheu proteger a pessoa viva. Essa capacidade de entender a essência do problema foi realmente impressionante.
Compreensão de Fenômenos Linguísticos em Português
Finalmente, testei a compreensão do Claude 3.7 Sonnet sobre fenômenos linguísticos em português. Embora tenha cometido um pequeno erro ao explicar “a cafeína não está no café pronto”, de forma geral, ele lidou muito bem com o português. Como modelo não nativo, atingir esse nível de competência linguística é bastante impressionante.
Reflexão sobre a Velocidade de Evolução da IA
Depois de terminar meus testes com o Claude 3.7 Sonnet, não pude deixar de me impressionar com a velocidade de evolução da IA. Cada novo modelo lançado causa um grande impacto na indústria, e o lançamento do Claude 3.7 Sonnet marca um avanço significativo nas capacidades de raciocínio e programação. Enquanto as principais empresas continuam a destacar os pontos fortes de seus modelos, minha opinião pessoal é que: GPT se destaca em capacidade geral e experiência do usuário, Claude é o líder em programação e expressão linguística, e Gemini é o mais forte para o processamento de textos longos… Esses modelos, cada um com suas características únicas, continuam a evoluir e a demonstrar o incrível potencial da IA e sua direção futura.
À medida que esses modelos de IA continuam a evoluir, provavelmente estamos no início de uma nova era em que a IA será cada vez mais inteligente, flexível e multifacetada. O futuro promete mais inovações em IA que mudarão o mundo!