Em poucos dias, a OpenAI e a Anthropic lançaram seus mais recentes modelos de destaque — o GPT-4.5 e o Claude Sonnet 3.7. A competição entre os modelos está novamente intensa e emocionante.
O GPT-4.5 e o Claude Sonnet 3.7 representam duas visões distintas da inteligência artificial avançada. De um lado, prioriza-se a eficiência de custos e o desempenho simplificado; do outro, dá-se ênfase à transparência no raciocínio e às capacidades multimodais.
A OpenAI descreve o GPT-4.5 como o maior e melhor modelo de chat até o momento. O GPT-4.5 aprimora a capacidade de reconhecer padrões, estabelecer conexões e gerar ideias criativas, sem depender do raciocínio dedutivo. A interação com o GPT-4.5 parece mais natural. Sua base de conhecimento é mais ampla, sua capacidade de rastrear as intenções dos usuários é mais forte e sua "inteligência emocional" é superior, tornando o GPT-4.5 muito útil para tarefas como escrita, programação e resolução de problemas práticos.
O Claude 3.7 Sonnet mostrou melhorias significativas em codificação e desenvolvimento web front-end. O Claude 3.7 Sonnet é tanto um modelo LLM convencional quanto um modelo de raciocínio: os usuários podem escolher quando o modelo deve responder normalmente e quando deve pensar mais tempo antes de responder. No modo padrão, o Claude 3.7 Sonnet é uma versão atualizada do Claude 3.5 Sonnet. No modo de pensamento ampliado, ele faz uma auto-reflexão antes de responder, melhorando seu desempenho em tarefas de matemática, física, cumprimento de instruções, codificação e muitas outras.
Para ajudar os usuários a fazerem uma escolha melhor, vamos comparar as principais diferenças entre o Claude 3.7 Sonnet e o GPT-4.5 em termos de custo, arquitetura de contexto, velocidade e desempenho em benchmarks.
GPT-4.5: Preço de cerca de 75 USD por milhão de tokens de entrada e cerca de 150 USD por milhão de tokens de saída.
Claude 3.7: 3 USD por milhão de tokens de entrada e 15 USD por milhão de tokens de saída.
O Claude 3.7 Sonnet é, portanto, muito mais barato do que o GPT-4.5. Em comparação com o Claude 3.7 Sonnet, o preço dos tokens de entrada do GPT-4.5 é 25 vezes maior e o dos tokens de saída é 10 vezes maior. O Claude 3.7 Sonnet é tanto um modelo geral quanto um modelo de raciocínio, o que parece proporcionar uma escolha clara em termos de preços.
GPT-4.5: Um modelo de transformador em larga escala aprimorado, treinado em uma vasta quantidade de texto, oferecendo melhor alinhamento, suporte a imagens e uma janela de contexto de 128k.
Claude 3.7: Utiliza um design de "raciocínio misto" que permite alternar entre respostas rápidas e raciocínio mais profundo. Possui uma janela de contexto de 200k e otimizações específicas para codificação.
GPT-4.5: Altamente otimizado, com um tempo de resposta mais rápido do que o GPT-4, capaz de processar até 128k tokens de contexto. Está amplamente disponível através da OpenAI e Azure, facilitando o uso em grande escala.
Claude 3.7: Oferece dois modos – respostas rápidas para consultas simples ou raciocínio ampliado mais lento para questões complexas. Pode processar 200k tokens de contexto, adequado para documentos grandes.
GPT-4.5: Os scores dos testes de conhecimento (MMLU) estão em torno de 89-90%. Ele possui uma forte precisão geral e capacidade de raciocínio, embora esteja ligeiramente abaixo dos modelos especializados em tarefas avançadas de matemática e codificação.
Claude 3.7: Destaca-se na codificação (com mais de 70% em benchmarks de codificação especializados) e obtém até 96% em certos conjuntos de dados matemáticos. Seu score no MMLU é de cerca de 80%, e ele demonstra excelente desempenho em raciocínio passo a passo.
O Claude 3.7 Sonnet supera claramente o GPT-4.5 em codificação. Embora a matemática não seja o ponto forte do Claude, seu desempenho ainda é superior ao do GPT-4.5.
A XXAI integrou rapidamente o Claude 3.7 Sonnet e o Claude 3.7 Sonnet (thinking) na plataforma XXAI. Agora, a XXAI contém 15 modelos populares de IA, permitindo que você alterne entre os modelos que preferir ao usá-los. Se você deseja usar o Claude 3.7 sem restrições, talvez queira experimentar a XXAI.
A análise mostra que o GPT-4.5 é mais um ponto intermediário na evolução tecnológica do que um salto revolucionário. Embora tenha avançado na redução de alucinações e na otimização de fluxos de diálogo, sua estratégia de preços suscita amplas preocupações – o preço cerca de 75 vezes maior que o do GPT-4 não parece proporcional ao aumento real de desempenho.
Em contraste, o Claude 3.7 Sonnet estabeleceu uma posição de liderança na área de programação, com sua estrutura de preços razoável, alta eficiência e lógica de raciocínio excepcional.
O campo da IA está passando por uma rápida transformação. O GPT-4.5 pode ser apenas um ajuste tático na estratégia da OpenAI, preparando o caminho para grandes avanços tecnológicos a serem anunciados. Precisamos ficar atentos, pois inovações verdadeiramente transformadoras podem estar à espreita.