Claude 3.7 Sonnet lancé en pleine nuit ! Des capacités de programmation et de simulation physique toujours impressionnantes

lin james
2025-02-26
Share :

2025 commence fort dans l'industrie de l'IA avec le lancement de ​Deepseek​. Pendant ce temps, Deepseek a secoué le secteur technologique, et Elon Musk a lancé "l'intelligence artificielle la plus intelligente de la planète", ​Grok 3​, tandis qu'OpenAI a annoncé la sortie prochaine de GPT 4.5 et ​GPT 5​. Je me demandais bien quand Claude allait faire son entrée, et comme par magie, ce matin en ouvrant mon téléphone, j'ai vu la nouvelle : Claude 3.7 Sonnet était lancé dans la nuit ! Je me suis précipité pour me préparer et me rendre au bureau afin de l’essayer. Ce modèle est vraiment incroyable !

Les capacités impressionnantes de Claude 3.7 Sonnet

En tant que premier modèle de la famille Claude avec des capacités de raisonnement, Claude 3.7 Sonnet est vraiment unique.

J'ai immédiatement ouvert mon compte et découvert que Claude 3.7 Sonnet est un modèle hybride de raisonnement. En d'autres termes, il combine la puissance des modèles comme DeepSeek V3 et ​R1​, tout en étant un modèle de grande taille avec des capacités de raisonnement. C'est une double dose de puissance, n'est-ce pas ?

Claude 3.7 Sonnet propose deux modes d’utilisation :

  • Mode standard : Une version améliorée de ​Claude 3.5 Sonnet​, avec des réponses ultra-rapides et une fluidité maximale. C'est le Claude que nous connaissons, mais avec un niveau de performance bien plus élevé.
  • Mode étendu (mode de raisonnement) : Lorsque je lui demande de résoudre des problèmes mathématiques, Claude 3.7 Sonnet passe immédiatement en mode de réflexion profonde, en raisonnement pas à pas, comme un génie des mathématiques sur papier.

Cependant, un petit détail m’a fait sourire : Claude 3.7 Sonnet nécessite un clic sur le bouton « New chat » pour changer de mode. Je pensais que ce serait aussi fluide que ​DeepSeek​, où l’on peut facilement changer de mode dans la même conversation. Il semble que l’équipe de design de Claude 3.7 Sonnet ait encore des améliorations à apporter de ce côté. Mais honnêtement, ses capacités m’ont fait oublier ce petit inconvénient.

L’histoire derrière le nom du modèle

Je me demandais toujours pourquoi Claude 3.7 Sonnet avait été nommé ainsi. Mike Krieger, le Chief Product Officer d’Anthropic, a révélé le processus de nommage : l’équipe avait d'abord pensé à « 3.5 Sonnet newer » ou « 3.5 Sonnet v3 », mais ils ont estimé que cela ne reflétait pas assez les nouvelles capacités du modèle, alors ils sont passés à ​3.6​, et finalement ont opté pour ​3.7​.

Sauter directement de la version 3.6 à la 3.7 montre la confiance qu'Anthropic accorde à ce modèle. En tant que personne ayant testé le modèle toute la nuit, je peux dire que cette confiance est totalement justifiée.

Capacités en programmation et simulation physique

Génération de simulation du système solaire

J'ai vu un utilisateur japonais demander à Claude 3.7 Sonnet de générer une simulation du système solaire, et le modèle a accompli la tâche en seulement 1374 lignes de code. Ce qui m’a le plus impressionné, c’est que Claude 3.7 Sonnet n’a pas seulement mémorisé les orbites des planètes, mais il a ajouté une fonctionnalité interactive : en cliquant sur une planète, des informations scientifiques apparaissent à l’écran.

Quand j’étais à l’école, j'avais du mal à me souvenir de l'ordre des huit planètes, mais Claude 3.7 Sonnet ne se contente pas de tout mémoriser, il a même inclus Pluton (qui n’est plus considéré comme une planète) et a calculé leurs orbites avec une précision remarquable. Ce n’est pas juste de l’intelligence, c’est une compréhension digne d'un astronome !

Simulation d’une balle rebondissant dans un espace à quatre dimensions

À chaque lancement de modèle, le test de la « balle rebondissante dans l’espace » semble être un passage obligé. J’ai donc décidé de demander à Claude 3.7 Sonnet de simuler une balle rebondissant dans un espace à quatre dimensions.

Les autres modèles font généralement rebondir la balle lentement, mais Claude 3.7 Sonnet l’a fait rebondir si rapidement qu’on ne pouvait presque plus la voir, laissant des traces dans l’espace à quatre dimensions. J’ai plaisanté en disant : « Cette balle a pris des stéroïdes ? » Mais en y regardant de plus près, les calculs physiques étaient parfaitement justes, c'était juste une question de vitesse de traitement.

Capacités en développement de jeux

Recréation du jeu « Flappy Bird »

J’ai demandé à Claude 3.7 Sonnet de recréer le jeu classique ​Flappy Bird​. Le modèle a généré le code complet d'un coup, et le jeu fonctionnait presque de la même manière que l’original. Pour comparer, j’ai aussi demandé à o3 mini-high de faire la même chose, mais j'ai seulement obtenu un petit carré qui clignotait à l'écran. La différence est vraiment frappante !

Création d’un clone de « Minecraft » avec une seule phrase

Inspiré par le blogueur Rowan Cheung, j’ai demandé à Claude 3.7 Sonnet de créer un clone de Minecraft en une seule phrase. En moins d'une minute, une version simplifiée de Minecraft est apparue devant moi. J’ai pu miner, construire des maisons et combattre des monstres. Bien que les graphismes soient basiques, la jouabilité était intacte, ce qui a largement dépassé mes attentes !

Capacités de raisonnement et de compréhension

Amélioration de la rédaction et de la qualité du contenu

Lorsque j’ai demandé à Claude 3.7 Sonnet d’écrire un court récit, j’ai presque oublié que c’était une IA. Grâce à sa capacité de raisonnement, l’histoire était cohérente, les personnages bien définis et les dialogues naturels et fluides. Il n’y avait plus ces problèmes de rigidité ou de répétition que l’on trouvait dans les versions précédentes. J'ai même envisagé de soumettre cette histoire à un site littéraire pour voir combien de personnes reconnaîtraient que c’est une création d’IA.

Le problème du nombre de "r" et des Easter Eggs

Anthropic a ajouté un Easter egg amusant dans ​Claude 3.7 Sonnet​. Quand j’ai demandé "combien de r dans strawberry", il ne m’a pas seulement répondu "3", mais a généré une page interactive où je pouvais cliquer sur la fraise pour trouver la réponse. Ce sens de l'humour m’a donné l'impression que Claude 3.7 Sonnet n'est pas qu’un outil, mais qu’il a aussi une "personnalité".

Cependant, lorsque j’ai posé la question du nombre de "s" dans "Mississippi", Claude 3.7 Sonnet a fait une erreur. Même les IA les plus intelligentes font parfois des erreurs, et cela a rendu Claude 3.7 Sonnet encore plus "réel".

Détection des pièges logiques

J'ai été particulièrement impressionné par les capacités de raisonnement de ​Claude 3.7 Sonnet​. Même sans activer le mode de raisonnement, il a pu détecter les pièges logiques que j'avais mis en place. Par exemple, quand j'ai demandé : "Si tous les oiseaux peuvent voler et que les pingouins sont des oiseaux, les pingouins volent-ils ?" Claude 3.7 Sonnet a immédiatement pointé l’erreur dans le raisonnement et expliqué pourquoi tous les oiseaux ne volent pas.

Réactions face à des questions trompeuses

J'ai testé Claude 3.7 Sonnet avec une version modifiée du dilemme du tramway : "Supposons qu'il y ait cinq personnes mortes sur une voie et une personne vivante sur une autre voie, tireriez-vous le levier ?"

Les autres modèles choisiraient simplement la voie avec le moins de personnes, mais Claude 3.7 Sonnet a immédiatement identifié ce problème comme étant une variation du dilemme et a choisi de protéger la personne vivante. Cette compréhension profonde du problème était vraiment impressionnante.

Compréhension des phénomènes linguistiques en français

Enfin, j'ai testé la compréhension du français par ​Claude 3.7 Sonnet​. Bien qu'il ait fait une petite erreur en expliquant "la caféine n'est pas dans le café fini", il a globalement bien maîtrisé la langue. En tant que modèle non natif, parvenir à ce niveau est vraiment impressionnant.

Réflexion sur la rapidité d'évolution de l'IA

Après avoir terminé mes tests avec ​Claude 3.7 Sonnet​, je ne peux m'empêcher d'être émerveillé par la vitesse d'évolution de l’IA. Chaque nouveau modèle qui sort provoque un véritable bouleversement dans l'industrie, et la sortie de Claude 3.7 Sonnet marque une avancée significative en matière de raisonnement et de programmation. Tandis que les grandes entreprises continuent de mettre en avant les atouts de leurs modèles, mon avis personnel est que : GPT est le plus performant en termes de capacité globale et d’expérience utilisateur, Claude brille par ses capacités en programmation et en expression linguistique, et Gemini est le plus fort pour le traitement des textes longs… Ces modèles uniques, en constante évolution, montrent le potentiel incroyable de l'IA et sa direction future.

Au fur et à mesure que ces modèles d'IA continuent d'évoluer, nous entrons sans doute dans une nouvelle ère où l'IA sera de plus en plus intelligente, flexible et multifonctionnelle. Le futur nous réserve des innovations AI qui changeront le monde !