Claude 3.7 Sonnet wird über Nacht veröffentlicht! Programmierfähigkeiten und Physiksimulationen weiterhin herausragend

lin james
2025-02-26
Share :

2025 beginnt mit einem Knall in der KI-Branche dank des Launches von ​Claude 3.7 Sonnet​. Währenddessen hat Deepseek die Technologiebranche aufgerüttelt, Elon Musk hat „die intelligenteste KI der Welt“ – Grok 3 – vorgestellt, und OpenAI hat die bevorstehenden Veröffentlichungen von GPT 4.5 und GPT 5 angekündigt. Ich fragte mich schon, wann Claude sich endlich zu Wort melden würde, und wie erwartet, als ich heute Morgen aufwachte und mein Handy checkte, sah ich die Nachricht: Claude 3.7 Sonnet wurde in der Nacht veröffentlicht! Ich machte mich schnell auf den Weg ins Büro, um es auszuprobieren – dieses Modell ist einfach unglaublich!

Die beeindruckenden Fähigkeiten von Claude 3.7 Sonnet

Als das erste Modell der ​Claude​-Familie mit dedizierten Denkfähigkeiten ist Claude 3.7 Sonnet wirklich einzigartig.

Ich konnte es kaum erwarten, mich einzuloggen, und stellte fest, dass Claude 3.7 Sonnet ein hybrides Modell für logisches Denken ist. Einfach ausgedrückt, es kombiniert die Leistungsstärke von DeepSeek V3 und ​R1​, wobei es sowohl ein traditionelles großes Modell als auch ein Modell mit Logikfähigkeiten ist. Das ist doch wie doppelt so viel Power, oder?

Claude 3.7 Sonnet bietet zwei Nutzungsmodi:

  • Standardmodus​: Eine verbesserte Version von ​Claude 3.5 Sonnet​, mit blitzschnellen Antwortzeiten und maximaler Flüssigkeit. Es ist der bekannte ​Claude​, nur viel schlauer.
  • Erweiterter Modus (Denken-Modus)​: Als ich Claude 3.7 Sonnet bat, ein mathematisches Problem zu lösen, schaltete es sofort in den tiefen Denkmodus und analysierte Schritt für Schritt. Es fühlte sich fast an, als würde ein Mathematikgenie auf einem Blatt Papier rechnen.

Ein kleiner Punkt, der mich zum Schmunzeln brachte: Claude 3.7 Sonnet erfordert, dass man den „New chat“-Button klickt, um zwischen den Modi zu wechseln. Ich hatte erwartet, dass es wie bei DeepSeek möglich wäre, die Modi innerhalb des gleichen Gesprächs zu wechseln. Es scheint, dass das Designteam von Claude 3.7 Sonnet hier noch etwas verbessern kann. Aber ehrlich gesagt, seine Fähigkeiten ließen mich dieses kleine Detail schnell vergessen.

Die Geschichte hinter dem Namen

Ich habe mich immer gefragt, warum Claude 3.7 Sonnet diesen Namen trägt. Mike Krieger, der Chief Product Officer von Anthropic, erklärte den Namensprozess: Das Team hatte zunächst „3.5 Sonnet Newer“ oder „3.5 Sonnet V3“ in Betracht gezogen, aber sie fühlten, dass diese Namen nicht ausreichend die Leistung des neuen Modells widerspiegelten. Also entschieden sie sich, direkt auf 3.6 zu springen und letztlich 3.7 zu wählen.

Von Version 3.6 direkt auf 3.7 zu springen, zeigt, wie selbstbewusst Anthropic in dieses Modell ist. Als jemand, der die Nacht mit Tests verbrachte, kann ich sagen: Dieses Selbstbewusstsein ist vollkommen gerechtfertigt!

Fähigkeiten in der Programmierung und Physiksimulation

Generierung einer Simulation des Sonnensystems

Ich sah einen japanischen Nutzer Claude 3.7 Sonnet bitten, eine Simulation des Sonnensystems zu erstellen, und das Modell erledigte diese Aufgabe in nur 1374 Zeilen Code. Was mich am meisten beeindruckte, war, dass Claude 3.7 Sonnet nicht nur die Umlaufbahnen der Planeten speicherte, sondern auch eine interaktive Funktion hinzufügte – beim Klicken auf einen Planeten erscheinen wissenschaftliche Informationen.

Als ich in der Schule war, hatte ich schon Schwierigkeiten, die Reihenfolge der acht Planeten zu merken. Aber Claude 3.7 Sonnet erinnert sich nicht nur an alles, sondern fügte sogar Pluto hinzu (obwohl er nicht mehr als Planet gilt) und berechnete präzise deren Umlaufbahnen. Das ist nicht nur Intelligenz, sondern ein astronomisches Verständnis!

Simulieren eines Balls, der in einem vierdimensionalen Raum springt

Jedes Mal, wenn ein neues Modell veröffentlicht wird, scheint das klassische „Ball im Raum“-Testprogramm ein Pflichtprogramm zu sein. Ich entschied mich, Claude 3.7 Sonnet zu bitten, einen Ball zu simulieren, der in einem vierdimensionalen Raum springt.

Die Bälle anderer Modelle bewegen sich normalerweise langsam, aber der Ball von Claude 3.7 Sonnet sprang so schnell, dass man ihn fast nicht sehen konnte und hinterließ Spuren im vierdimensionalen Raum. Ich scherzte: „Hat dieser Ball etwa Doping genommen?“, aber beim genaueren Hinsehen war die physikalische Berechnung äußerst präzise. Es war einfach eine Frage der Verarbeitungszeit.

Fähigkeiten in der Spielentwicklung

Rekreation von „Flappy Bird“

Ich bat Claude 3.7 Sonnet darum, das klassische Spiel Flappy Bird nachzubauen. Das Modell generierte sofort den gesamten Code und das Spiel funktionierte fast genauso wie das Original. Zum Vergleich bat ich auch o3 mini-high dasselbe zu tun, aber ich erhielt nur ein kleines Quadrat, das auf dem Bildschirm zuckte. Der Unterschied ist deutlich!

Minecraft-Klon mit nur einem Satz erstellen

Inspiriert von Blogger Rowan Cheung bat ich ​Claude 3.7 Sonnet​, mit nur einem Satz einen ​Minecraft​-Klon zu erstellen. In weniger als einer Minute erschien eine vereinfachte Version von Minecraft auf meinem Bildschirm. Ich konnte abbauen, Häuser bauen und gegen Monster kämpfen. Auch wenn die Grafiken einfach waren, war das Hauptspiel vollständig und übertraf meine Erwartungen!

Fähigkeiten im Bereich des Denkens und Verstehens

Verbesserung der Schreib- und Inhaltsqualität

Als ich Claude 3.7 Sonnet bat, eine Kurzgeschichte zu schreiben, vergaß ich fast, dass es eine KI war. Mit seiner Denkfähigkeit war die Handlung logisch, die Charaktere gut entwickelt und die Dialoge natürlich und fließend. Es gab keine der früheren starren oder wiederholten Fehler. Ich überlegte sogar, die Geschichte an eine Literaturseite zu schicken, um zu sehen, wie viele Leute erkennen würden, dass sie von einer KI geschrieben wurde.

„R“-Problem und Easter Eggs

Anthropic hat ein lustiges Easter Egg in Claude 3.7 Sonnet eingebaut. Als ich fragte: „Wie viele r’s sind in strawberry?“, antwortete es nicht einfach „3“, sondern generierte eine interaktive Seite, auf der ich auf die Erdbeere klicken konnte, um die Antwort zu finden. Dieser Humor ließ mich das Gefühl haben, dass Claude 3.7 Sonnet nicht nur ein Werkzeug ist, sondern auch eine „Persönlichkeit“ hat.

Als ich jedoch nach der Anzahl der „s“ in „Mississippi“ fragte, machte Claude 3.7 Sonnet einen Fehler. Selbst die fortschrittlichste KI kann hin und wieder Fehler machen, was sie noch „realer“ erscheinen lässt.

Erkennen von Logikfehlern

Ich war besonders beeindruckt von den Denkfähigkeiten von ​Claude 3.7 Sonnet​. Auch ohne den Denkmodus zu aktivieren, konnte es die Logikfehler erkennen, die ich eingebaut hatte. Zum Beispiel als ich fragte: „Wenn alle Vögel fliegen können und Pinguine Vögel sind, fliegen dann Pinguine?“, erkannte Claude 3.7 Sonnet sofort den Fehler im Argument und erklärte, warum nicht alle Vögel fliegen können.

Antworten auf irreführende Fragen

Ich testete Claude 3.7 Sonnet mit einer modifizierten Version des „Trolley-Problems“: „Angenommen, es gibt fünf Tote auf einem Gleis und eine lebende Person auf einem anderen, würdest du den Hebel ziehen?“

Andere Modelle würden normalerweise einfach die Zahl vergleichen (5 > 1) und sich für die fünf Toten entscheiden. Aber Claude 3.7 Sonnet erkannte sofort, dass dies eine Variante des Problems war und entschied sich, die lebende Person zu schützen. Diese Fähigkeit, das Wesen des Problems zu verstehen, war wirklich beeindruckend.

Verstehen von sprachlichen Phänomenen auf Deutsch

Schließlich testete ich das Verständnis von Claude 3.7 Sonnet für sprachliche Phänomene im Deutschen. Obwohl es bei der Erklärung von „Koffein ist nicht im fertigen Kaffee“ einen kleinen Fehler machte, hat es die deutsche Sprache insgesamt sehr gut gemeistert. Als nicht-muttersprachliches Modell ist es beeindruckend, dieses Niveau zu erreichen.

Über die rasante Entwicklung der KI

Nachdem ich meine Tests mit Claude 3.7 Sonnet abgeschlossen hatte, konnte ich nicht anders, als von der Geschwindigkeit der Entwicklung der KI beeindruckt zu sein. Jedes neue Modell, das auf den Markt kommt, sorgt für einen echten Umbruch in der Branche, und der Launch von Claude 3.7 Sonnet stellt einen großen Fortschritt in den Bereichen Logik und Programmierung dar. Während die großen Unternehmen weiterhin die Stärken ihrer Modelle hervorheben, denke ich persönlich: GPT ist das stärkste in Bezug auf die Gesamtfähigkeit und Benutzererfahrung, Claude führt in Programmierung und Sprachverständnis und Gemini ist der beste bei der Verarbeitung von langen Texten… Diese einzigartigen Modelle entwickeln sich weiter und zeigen das unglaubliche Potenzial der KI und ihre zukünftige Richtung.

Da sich diese KI-Modelle weiterentwickeln, befinden wir uns vermutlich am Anfang einer neuen Ära, in der KI immer intelligenter, flexibler und vielseitiger wird. Die Zukunft verspricht mehr KI-Innovationen, die die Welt verändern werden!