Leanstral von Mistral AI: die KI, die beweist, dass Ihr Code korrekt ist

Niels
Niels Co-founder
Veröffentlicht am 17. März 2026Aktualisiert am 9. Apr. 2026

Leanstral Mistral AI dashboard

Am 16. März 2026 hat Mistral AI Leanstral veröffentlicht, den ersten Open-Source-KI-Agenten, der speziell für Lean 4 entwickelt wurde, einen formalen Beweisassistenten, der sowohl in der Mathematik als auch in der Softwareentwicklung verwendet wird. In einem Kontext, in dem sich die Werkzeuge zur Codegenerierung durch KI vermehren, sticht Leanstral durch ein radikales Versprechen heraus: nicht nur Code generieren, sondern mathematisch beweisen, dass er korrekt ist.

Aber warum sollten Sie sich für formale Verifikation interessieren? Wie sind die realen Benchmarks von Leanstral im Vergleich zu Claude und den Open-Source-Modellen? Und vor allem, welche konkreten Anwendungen eröffnet diese Technologie für Unternehmen und technische Teams? Dieser Leitfaden gibt einen Überblick.

Was ist Leanstral und warum die formale Verifikation zählt

Das Problem des „Vibe Coding“

Die KI-Agenten zur Codegenerierung (Copilot, Cursor, Claude Code) produzieren in den meisten Fällen funktionsfähigen Code. Aber in kritischen Bereichen (Luftfahrt, Finanzen, Smart Contracts, mathematische Forschung) reicht „scheint zu funktionieren“ nicht aus. Die menschliche Überprüfung von KI-generiertem Code ist teuer, langsam und erfordert seltene Fachkenntnis.

Leanstral schlägt eine Alternative vor: Der Agent schreibt den Code und produziert einen formalen Beweis seiner Korrektheit. Der Lean-4-Compiler fungiert als binärer Verifizierer. Entweder der Beweis kompiliert oder er kompiliert nicht. Keine Grauzone.

Lean 4: die Sprache hinter Leanstral

Lean 4, entwickelt von Leonardo de Moura (ehemals Microsoft Research), ist sowohl ein Beweisassistent als auch eine funktionale Programmiersprache. Es wird verwendet von Google DeepMind (AlphaProof, Silbermedaille bei der Internationalen Mathematik-Olympiade 2024), Amazon (Verifikation von Cedar) und einer Community von mehr als 10.000 Mitgliedern auf Zulip.

Die Mathlib-Bibliothek, die die Mathematik in Lean formalisiert, zählt mehr als 20.000 Beiträge und hat 2025 Finanzierungen in Höhe von 15 Millionen Dollar erhalten.

Wie Leanstral funktioniert: Architektur und technische Spezifikationen

Ein für Beweise optimiertes Mixture-of-Experts-Modell

Leanstral basiert auf einer Sparse-Mixture-of-Experts-(MoE)-Architektur mit folgenden Eigenschaften:

Caractéristique

Valeur

Nom complet

Leanstral-120B-A6B-2603

Paramètres totaux

~119 milliards (128 experts)

Paramètres actifs par token

~6,5 milliards (4 experts sur 128)

Architecture

Sparse Mixture-of-Experts

Famille de base

Mistral Small 4

Fenêtre de contexte

256K tokens

Modalités d'entrée

Texte et images

Licence

Apache 2.0

Das Prinzip ist einfach: Jeder Token aktiviert nur 4 der 128 Expertenmodule. Leanstral profitiert somit von der Wissenskapazität eines Modells mit 119 Milliarden Parametern, aber zu den Inferenzkosten eines Modells mit 6,5 Milliarden. Dieses Effizienzverhältnis von 18x ermöglicht es ihm, drastisch niedrigere Kosten als die Konkurrenz anzubieten.

Integration mit dem Lean-Compiler über MCP

Im Gegensatz zu generalistischen Modellen, die Text produzieren, der wie Lean-Code aussieht, interagiert Leanstral direkt mit dem Lean-4-Compiler über das MCP-Protokoll (Model Context Protocol). Konkret kann der Agent:

  • Die Typen im Lean-Compiler überprüfen

  • Beweistaktiken ausführen und die Ergebnisse beobachten

  • Die Fehlermeldungen analysieren

  • Die Beweise iterativ in einer interaktiven Schleife verfeinern

Diese native Integration ist ein entscheidender technischer Vorteil. Das Modell „rät“ die Beweise nicht, es konstruiert sie im Dialog mit dem Verifizierer.

Leanstral-Benchmarks: Leistung gegenüber Claude und den Open-Source-Modellen

Das FLTEval-Benchmark: realistische Bedingungen

Mistral AI hat FLTEval eingeführt, ein neues Benchmark, das entwickelt wurde, um die Fähigkeit zu bewerten, Beweise in echten Code-Repositories zu produzieren. Es stützt sich auf das FLT-Projekt (Fermat's Last Theorem) des Imperial College London, geleitet von Professor Kevin Buzzard, ein Formalisierungsprojekt mit 55 Mitwirkenden und finanziert vom EPSRC bis 2029.

Im Gegensatz zum MiniF2F-Benchmark (das isolierte Probleme aus mathematischen Wettbewerben ins Visier nimmt) misst FLTEval die Fähigkeit, formale Beweise in einer realistischen Umgebung mit Imports, Bibliotheksabhängigkeiten und mehrdateilichen Beweisstrukturen zu vervollständigen.

Leanstral vs Claude: das Preis-Leistungs-Verhältnis

Modèle

Coût par run FLTEval ($)

Score FLTEval

Leanstral pass@1

18

21,9

Leanstral pass@2

36

26,3

Leanstral pass@4

72

29,3

Leanstral pass@8

145

31,0

Leanstral pass@16

290

31,9

Claude Haiku 4.5

184

23,0

Claude Sonnet 4.6

549

23,7

Claude Opus 4.6

1 650

39,6

Die Zahlen sprechen für sich:

  • Leanstral pass@2 (36 $) übertrifft Sonnet 4.6 (549 $) um 2,6 Punkte, bei 15 Mal weniger Kosten.

  • Leanstral pass@2 übertrifft Haiku 4.5 (184 $) um 3,3 Punkte, bei 5 Mal weniger Kosten.

  • Leanstral pass@16 (290 $) übertrifft Sonnet um 8 Punkte, zum halben Preis.

  • Claude Opus 4.6 bleibt der Marktführer bei roher Qualität (39,6), kostet aber 1.650 $, also 46 Mal mehr als Leanstral pass@2.

Leanstral vs Open-Source-Modelle: Effizienz der aktiven Parameter

Modèle

Paramètres actifs

Score FLTEval (meilleur pass)

GLM5-744B-A40B

40B

~16,6 (plafonne)

Kimi-K2.5-1T-A32B

32B

~20,1 (plafonne)

Leanstral pass@1

6,5B

21,9

Qwen3.5-397B-A17B

17B

25,4 (pass@4)

Leanstral pass@2

6,5B

26,3

Leanstral pass@4

6,5B

29,3

Mit nur 6,5 Milliarden aktiven Parametern übertrifft Leanstral Modelle, die 5- bis 6-mal mehr mobilisieren. Qwen3.5 benötigt 4 Versuche und 17 Milliarden aktive Parameter, um 25,4 zu erreichen. Leanstral übertrifft diesen Wert bereits beim zweiten Versuch.

Kostenvergleich: Leanstral gegenüber den Alternativen

Solution

Coût estimé

Score FLTEval

Open source

Leanstral pass@2

36 $

26,3

Oui (Apache 2.0)

Leanstral pass@16

290 $

31,9

Oui (Apache 2.0)

Claude Haiku 4.5

184 $

23,0

Non

Claude Sonnet 4.6

549 $

23,7

Non

Claude Opus 4.6

1 650 $

39,6

Non

Auto-hébergement Leanstral

Matériel requis: 4x A100/H100

Identique

Oui

Konkrete Anwendungsfälle von Leanstral für Unternehmen

Verifikation von Smart Contracts und DeFi-Sicherheit

Bugs im DeFi-Code haben in den letzten Jahren Milliarden von Dollar gekostet. Die formale Verifikation ist der Referenzstandard, um zu garantieren, dass ein Smart Contract genau das tut, was er verspricht. Mit Leanstral sinken die Kosten eines formalen Audits drastisch: ein Korrektheitsbeweis für 36 $ statt Hunderten von Dollar bei den proprietären Alternativen.

Kritische Software: Luftfahrt, Finanzen, Gesundheit

In Branchen, in denen ein Softwarefehler Leben oder Millionen kosten kann, ist die formale Verifikation kein Luxus, sondern eine regulatorische Pflicht. Leanstral ermöglicht es Entwicklungsteams, das erwartete Verhalten in Lean 4 zu spezifizieren und dann automatisch die Konformitätsbeweise zu generieren. Der Compiler überprüft anschließend, ob der Beweis gültig ist.

Kollaborative mathematische Forschung

Das FLT-Projekt (Formalisierung des großen fermatschen Satzes) und Mathlib veranschaulichen das Potenzial von Leanstral, die formalisierte Forschung zu beschleunigen. Forscher können routinemäßige Beweise an den Agenten delegieren und sich auf die kreativen Aspekte der Forschung konzentrieren.

Migration von Beweisen zwischen Sprachen

Einer der von Mistral AI demonstrierten Anwendungsfälle ist die Übersetzung von Beweisen aus Rocq (früher Coq) nach Lean 4, wobei die Semantik und die Notationen erhalten bleiben. Dies erleichtert die Migration akademischer oder industrieller Projekte von einem Ökosystem zum anderen.

Verifikation von KI-generiertem Code

Der strategisch wichtigste Anwendungsfall: formal zu überprüfen, dass der von KI-Agenten (Copilot, Cursor usw.) produzierte Code korrekt ist. Leanstral verkörpert die Vision des „trustworthy vibe coding“, bei dem der Mensch spezifiziert, was er will, und die Maschine die Konformität beweist.

Drei Möglichkeiten, ab heute auf Leanstral zuzugreifen

1. Mistral Vibe (Null-Konfiguration)

Der Befehl /leanstall im Mistral-Vibe-CLI (Version 2.5.0, veröffentlicht am 16. März 2026) konfiguriert den Leanstral-Agenten automatisch. Das ist der schnellste Weg zum Testen.

2. Kostenlose API (begrenzte Zeit)

Der Endpunkt labs-leanstral-2603 ist für eine begrenzte Zeit kostenlos verfügbar. Mistral AI möchte echte Nutzungsrückmeldungen sammeln, um zukünftige Versionen zu verbessern.

3. Selbst-Hosting (Open-Source-Gewichte)

Die Modellgewichte werden unter Apache-2.0-Lizenz auf Hugging Face veröffentlicht (mistralai/Leanstral-120B-A6B-2603). Empfohlene Konfiguration: 4 GPUs A100 80 GB oder H100, mit vLLM und Flash Attention. Hinweis: Die Hugging-Face-Seite zeigte zum Zeitpunkt der Veröffentlichung einen vorübergehenden 404-Fehler.

Grenzen von Leanstral: was Sie vor der Einführung wissen sollten

Ein spezialisiertes Modell, kein generalistischer Code-Assistent

Leanstral wurde ausschließlich für Lean 4 entwickelt. Es ersetzt nicht Ihre generalistischen Codierungswerkzeuge (Copilot, Claude Code, Cursor). Wenn Sie einen Assistenten zum Schreiben von Python, TypeScript oder SQL suchen, ist dies nicht das richtige Werkzeug.

Claude Opus 4.6 bleibt überlegen in roher Qualität

Mit einem FLTEval-Score von 39,6 gegenüber 31,9 für Leanstral pass@16 behält Opus einen signifikanten Vorsprung. Wenn Ihre absolute Priorität die maximale Präzision ist und das Budget keine Einschränkung darstellt, bleibt Opus die beste Wahl. Die Hacker-News-Community hat diesen Punkt übrigens hervorgehoben: Ein speziell für diese Aufgabe trainiertes Modell sollte theoretisch ein generalistisches Modell übertreffen.

Die Fortschrittskurve könnte ein Plateau erreichen

Einige Beobachter merken an, dass der Leistungsgewinn von Leanstral sich jenseits von pass@8 zu verringern scheint. Der Übergang von pass@8 (31,0) zu pass@16 (31,9) stellt nur einen Gewinn von 0,9 Punkten bei einer Verdopplung der Kosten dar.

Erforderliche Infrastruktur für das Selbst-Hosting

Das Selbst-Hosting erfordert 4 High-End-GPUs (A100 oder H100), was eine erhebliche Hardware-Investition darstellt. Für Teams ohne diese Infrastruktur bleiben die kostenlose API oder Mistral Vibe die zugänglichsten Optionen.

Sollten Sie Leanstral für Ihre Projekte zur formalen Verifikation verwenden?

Leanstral füllt eine echte Lücke im Ökosystem. Vor seiner Veröffentlichung beschränkten sich die Optionen für die KI-unterstützte formale Verifikation auf teure proprietäre Modelle (Claude Opus) oder auf generalistische Modelle, die nicht für Lean 4 optimiert sind.

Leanstral positioniert sich an der Schnittstelle dreier Qualitäten: Open Source (Apache 2.0), speziell für das Beweis-Engineering trainiert, und wirtschaftlich. Kein anderes Modell besetzt derzeit diesen Platz.

Für CTOs und technische Verantwortliche, die die formale Verifikation als Bestandteil ihrer Strategie zur Softwarequalität bewerten, stellt Leanstral einen zugänglichen Einstiegspunkt dar. Für Forscher in formalisierter Mathematik ist es ein Beschleuniger. Und für das Lean-4-Ökosystem als Ganzes ist es ein starkes Signal, dass auf formale Beweise spezialisierte KI dabei ist, eine praktische Realität zu werden.

Die wahre Frage ist nicht mehr „Ist die KI-unterstützte formale Verifikation möglich?“, sondern „Wie produktionsreif ist sie?“. Mit Leanstral liefert Mistral AI ein erstes Antwortelement.

logo emelia

Entdecken Sie Emelia, Ihre All-in-One-Software für prospektion.

logo emelia

Klare, transparente Preise ohne versteckte Kosten.

Keine Verpflichtung, Preise, die Ihnen helfen, Ihre Akquise zu steigern.

Start

37€

/Monat

Unbegrenztes E-Mail-Versand

1 LinkedIn-Konto verbinden

Unbegrenzte LinkedIn-Aktionen

E-Mail-Warm-up inklusive

Unbegrenztes Scraping

Unbegrenzte Kontakte

Grow

Beliebt
arrow-right
97€

/Monat

Unbegrenztes E-Mail-Versand

Bis zu 5 LinkedIn-Konten

Unbegrenzte LinkedIn-Aktionen

Unbegrenztes Warm-up

Unbegrenzte Kontakte

1 CRM-Integration

Scale

297€

/Monat

Unbegrenztes E-Mail-Versand

Bis zu 20 LinkedIn-Konten

Unbegrenzte LinkedIn-Aktionen

Unbegrenztes Warm-up

Unbegrenzte Kontakte

Multi-CRM-Verbindung

Unbegrenzte API-Aufrufe

Credits(optional)

Sie benötigen keine Credits, wenn Sie nur E-Mails senden oder auf LinkedIn-Aktionen ausführen möchten

Können verwendet werden für:

E-Mails finden

KI-Aktion

Nummern finden

E-Mails verifizieren

1,000
5,000
10,000
50,000
100,000
1,000 Gefundene E-Mails
1,000 KI-Aktionen
20 Nummern
4,000 Verifizierungen
19pro Monat

Entdecken Sie andere Artikel, die Sie interessieren könnten!

Alle Artikel ansehen
MarieMarie Head Of Sales
Weiterlesen
MarieMarie Head Of Sales
Weiterlesen
MarieMarie Head Of Sales
Weiterlesen
NielsNiels Co-founder
Weiterlesen
Software
Veröffentlicht am 8. März 2025

7 Alternativen zu Kaspr für Ihre B2B-Akquise 2026

NielsNiels Co-founder
Weiterlesen
Software
Veröffentlicht am 26. Apr. 2024

Email Finder 2026: Die 9 besten Hunter.io-Alternativen

MarieMarie Head Of Sales
Weiterlesen
Made with ❤ for Growth Marketers by Growth Marketers
Copyright © 2026 Emelia All Rights Reserved