Niels Co-founder

Veröffentlicht am 17. März 2026Aktualisiert am 9. Apr. 2026

Finden und kontaktieren Sie Ihre zukünftigen Kunden

All-in-one-Plattform für B2B-Prospektion

Jetzt testen →

Zurück zum Hub

Leanstral von Mistral AI: die KI, die beweist, dass Ihr Code korrekt ist

Niels Co-founder

Veröffentlicht am 17. März 2026Aktualisiert am 9. Apr. 2026

Am 16. März 2026 hat Mistral AI Leanstral veröffentlicht, den ersten Open-Source-KI-Agenten, der speziell für Lean 4 entwickelt wurde, einen formalen Beweisassistenten, der sowohl in der Mathematik als auch in der Softwareentwicklung verwendet wird. In einem Kontext, in dem sich die Werkzeuge zur Codegenerierung durch KI vermehren, sticht Leanstral durch ein radikales Versprechen heraus: nicht nur Code generieren, sondern mathematisch beweisen, dass er korrekt ist.

Aber warum sollten Sie sich für formale Verifikation interessieren? Wie sind die realen Benchmarks von Leanstral im Vergleich zu Claude und den Open-Source-Modellen? Und vor allem, welche konkreten Anwendungen eröffnet diese Technologie für Unternehmen und technische Teams? Dieser Leitfaden gibt einen Überblick.

Was ist Leanstral und warum die formale Verifikation zählt

Das Problem des „Vibe Coding“

Die KI-Agenten zur Codegenerierung (Copilot, Cursor, Claude Code) produzieren in den meisten Fällen funktionsfähigen Code. Aber in kritischen Bereichen (Luftfahrt, Finanzen, Smart Contracts, mathematische Forschung) reicht „scheint zu funktionieren“ nicht aus. Die menschliche Überprüfung von KI-generiertem Code ist teuer, langsam und erfordert seltene Fachkenntnis.

Leanstral schlägt eine Alternative vor: Der Agent schreibt den Code und produziert einen formalen Beweis seiner Korrektheit. Der Lean-4-Compiler fungiert als binärer Verifizierer. Entweder der Beweis kompiliert oder er kompiliert nicht. Keine Grauzone.

Lean 4: die Sprache hinter Leanstral

Lean 4, entwickelt von Leonardo de Moura (ehemals Microsoft Research), ist sowohl ein Beweisassistent als auch eine funktionale Programmiersprache. Es wird verwendet von Google DeepMind (AlphaProof, Silbermedaille bei der Internationalen Mathematik-Olympiade 2024), Amazon (Verifikation von Cedar) und einer Community von mehr als 10.000 Mitgliedern auf Zulip.

Die Mathlib-Bibliothek, die die Mathematik in Lean formalisiert, zählt mehr als 20.000 Beiträge und hat 2025 Finanzierungen in Höhe von 15 Millionen Dollar erhalten.

Wie Leanstral funktioniert: Architektur und technische Spezifikationen

Ein für Beweise optimiertes Mixture-of-Experts-Modell

Leanstral basiert auf einer Sparse-Mixture-of-Experts-(MoE)-Architektur mit folgenden Eigenschaften:

Caractéristique	Valeur
Nom complet	Leanstral-120B-A6B-2603
Paramètres totaux	~119 milliards (128 experts)
Paramètres actifs par token	~6,5 milliards (4 experts sur 128)
Architecture	Sparse Mixture-of-Experts
Famille de base	Mistral Small 4
Fenêtre de contexte	256K tokens
Modalités d'entrée	Texte et images
Licence	Apache 2.0

Das Prinzip ist einfach: Jeder Token aktiviert nur 4 der 128 Expertenmodule. Leanstral profitiert somit von der Wissenskapazität eines Modells mit 119 Milliarden Parametern, aber zu den Inferenzkosten eines Modells mit 6,5 Milliarden. Dieses Effizienzverhältnis von 18x ermöglicht es ihm, drastisch niedrigere Kosten als die Konkurrenz anzubieten.

Integration mit dem Lean-Compiler über MCP

Im Gegensatz zu generalistischen Modellen, die Text produzieren, der wie Lean-Code aussieht, interagiert Leanstral direkt mit dem Lean-4-Compiler über das MCP-Protokoll (Model Context Protocol). Konkret kann der Agent:

Die Typen im Lean-Compiler überprüfen
Beweistaktiken ausführen und die Ergebnisse beobachten
Die Fehlermeldungen analysieren
Die Beweise iterativ in einer interaktiven Schleife verfeinern

Diese native Integration ist ein entscheidender technischer Vorteil. Das Modell „rät“ die Beweise nicht, es konstruiert sie im Dialog mit dem Verifizierer.

Leanstral-Benchmarks: Leistung gegenüber Claude und den Open-Source-Modellen

Das FLTEval-Benchmark: realistische Bedingungen

Mistral AI hat FLTEval eingeführt, ein neues Benchmark, das entwickelt wurde, um die Fähigkeit zu bewerten, Beweise in echten Code-Repositories zu produzieren. Es stützt sich auf das FLT-Projekt (Fermat's Last Theorem) des Imperial College London, geleitet von Professor Kevin Buzzard, ein Formalisierungsprojekt mit 55 Mitwirkenden und finanziert vom EPSRC bis 2029.

Im Gegensatz zum MiniF2F-Benchmark (das isolierte Probleme aus mathematischen Wettbewerben ins Visier nimmt) misst FLTEval die Fähigkeit, formale Beweise in einer realistischen Umgebung mit Imports, Bibliotheksabhängigkeiten und mehrdateilichen Beweisstrukturen zu vervollständigen.

Leanstral vs Claude: das Preis-Leistungs-Verhältnis

Modèle	Coût par run FLTEval ($)	Score FLTEval
Leanstral pass@1	18	21,9
Leanstral pass@2	36	26,3
Leanstral pass@4	72	29,3
Leanstral pass@8	145	31,0
Leanstral pass@16	290	31,9
Claude Haiku 4.5	184	23,0
Claude Sonnet 4.6	549	23,7
Claude Opus 4.6	1 650	39,6

Die Zahlen sprechen für sich:

Leanstral pass@2 (36 $) übertrifft Sonnet 4.6 (549 $) um 2,6 Punkte, bei 15 Mal weniger Kosten.
Leanstral pass@2 übertrifft Haiku 4.5 (184 $) um 3,3 Punkte, bei 5 Mal weniger Kosten.
Leanstral pass@16 (290 $) übertrifft Sonnet um 8 Punkte, zum halben Preis.
Claude Opus 4.6 bleibt der Marktführer bei roher Qualität (39,6), kostet aber 1.650 $, also 46 Mal mehr als Leanstral pass@2.

Leanstral vs Open-Source-Modelle: Effizienz der aktiven Parameter

Modèle	Paramètres actifs	Score FLTEval (meilleur pass)
GLM5-744B-A40B	40B	~16,6 (plafonne)
Kimi-K2.5-1T-A32B	32B	~20,1 (plafonne)
Leanstral pass@1	6,5B	21,9
Qwen3.5-397B-A17B	17B	25,4 (pass@4)
Leanstral pass@2	6,5B	26,3
Leanstral pass@4	6,5B	29,3

Mit nur 6,5 Milliarden aktiven Parametern übertrifft Leanstral Modelle, die 5- bis 6-mal mehr mobilisieren. Qwen3.5 benötigt 4 Versuche und 17 Milliarden aktive Parameter, um 25,4 zu erreichen. Leanstral übertrifft diesen Wert bereits beim zweiten Versuch.

Kostenvergleich: Leanstral gegenüber den Alternativen

Solution	Coût estimé	Score FLTEval	Open source
Leanstral pass@2	36 $	26,3	Oui (Apache 2.0)
Leanstral pass@16	290 $	31,9	Oui (Apache 2.0)
Claude Haiku 4.5	184 $	23,0	Non
Claude Sonnet 4.6	549 $	23,7	Non
Claude Opus 4.6	1 650 $	39,6	Non
Auto-hébergement Leanstral	Matériel requis: 4x A100/H100	Identique	Oui

Konkrete Anwendungsfälle von Leanstral für Unternehmen

Verifikation von Smart Contracts und DeFi-Sicherheit

Bugs im DeFi-Code haben in den letzten Jahren Milliarden von Dollar gekostet. Die formale Verifikation ist der Referenzstandard, um zu garantieren, dass ein Smart Contract genau das tut, was er verspricht. Mit Leanstral sinken die Kosten eines formalen Audits drastisch: ein Korrektheitsbeweis für 36 $ statt Hunderten von Dollar bei den proprietären Alternativen.

Kritische Software: Luftfahrt, Finanzen, Gesundheit

In Branchen, in denen ein Softwarefehler Leben oder Millionen kosten kann, ist die formale Verifikation kein Luxus, sondern eine regulatorische Pflicht. Leanstral ermöglicht es Entwicklungsteams, das erwartete Verhalten in Lean 4 zu spezifizieren und dann automatisch die Konformitätsbeweise zu generieren. Der Compiler überprüft anschließend, ob der Beweis gültig ist.

Kollaborative mathematische Forschung

Das FLT-Projekt (Formalisierung des großen fermatschen Satzes) und Mathlib veranschaulichen das Potenzial von Leanstral, die formalisierte Forschung zu beschleunigen. Forscher können routinemäßige Beweise an den Agenten delegieren und sich auf die kreativen Aspekte der Forschung konzentrieren.

Migration von Beweisen zwischen Sprachen

Einer der von Mistral AI demonstrierten Anwendungsfälle ist die Übersetzung von Beweisen aus Rocq (früher Coq) nach Lean 4, wobei die Semantik und die Notationen erhalten bleiben. Dies erleichtert die Migration akademischer oder industrieller Projekte von einem Ökosystem zum anderen.

Verifikation von KI-generiertem Code

Der strategisch wichtigste Anwendungsfall: formal zu überprüfen, dass der von KI-Agenten (Copilot, Cursor usw.) produzierte Code korrekt ist. Leanstral verkörpert die Vision des „trustworthy vibe coding“, bei dem der Mensch spezifiziert, was er will, und die Maschine die Konformität beweist.

Drei Möglichkeiten, ab heute auf Leanstral zuzugreifen

1. Mistral Vibe (Null-Konfiguration)

Der Befehl /leanstall im Mistral-Vibe-CLI (Version 2.5.0, veröffentlicht am 16. März 2026) konfiguriert den Leanstral-Agenten automatisch. Das ist der schnellste Weg zum Testen.

2. Kostenlose API (begrenzte Zeit)

Der Endpunkt labs-leanstral-2603 ist für eine begrenzte Zeit kostenlos verfügbar. Mistral AI möchte echte Nutzungsrückmeldungen sammeln, um zukünftige Versionen zu verbessern.

3. Selbst-Hosting (Open-Source-Gewichte)

Die Modellgewichte werden unter Apache-2.0-Lizenz auf Hugging Face veröffentlicht (mistralai/Leanstral-120B-A6B-2603). Empfohlene Konfiguration: 4 GPUs A100 80 GB oder H100, mit vLLM und Flash Attention. Hinweis: Die Hugging-Face-Seite zeigte zum Zeitpunkt der Veröffentlichung einen vorübergehenden 404-Fehler.

Grenzen von Leanstral: was Sie vor der Einführung wissen sollten

Ein spezialisiertes Modell, kein generalistischer Code-Assistent

Leanstral wurde ausschließlich für Lean 4 entwickelt. Es ersetzt nicht Ihre generalistischen Codierungswerkzeuge (Copilot, Claude Code, Cursor). Wenn Sie einen Assistenten zum Schreiben von Python, TypeScript oder SQL suchen, ist dies nicht das richtige Werkzeug.

Claude Opus 4.6 bleibt überlegen in roher Qualität

Mit einem FLTEval-Score von 39,6 gegenüber 31,9 für Leanstral pass@16 behält Opus einen signifikanten Vorsprung. Wenn Ihre absolute Priorität die maximale Präzision ist und das Budget keine Einschränkung darstellt, bleibt Opus die beste Wahl. Die Hacker-News-Community hat diesen Punkt übrigens hervorgehoben: Ein speziell für diese Aufgabe trainiertes Modell sollte theoretisch ein generalistisches Modell übertreffen.

Die Fortschrittskurve könnte ein Plateau erreichen

Einige Beobachter merken an, dass der Leistungsgewinn von Leanstral sich jenseits von pass@8 zu verringern scheint. Der Übergang von pass@8 (31,0) zu pass@16 (31,9) stellt nur einen Gewinn von 0,9 Punkten bei einer Verdopplung der Kosten dar.

Erforderliche Infrastruktur für das Selbst-Hosting

Das Selbst-Hosting erfordert 4 High-End-GPUs (A100 oder H100), was eine erhebliche Hardware-Investition darstellt. Für Teams ohne diese Infrastruktur bleiben die kostenlose API oder Mistral Vibe die zugänglichsten Optionen.

Sollten Sie Leanstral für Ihre Projekte zur formalen Verifikation verwenden?

Leanstral füllt eine echte Lücke im Ökosystem. Vor seiner Veröffentlichung beschränkten sich die Optionen für die KI-unterstützte formale Verifikation auf teure proprietäre Modelle (Claude Opus) oder auf generalistische Modelle, die nicht für Lean 4 optimiert sind.

Leanstral positioniert sich an der Schnittstelle dreier Qualitäten: Open Source (Apache 2.0), speziell für das Beweis-Engineering trainiert, und wirtschaftlich. Kein anderes Modell besetzt derzeit diesen Platz.

Für CTOs und technische Verantwortliche, die die formale Verifikation als Bestandteil ihrer Strategie zur Softwarequalität bewerten, stellt Leanstral einen zugänglichen Einstiegspunkt dar. Für Forscher in formalisierter Mathematik ist es ein Beschleuniger. Und für das Lean-4-Ökosystem als Ganzes ist es ein starkes Signal, dass auf formale Beweise spezialisierte KI dabei ist, eine praktische Realität zu werden.

Die wahre Frage ist nicht mehr „Ist die KI-unterstützte formale Verifikation möglich?“, sondern „Wie produktionsreif ist sie?“. Mit Leanstral liefert Mistral AI ein erstes Antwortelement.

Entdecken Sie Emelia, Ihre All-in-One-Software für prospektion.

Meine Kampagne starten

Klare, transparente Preise ohne versteckte Kosten.

Keine Verpflichtung, Preise, die Ihnen helfen, Ihre Akquise zu steigern.

Start

37€

/Monat

Unbegrenztes E-Mail-Versand

1 LinkedIn-Konto verbinden

Unbegrenzte LinkedIn-Aktionen

E-Mail-Warm-up inklusive

Unbegrenztes Scraping

Unbegrenzte Kontakte

Grow

Beliebt

97€

/Monat

Unbegrenztes E-Mail-Versand

Bis zu 5 LinkedIn-Konten

Unbegrenzte LinkedIn-Aktionen

Unbegrenztes Warm-up

Unbegrenzte Kontakte

1 CRM-Integration

Scale

297€

/Monat

Unbegrenztes E-Mail-Versand

Bis zu 20 LinkedIn-Konten

Unbegrenzte LinkedIn-Aktionen

Unbegrenztes Warm-up

Unbegrenzte Kontakte

Multi-CRM-Verbindung

Unbegrenzte API-Aufrufe

Credits(optional)

Sie benötigen keine Credits, wenn Sie nur E-Mails senden oder auf LinkedIn-Aktionen ausführen möchten

Können verwendet werden für:

E-Mails finden

KI-Aktion

Nummern finden

E-Mails verifizieren

€19pro Monat

1,000

1,000 Gefundene E-Mails

1,000 KI-Aktionen

20 Nummern

4,000 Verifizierungen

5,000

10,000

50,000

100,000

1,000 Gefundene E-Mails

1,000 KI-Aktionen

20 Nummern

4,000 Verifizierungen

€19pro Monat

Entdecken Sie andere Artikel, die Sie interessieren könnten!

Alle Artikel ansehen

Software

Veröffentlicht am 11. Juli 2024

7 Alternativen zu Expandi, um Ihre Akquisitionskosten zu senken

Marie Head Of Sales

Software

Veröffentlicht am 22. Apr. 2024

Die 5 besten Alternativen zu Dropcontact für eine bessere B2B-Kundenakquise

Marie Head Of Sales

Software

Veröffentlicht am 4. Juni 2024

Die 6 besten Alternativen zu GetProspect, um Ihre Kundenakquise anzukurbeln

Marie Head Of Sales

Software

Veröffentlicht am 31. März 2025

9 Alternativen zu UpLead, um Ihre Kundenakquise WIRKLICH anzukurbeln

Niels Co-founder

Software

Veröffentlicht am 8. März 2025

7 Alternativen zu Kaspr für Ihre B2B-Akquise 2026

Niels Co-founder

Software

Veröffentlicht am 26. Apr. 2024

Email Finder 2026: Die 9 besten Hunter.io-Alternativen

Marie Head Of Sales

Made with ❤ for Growth Marketers by Growth Marketers

Finden und kontaktieren Sie Ihre zukünftigen Kunden

Leanstral von Mistral AI: die KI, die beweist, dass Ihr Code korrekt ist

Was ist Leanstral und warum die formale Verifikation zählt

Das Problem des „Vibe Coding“

Lean 4: die Sprache hinter Leanstral

Wie Leanstral funktioniert: Architektur und technische Spezifikationen

Ein für Beweise optimiertes Mixture-of-Experts-Modell

Integration mit dem Lean-Compiler über MCP

Leanstral-Benchmarks: Leistung gegenüber Claude und den Open-Source-Modellen

Das FLTEval-Benchmark: realistische Bedingungen

Leanstral vs Claude: das Preis-Leistungs-Verhältnis

Leanstral vs Open-Source-Modelle: Effizienz der aktiven Parameter

Kostenvergleich: Leanstral gegenüber den Alternativen

Konkrete Anwendungsfälle von Leanstral für Unternehmen

Verifikation von Smart Contracts und DeFi-Sicherheit

Kritische Software: Luftfahrt, Finanzen, Gesundheit

Kollaborative mathematische Forschung

Migration von Beweisen zwischen Sprachen

Verifikation von KI-generiertem Code

Drei Möglichkeiten, ab heute auf Leanstral zuzugreifen

1. Mistral Vibe (Null-Konfiguration)

2. Kostenlose API (begrenzte Zeit)

3. Selbst-Hosting (Open-Source-Gewichte)

Grenzen von Leanstral: was Sie vor der Einführung wissen sollten

Ein spezialisiertes Modell, kein generalistischer Code-Assistent

Claude Opus 4.6 bleibt überlegen in roher Qualität

Die Fortschrittskurve könnte ein Plateau erreichen

Erforderliche Infrastruktur für das Selbst-Hosting

Sollten Sie Leanstral für Ihre Projekte zur formalen Verifikation verwenden?

Entdecken Sie Emelia, Ihre All-in-One-Software für prospektion.

Klare, transparente Preise ohne versteckte Kosten.

Start

Grow

Scale

Credits(optional)

Entdecken Sie andere Artikel, die Sie interessieren könnten!

7 Alternativen zu Expandi, um Ihre Akquisitionskosten zu senken

Die 5 besten Alternativen zu Dropcontact für eine bessere B2B-Kundenakquise

Die 6 besten Alternativen zu GetProspect, um Ihre Kundenakquise anzukurbeln

9 Alternativen zu UpLead, um Ihre Kundenakquise WIRKLICH anzukurbeln

7 Alternativen zu Kaspr für Ihre B2B-Akquise 2026

Email Finder 2026: Die 9 besten Hunter.io-Alternativen

Nützliche Links

Über uns

Features

Folgen Sie uns

Partner