{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreidafx3vguwa3qlpnvyhnclqatzzubhbtvglgl6qjggpg6rwakecky",
"uri": "at://did:plc:jcdhsk6w7rxuehjvjgwrwr7d/app.bsky.feed.post/3mn7pa4f75y52"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreihpzgtjaijse6dnjhgl4j5vrtxnyk76osicp2gc255wgyb6hqngre"
},
"mimeType": "image/webp",
"size": 222226
},
"description": "MiniMax startet M3 als „erstes Open-Weight-Modell\" mit Coding, 1M-Context und Multimodalität. Nur fehlen zum Launch die Gewichte, die offizielle Parameterzahl und jede unabhängige Benchmark-Messung. Eine Einordnung zwischen echter Substanz und Marketing-Gegenwartsform.",
"path": "/ki-news/minimax-m3-open-weight-ohne-weights/",
"publishedAt": "2026-06-01T08:51:03.000Z",
"site": "https://t01.li",
"tags": [
"erste Open-Weight-Modell",
"Produktseite",
"15,6-fachen Decoding-Speedup",
"SWE-Bench Pro",
"Artificial Analysis maß nach",
"grundsätzlich als Marketing-Wert liest und nicht als Naturkonstante",
"Architektur-Teaser zur MSA",
"230 Milliarden Parameter total bei 10 Milliarden aktiven",
"als Open-Weight-Modelle auf HuggingFace"
],
"textContent": "MiniMax hat heute _M3_ vorgestellt. Die Überschrift, die das Unternehmen selbst übers Release schreibt, ist ambitioniert – das erste Open-Weight-Modell, das Coding und Agentic, ein Context-Window von einer Million Token und native Multimodalität in einem Modell vereint. Drei Dinge, die bislang nur eine Handvoll geschlossener Modelle gleichzeitig hinbekommen hat.\n\nJetzt Mal Tacheles: Ein Open-Weight-Modell ohne Weights ist erstmal keins. Die Produktseite trägt „Open-Weight“ groß über allem, der Launch-Blog kündigt die Gewichte aber erst „in den nächsten zehn Tagen“ auf HuggingFace und GitHub an. Heute, zum Start, ist _M3_ ein geschlossenes API-Modell mit einem Versprechen obendrauf. Das Versprechen ist glaubwürdig, dazu später. Aber der Reihe nach.\n\n## TL;DR\n\nMiniMax positioniert _M3_ als erstes Open-Weight-Modell mit Coding, 1M-Context und Multimodalität in einem. Die wichtigsten Vorbehalte auf einen Blick:\n\n * Die Gewichte sind zum Launch nicht da – sie kommen laut MiniMax erst „in den nächsten zehn Tagen\". Open-Weight ist bislang eine Ankündigung.\n * Alle Benchmark-Werte stammen aus MiniMax' eigener Messung. Die Benchmarks sind fremd, die Zahlen sind es nicht.\n * Eine offizielle Parameterzahl für _M3_ fehlt. Die kursierenden 229,9 Mrd. total / 9,8 Mrd. aktiv stehen so nur im Architektur-Teaser, nicht in der M3-Spec.\n * Der Track Record spricht für MiniMax: M2, M2.5 und M2.7 liegen tatsächlich offen auf HuggingFace. Skepsis ja, Generalverdacht nein.\n\n\n\n### Drei auf einen Streich – sagt MiniMax\n\nTechnisch ist _M3_ kein kleiner Schritt. Herzstück ist eine neue Architektur namens MSA, kurz für MiniMax Sparse Attention. Sie soll genau das Problem lösen, an dem lange Kontexte sonst ersticken – die quadratisch wachsende Last der vollen Attention. MiniMax beziffert den Effekt mit einem 15,6-fachen Decoding-Speedup bei einer Sequenzlänge von einer Million Token. Das Context-Window reicht über die API bis 1M Token, garantiert sind mindestens 512K.\n\nDazu kommt native Multimodalität, nach eigener Aussage von Schritt null an mittrainiert und nicht nachträglich drangeflanscht. Und die Demos, mit denen MiniMax die Agentic-Fähigkeiten bewirbt, haben Format: ein ICLR-2025-Paper, das _M3_ in knapp zwölf Stunden autonom reproduziert haben soll, mit 18 Commits und 23 erzeugten Diagrammen. Oder die Optimierung eines CUDA-Kernels über rund 24 Stunden, 147 Iterationen, 1.959 Tool-Calls, die Hardware-Auslastung von 7,6 auf 71,3 Prozent geschraubt. Beeindruckend, keine Frage. Nur eben von MiniMax selbst inszeniert und protokolliert.\n\n### Fremder Benchmark, eigene Messung\n\nWomit wir beim Punkt wären, der mir an diesem Release am meisten zu denken gibt. MiniMax hängt Coding und Agentic ganz groß auf und untermauert das mit Benchmarks, die einen guten Ruf haben. Auf SWE-Bench Pro übertreffe _M3_ die Modelle _GPT-5.5_ und _Gemini 3.1 Pro_ und nähere sich _Opus 4.7._ Auf BrowseComp stehen 83,5 Punkte gegen 79,3 für _Opus 4.7_. Auf SVG-Bench und OmniDocBench liegt _M3_ nach eigener Darstellung ebenfalls vorn.\n\nDas ist mehr wert als die übliche Hausnummer auf der selbst gebastelten Bench. SWE-Bench Pro stammt nicht von MiniMax, sondern ist ein etablierter Test – wer den wählt, stellt sich zumindest einem fremden Maßstab. Genau hier sitzt aber das obligatorische Hersteller-Sternchen: Der Benchmark ist fremd, die Messung ist es nicht. Eingetragen, gerechnet und veröffentlicht hat diese Zahlen MiniMax. Eine unabhängige Drittmessung – etwa durch Artificial Analysis oder über das SWE-rebench-Leaderboard – existiert für _M3_ zum Launch schlicht noch nicht. Beide listen Stand heute nur bis M2.7.\n\nWarum das mehr als Erbsenzählerei ist, zeigt der eigene Track Record. Beim Vorgänger _M2.7_ warb MiniMax mit „3× schneller als _Opus_ “. Artificial Analysis maß nach und kam auf 45,6 Token pro Sekunde statt der beworbenen rund 100. Auf dem Intelligence Index landete _M2.7_ bei 50 Punkten – solide, aber hinter _Gemini 3.1 Pro_ , _GPT-5.4_ , _Opus 4.6_ und _Sonnet 4.6_. Nicht Frontier, sondern oberes Mittelfeld. Wer Herstellerzahlen grundsätzlich als Marketing-Wert liest und nicht als Naturkonstante, wird auch bei _M3_ erst die unabhängige Messung abwarten.\n\n### Und wie groß ist das Ding eigentlich?\n\nEine Frage, die man auf der ganzen Produktseite vergeblich sucht: Wie viele Parameter hat _M3_? Steht da nicht. Im Launch-Blog auch nicht. Die einzige Zahl, die kursiert – 229,9 Milliarden total, 9,8 Milliarden aktiv über 256 Experten – stammt aus dem Architektur-Teaser zur MSA und steht dort im Umfeld der M2-Reihe, nicht als saubere M3-Spezifikation.\n\nZum Einordnen: _M2_ hatte 230 Milliarden Parameter total bei 10 Milliarden aktiven. _M3_ dürfte in derselben Größenordnung mitspielen, bestätigt ist das nicht. Solange der Technical Report fehlt, bleibt die Modellgröße eine Leerstelle – und das bei einem Modell, dessen ganzer Pitch auf Effizienz und „offen für alle“ baut. Wer self-hosten will, muss wissen, was er sich da auf die GPUs lädt. Diese Information liefert MiniMax bislang nicht mit.\n\n### Open-Weight steht drauf, Weights sind noch nicht drin\n\nBleibt der Aufhänger. „Open-Weight“ ist das prominenteste Wort auf der Seite, und es ist zum Launch eine Wechselverkäuferei. Der Blog formuliert es selbst klar – Technical Report und Gewichte folgen „in den nächsten zehn Tagen“. Bis dahin kann niemand das Modell herunterladen, selbst hosten oder feintunen. Man kann es über die API mieten, mehr nicht.\n\nBevor man daraus jetzt das große „alles nur PR\" strickt, ein Dämpfer in die andere Richtung. MiniMax hat geliefert, und zwar wiederholt. _M2_ , _M2.5_ und _M2.7_ liegen als Open-Weight-Modelle auf HuggingFace, abrufbar und self-hostbar. Das Versprechen ruht also nicht auf Goodwill, sondern auf einer Reihe gehaltener Zusagen. Die Wahrscheinlichkeit, dass die Gewichte kommen, ist hoch. Nur kommuniziert wird eben in der Gegenwartsform, was erst Zukunft ist. Und das ist ein Unterschied, den man nicht so einfach wegwischen sollte.\n\n### Einordnung\n\n _M3_ ist mit hoher Wahrscheinlichkeit ein starkes Modell. Die MSA-Architektur ist eine echte Ansage, die Agentic-Demos sind nicht nichts, und wenn die Gewichte wie versprochen offen kommen, ist das für die Open-Weight-Welt ein dicker Brocken. Der Abstand zwischen dem, was MiniMax heute behauptet, und dem, was heute überprüfbar ist, ist eben größer, als der Marketing-Text suggeriert.\n\nDrei Dinge fehlen zum vollständigen Bild, und alle drei reicht MiniMax erst nach: eine unabhängige Benchmark-Messung, die Parameterzahl und die Gewichte selbst. Bis dahin ist _M3_ ein Modell, über das man viel Gutes lesen, aber wenig selbst nachprüfen kann.\n\nHeißer Take: Ich freue mich auf _M3_. In zehn Tagen. Wenn die Weights da sind, die Zahl unter dem Modell steht und Artificial Analysis durchgemessen hat. Vorher ist es ein gut gemachter Trailer, aber kein Kinostart mit Blockbuster-Niveau.",
"title": "MiniMax M3: Open-Weight, nur ohne Weights",
"updatedAt": "2026-06-01T21:52:53.049Z"
}