AI Model Timeline

21.05.2026 / felix neuland

Was offenbart uns die AI Model Timeline?
Es ist nicht nur ein AI-Wettrennen. Vier haben sich herauskristallisiert. Und China führt in drei davon.

Mehrere parallele Rennen: Was die KI-Modell-Landschaft 2024–2026 zeigt

Als 2024 immer mehr Dynamik in die KI-Modell-Landschaft kam, hatte ich das Bedürfnis nach einem visuellen Überblick. Nach einer Darstellung, die diese Bewegung sichtbar macht. Ich wollte sehen, wie die Veröffentlichungsfrequenz zunimmt, wer sich am Rennen beteiligt, wer wann eingestiegen ist und wie. Wer am Ende vorne liegt. Und für wie lange.

Daraus ist die AI Model Timeline geworden.

Was beim Bauen am deutlichsten wurde: Es läuft nicht ein Rennen, sondern mehrere parallel. Mit unterschiedlichen Teilnehmern, unterschiedlicher Dynamik und sehr unterschiedlichen Vorzeichen.

Rennen 1: Die Cloud-Frontier

Auf der Cloud-Seite kämpfen die Big Player um die Frontier-Krone. OpenAI, Anthropic, Google, mittlerweile auch DeepSeek und xAI. Die Abstände zwischen neuen Releases verkürzen sich rapide. Zwei Gründe sehe ich dafür:

Erstens profitiert die Entwicklung inzwischen von den Qualitäten der eigenen Produkte. Die Modelle helfen beim Bauen der nächsten Generation. Das ist ein selbstverstärkender Effekt, der die Iterationszyklen messbar verkürzt.

Zweitens erinnert der Konkurrenzkampf zwischen den Hyperscalern zunehmend an den Wettlauf zwischen USA und Sowjetunion um die Mondlandung. Es geht nicht mehr nur um Produkte, sondern um Positionierung. Geopolitisches Prestige. Investorenvertrauen. Talent-Akquise. Jedes Release ist ein Signal an mehrere Adressaten gleichzeitig.

Cloud-Frontier: LLM- und Coding-Kronen in Bewegung (AI Model Timeline)

Rennen 2: Die Open-Weight-Verschiebung

Auf der Open-Weight-Seite verläuft das Rennen anders. Und für meine Wahrnehmung deutlich überraschender.

Im Frühjahr 2023 war Meta praktisch der einzige relevante Open-Weight-Anbieter. LLaMA wurde zur Grundlage für eine ganze Welle akademischer Fine-Tunes: Vicuna von LMSYS, Guanaco von der University of Washington, Stanford Alpaca, Berkeley Koala. Alle aufbauend auf demselben Meta-Modell. Drei Universitäten, eine Industriebasis.

Dann kamen Alibaba mit der Qwen-Serie und DeepSeek mit ihren Modellen dazu. Mistral aus Frankreich hat den europäischen Anspruch gehalten. Google ist mit der Gemma-Serie eingestiegen. Aber inzwischen wird diese Kategorie eindeutig von chinesischen Anbietern dominiert. Und ihre Zahl wächst. In den letzten zwölf Monaten sind Zhipu AI, Moonshot AI, Xiaomi und Baidu mit eigenen Open-Weight-Modellen dazugekommen.

Konkret in den Daten: Seit Januar 2025, also seit 17 Monaten, hatte kein einziges nicht-chinesisches Open-Weight-Modell die LMArena-Krone unter offenen Modellen. DeepSeek, Qwen, Kimi, GLM, in dieser Reihenfolge. Lückenlos. Athene-v2 von NexusFlow war im Dezember 2024 der letzte westliche Champion. Seitdem nicht mehr.

Die Liste wird länger, die Leistungsabstände zu den Frontier-Modellen der Big Player verkürzen sich. Das ist kein Aufholen mehr. Das ist eine Verschiebung.

Open-Weight-Timeline: Die Krone springt zwischen chinesischen Anbietern (AI Model Timeline)

Rennen 3 und 4: Image und Video

Bei Image-Generierung gibt es einen europäischen Lichtblick. FLUX.2 von Black Forest Labs, gegründet von Ex-Stability-AI-Mitarbeitern in Freiburg, führt aktuell das offene Feld der Bildmodelle an. Vor Stability AIs eigenen Nachfolgern und vor chinesischen Wettbewerbern wie Alibabas Qwen Image und Zhipus Image-Serien. Dass das relevanteste Open-Weight-Bildmodell aus Deutschland kommt, ist eine der wenigen guten europäischen Geschichten in diesem ganzen Feld.

Bei Video sieht das Bild wieder anders aus. Hier konkurrieren chinesische Anbieter (Kling von Kuaishou, Seedance von ByteDance, Hailuo von MiniMax) auf Augenhöhe mit Veo (Google) und Sora (OpenAI). Bei den US-Big-Tech-Modellen kennt das jeder. Bei den chinesischen Herausforderern eher nicht.

Cloud-Frontier: Video- und Image-Kronen mit chinesischer Beteiligung (AI Model Timeline)

Warum das schwer zu bewerten ist

Die Konsequenz dieser Dynamik: Modelle solide zu bewerten und vergleichbar zu machen, wird zunehmend schwierig.

Jede neue Veröffentlichung wird von viel Marketing begleitet. Zunehmend auch von Politik. Jeder Anbieter zeigt nur Benchmarks, in denen er stark ist. Schwachstellen werden verschleiert. Eingesetzte Architekturen werden oft nicht offengelegt. Was als „Open Source" angekündigt wird, ist bei näherem Hinsehen häufig „Open Weights" mit restriktiver Lizenz.

Deshalb ist auch meine Bewertung mit Vorsicht zu betrachten. Ich versuche, so neutral wie möglich zu bleiben, und stütze mich neben den von den Anbietern genannten Benchmarks auf möglichst unabhängige Quellen wie LMArena, HuggingFace und OpenRouter. Was extern verifiziert ist und was meine eigene Bewertung ist, kennzeichne ich auf der Timeline transparent.

Was daraus für strategische Entscheidungen folgt

Die spannendere Frage ist nicht „Welches Modell ist gerade das Beste?", sondern „Wer entscheidet eigentlich über die nächste Generation?" Bei Cloud-Frontier-Modellen sind das drei US-Konzerne. Bei Open-Weight-LLMs sind es zunehmend Forschungslabore in Hangzhou und Peking. Bei Image führt ein deutsches Team. Bei Video läuft ein offenes US-China-Rennen.

Das ist keine politische Aussage. Es ist die Beobachtung, dass die Frage nach Souveränität sich gerade neu verteilt. Und sie verteilt sich pro Modalität unterschiedlich. Wer Open-Weight-LLM-Souveränität will, kommt heute an chinesischen Anbietern nicht vorbei. Wer Open-Weight-Bildgenerierung will, hat eine europäische Option. Wer Video will, hat ein lebendiges Wettbewerbsfeld. Genau diese Verschiebung – die Wechselwirkung von Energie, Compute und KI-Souveränität in Europa – ist eines der Themen, an denen wir mit Latent Lab gerade arbeiten.

Was als nächstes kommt

Die Timeline ist nicht fertig. Sie wird auch nie fertig sein, weil die Branche schneller läuft als jede Kuration. Was als nächstes dazukommt: der Preisverlauf. Hier ist die Dynamik in den letzten 18 Monaten bemerkenswert. Das langfristige Bild verändert die strategische Bewertung deutlich. Ich sammle gerade noch Daten, dann kommt das als zweite Ebene dazu.

Wer Ideen, Anregungen, Verbesserungsvorschläge hat oder Fehler findet: gerne her damit. Die Timeline ist ein Werkzeug, das von Korrekturen lebt.