Analyse on kontextfenster

Kleiner, besser, billiger — und dann?

Sun, 26 Apr 2026 00:00:00 +0000

Alibaba hat letzte Woche Qwen3.6-27B veröffentlicht. 27 Milliarden Parameter. Es übertrifft Qwen3.5-397B in fast allen Coding-Benchmarks — ein Modell mit fast 15-mal so vielen Parametern. Auf SWE-bench Verified erreicht es 77,2 Punkte, der größere Vorgänger 76,2. Auf Terminal-Bench 2.0 ist der Abstand deutlicher: 59,3 zu 52,5.

Das ist keine Kleinigkeit. Aber es verdient auch keine Fanfare.

Was hier passiert, ist Destillation — die Kunst, ein kompakteres Modell mit dem Wissen eines größeren zu trainieren. Große Modelle generieren Trainingsbeispiele, kleine Modelle lernen davon. Das Ergebnis kann bei spezifischen Aufgaben besser abschneiden, weil es gezielter trainiert wurde. Qwen3.6-27B ist auf Coding spezialisiert. Sein größerer Vorgänger ist ein Generalist. Das ist kein fairer Vergleich — und trotzdem ist er informativ.

Schneller als das Verstehen

Tue, 07 Apr 2026 00:00:00 +0000

Es gibt eine Schwelle, jenseits derer Geschwindigkeit nicht mehr als Fortschritt wahrgenommen wird, sondern als Kontrollverlust. Die Frage ist, ob wir schon auf der anderen Seite sind.

In den vergangenen drei Jahren wurden Sprachmodelle von experimentellen Werkzeugen zu eingebetteter Infrastruktur. Sie stecken in Kundenservicesystemen, Bewerbungsfiltern, medizinischen Vordiagnoseprozessen, Nachrichtenproduktionen, Rechtsdokumenten. Die meisten Menschen, die von diesen Systemen betroffen sind, wissen es nicht. Die meisten, die es wissen, verstehen die Systeme nicht. Das ist keine Kritik an Bildungsstand oder Aufmerksamkeit. Die Systeme sind so komplex und so schnell in produktive Kontexte gerutscht, dass selbst die Leute, die sie bauen, bestimmte Eigenschaften nur noch empirisch beobachten, nicht mehr vollständig erklären können.