Updates

Google veröffentlicht TensorFlow 2.21 mit LiteRT

Stand: 07. March 2026, 22:40 Uhr Berlin Auf einen Blick Google hat TensorFlow 2.21 veröffentlicht. Die neue Version stellt LiteRT für den produktiven Einsatz im…

Von Wolfgang

07. März 20263 Min. Lesezeit

Google veröffentlicht TensorFlow 2.21 mit LiteRT

Google hat TensorFlow 2.21 veröffentlicht. Die neue Version stellt LiteRT für den produktiven Einsatz im Edge-Bereich heraus, erweitert die Unterstützung für sehr niedrig quantisierte Modelle und streicht zugleich die Unterstützung für Python 3.9. Für…

Stand: 07. March 2026, 22:40 Uhr

Berlin

Auf einen Blick

Das Wichtigste

Google hat TensorFlow 2.21 offiziell angekündigt und auf GitHub als Version v2.21.0 veröffentlicht.
Im Mittelpunkt stehen LiteRT für On-Device-Inferenz, zusätzliche Operator-Unterstützung für INT2, INT4, INT8 und INT16x8 sowie das Ende des Supports für Python 3.9.
Betroffen sind vor allem Teams, die KI-Modelle auf Smartphones, eingebetteten Systemen oder anderen Endgeräten bereitstellen.

Neue TensorFlow-Version rückt Edge-Inferenz in den Vordergrund

Google hat TensorFlow 2.21 veröffentlicht und die Neuerungen am 6. März in einem offiziellen Blogeintrag vorgestellt. Im Zentrum steht der Einsatz von KI-Modellen direkt auf Endgeräten. Nach Angaben des Unternehmens ist LiteRT nun für den produktiven Einsatz vorgesehen und soll die Ausführung von Modellen auf Geräten vereinheitlichen.

Neue Operatoren und geänderte Kompatibilität

Mit TensorFlow 2.21 erweitert Google die Unterstützung in tf.lite für sehr niedrige Präzisionen. Laut Release-Notes kommen zusätzliche Funktionen für INT2, INT4, INT8 und INT16x8 hinzu, darunter Unterstützung bei Cast-, Slice-, Vergleichs- und Fully-Connected-Operationen. Google nennt für LiteRT eine um den Faktor 1,4 höhere GPU-Leistung gegenüber dem bisherigen TFLite-Stand. Zugleich entfällt ab dieser Version die Unterstützung für Python 3.9. Auch TensorBoard gehört nicht mehr zu den direkten Abhängigkeiten von TensorFlow und muss bei Bedarf separat installiert werden.

Folgen für mobile und eingebettete KI-Anwendungen

Die Änderungen betreffen vor allem Entwicklungsumgebungen für mobile Apps, Edge-Geräte und eingebettete Systeme. Niedrigere Quantisierung kann Modelle verkleinern und die Ausführung auf lokaler Hardware beschleunigen. Für bestehende Projekte bedeutet das aber auch Anpassungsbedarf bei Build-Umgebungen, Testsystemen und Deployment-Prozessen, wenn noch Python 3.9 oder implizite TensorBoard-Installationen genutzt werden.

Teams müssen Umgebungen und Konvertierungspfade prüfen

Als Nächstes steht für Entwickler die technische Prüfung bestehender Modelle und Toolchains an. Dazu gehören die Umstellung auf unterstützte Python-Versionen, die separate Einbindung von TensorBoard und Tests für die Konvertierung in LiteRT- oder tf.lite-Workflows. Wie schnell bestehende Projekte vollständig auf LiteRT wechseln, ist bislang offen.

Release mit Fokus auf lokale KI-Ausführung

TensorFlow 2.21 ist vor allem ein Infrastruktur-Release für den Einsatz von KI außerhalb des Rechenzentrums. Die Version verschiebt den Schwerpunkt auf kompaktere Modelle, neue Laufzeitpfade und aktualisierte Entwicklungsumgebungen für On-Device-Inferenz.