Auf einen Blick
Google hat TensorFlow 2.21 veröffentlicht. Die neue Version stellt LiteRT für den produktiven Einsatz im Edge-Bereich heraus, erweitert die Unterstützung für sehr niedrig quantisierte Modelle und streicht zugleich die Unterstützung für Python 3.9. Für Entwickler ändert sich damit sowohl die Deployment-Pipeline als auch die Kompatibilität bestehender Umgebungen.
Das Wichtigste
- Google hat TensorFlow 2.21 offiziell angekündigt und auf GitHub als Version v2.21.0 veröffentlicht.
- Im Mittelpunkt stehen LiteRT für On-Device-Inferenz, zusätzliche Operator-Unterstützung für INT2, INT4, INT8 und INT16x8 sowie das Ende des Supports für Python 3.9.
- Betroffen sind vor allem Teams, die KI-Modelle auf Smartphones, eingebetteten Systemen oder anderen Endgeräten bereitstellen.
Neue TensorFlow-Version rückt Edge-Inferenz in den Vordergrund
Google hat TensorFlow 2.21 veröffentlicht und die Neuerungen am 6. März in einem offiziellen Blogeintrag vorgestellt. Im Zentrum steht der Einsatz von KI-Modellen direkt auf Endgeräten. Nach Angaben des Unternehmens ist LiteRT nun für den produktiven Einsatz vorgesehen und soll die Ausführung von Modellen auf Geräten vereinheitlichen.
Neue Operatoren und geänderte Kompatibilität
Mit TensorFlow 2.21 erweitert Google die Unterstützung in tf.lite für sehr niedrige Präzisionen. Laut Release-Notes kommen zusätzliche Funktionen für INT2, INT4, INT8 und INT16x8 hinzu, darunter Unterstützung bei Cast-, Slice-, Vergleichs- und Fully-Connected-Operationen. Google nennt für LiteRT eine um den Faktor 1,4 höhere GPU-Leistung gegenüber dem bisherigen TFLite-Stand. Zugleich entfällt ab dieser Version die Unterstützung für Python 3.9. Auch TensorBoard gehört nicht mehr zu den direkten Abhängigkeiten von TensorFlow und muss bei Bedarf separat installiert werden.
Folgen für mobile und eingebettete KI-Anwendungen
Die Änderungen betreffen vor allem Entwicklungsumgebungen für mobile Apps, Edge-Geräte und eingebettete Systeme. Niedrigere Quantisierung kann Modelle verkleinern und die Ausführung auf lokaler Hardware beschleunigen. Für bestehende Projekte bedeutet das aber auch Anpassungsbedarf bei Build-Umgebungen, Testsystemen und Deployment-Prozessen, wenn noch Python 3.9 oder implizite TensorBoard-Installationen genutzt werden.
Teams müssen Umgebungen und Konvertierungspfade prüfen
Als Nächstes steht für Entwickler die technische Prüfung bestehender Modelle und Toolchains an. Dazu gehören die Umstellung auf unterstützte Python-Versionen, die separate Einbindung von TensorBoard und Tests für die Konvertierung in LiteRT- oder tf.lite-Workflows. Wie schnell bestehende Projekte vollständig auf LiteRT wechseln, ist bislang offen.
Release mit Fokus auf lokale KI-Ausführung
TensorFlow 2.21 ist vor allem ein Infrastruktur-Release für den Einsatz von KI außerhalb des Rechenzentrums. Die Version verschiebt den Schwerpunkt auf kompaktere Modelle, neue Laufzeitpfade und aktualisierte Entwicklungsumgebungen für On-Device-Inferenz.