Produktionsreifes Open-Source-Inferenz-Framework für leistungsstarke, plattformübergreifende LLM-Bereitstellungen auf Edge-Geräten.

Spotlight

In unserem aktuellen Blog erfahren Sie, wie LiteRT-LM Ihre GenAI-Bereitstellungen auf dem Gerät optimiert und das volle Potenzial von Gemma 4 mit rasanter Geschwindigkeit und unglaublicher Effizienz freisetzt. Dazu wurden neue Swift-, JavaScript- und Flutter-APIs hinzugefügt.

Warum LiteRT-LM?

LLMs auf Android-, iOS-, Web- und Desktop-Geräten bereitstellen
Leistung mit GPU- und NPU-Beschleunigung maximieren
Unterstützung für gängige LLMs sowie Multimodalität (Vision, Audio) und Tool Use.

Gleich mit dem Erstellen loslegen

Python-APIs mit Hardwarebeschleunigung für Linux, MacOS, Windows und Raspberry Pi.
Native Android-Apps und JVM-basierte Desktop-Tools.
Systemeigene iOS-Swift-APIs (macOS folgt demnächst).
JavaScript- und TypeScript-APIs für browserbasierte Web-Apps mit WebGPU-Beschleunigung.
Mit dem von der Community verwalteten Paket „flutter_gemma“ plattformübergreifende Flutter-Apps erstellen
plattformübergreifende C++-APIs .
.litertlm-Dateien aus konvertierten LiteRT-Modellen erstellen

Teil der Community werden

Sie können zum Open-Source-Projekt beitragen, Probleme melden und Beispiele ansehen.
Laden Sie vorkonvertierte Modelle (Gemma, Qwen und mehr) herunter und beteiligen Sie sich an der Diskussion.

Blogs und Ankündigungen

Auf mobilen GPUs ist die Decodierung mehr als doppelt so schnell – ohne Qualitätsverlust.
Mit LiteRT-LM können Sie Gemma 4 in der App und auf einer Vielzahl von Geräten mit hervorragender Leistung und Reichweite bereitstellen.
Mit LiteRT-LM können Sie Sprachmodelle auf Wearables und browserbasierten Plattformen bereitstellen.
Hier erfahren Sie, wie Sie FunctionGemma optimieren und Funktionsaufruffunktionen aktivieren, die auf LiteRT-LM Tool Use APIs basieren.
Aktuelle Informationen zu RAG, Multimodalität und Funktionsaufrufen für Edge-Sprachmodelle.