Google AI Edge | Google AI for Developers

Google AI Edge Portal: Edge-KI im großen Maßstab benchmarken. Melden Sie sich an, um während der privaten Vorschau Zugriff anzufordern.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

LLMs mit LiteRT-LM auf dem Gerät ausführen

Produktionsreifes Open-Source-Inferenz-Framework für leistungsstarke, plattformübergreifende LLM-Bereitstellungen auf Edge-Geräten.

Übersicht Jetzt starten

Spotlight

In unserem aktuellen Blog erfahren Sie, wie LiteRT-LM Ihre GenAI-Bereitstellungen auf dem Gerät optimiert und das volle Potenzial von Gemma 4 mit rasanter Geschwindigkeit und unglaublicher Effizienz freisetzt. Dazu wurden neue Swift-, JavaScript- und Flutter-APIs hinzugefügt.

Blogpost Übersicht

Warum LiteRT-LM?

Plattformübergreifend

LLMs auf Android-, iOS-, Web- und Desktop-Geräten bereitstellen

Hardwarebeschleunigt

Leistung mit GPU- und NPU-Beschleunigung maximieren

Umfassende GenAI-Funktionen

Unterstützung für gängige LLMs sowie Multimodalität (Vision, Audio) und Tool Use.

Gleich mit dem Erstellen loslegen

Python

Python-APIs mit Hardwarebeschleunigung für Linux, MacOS, Windows und Raspberry Pi.

Python-Leitfaden

Android

Native Android-Apps und JVM-basierte Desktop-Tools.

Android-Leitfaden

iOS

Systemeigene iOS-Swift-APIs (macOS folgt demnächst).

Swift-Leitfaden

Web

JavaScript- und TypeScript-APIs für browserbasierte Web-Apps mit WebGPU-Beschleunigung.

Web Guide

Flutter

Mit dem von der Community verwalteten Paket „flutter_gemma“ plattformübergreifende Flutter-Apps erstellen

Flutter-Leitfaden

C++

plattformübergreifende C++-APIs .

File Builder

.litertlm-Dateien aus konvertierten LiteRT-Modellen erstellen

Leitfaden für File Builder

Teil der Community werden

LiteRT-LM auf GitHub

Sie können zum Open-Source-Projekt beitragen, Probleme melden und Beispiele ansehen.

Auf GitHub ansehen

Hugging Face

Laden Sie vorkonvertierte Modelle (Gemma, Qwen und mehr) herunter und beteiligen Sie sich an der Diskussion.

In Hugging Face ansehen

Blogs und Ankündigungen

Gemma 4-Inferenz auf dem Gerät mit Multi-Token Prediction (MTP) optimieren

Auf mobilen GPUs ist die Decodierung mehr als doppelt so schnell – ohne Qualitätsverlust.

Mit Gemma 4 können Sie modernste agentische Fähigkeiten an den Edge bringen.

Mit LiteRT-LM können Sie Gemma 4 in der App und auf einer Vielzahl von Geräten mit hervorragender Leistung und Reichweite bereitstellen.

On-Device-GenAI in Chrome, Chromebook Plus und Pixel Watch

Mit LiteRT-LM können Sie Sprachmodelle auf Wearables und browserbasierten Plattformen bereitstellen.

Funktionsaufrufe auf dem Gerät in der Google AI Edge-Galerie

Hier erfahren Sie, wie Sie FunctionGemma optimieren und Funktionsaufruffunktionen aktivieren, die auf LiteRT-LM Tool Use APIs basieren.

Google AI Edge – Small Language Models, Multimodalität und Funktionsaufrufe

Aktuelle Informationen zu RAG, Multimodalität und Funktionsaufrufen für Edge-Sprachmodelle.

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.

Zuletzt aktualisiert: 2026-05-19 (UTC).