Google AI Edge | Google AI for Developers

Giới thiệu Google AI Edge Portal: Đo điểm chuẩn AI trên thiết bị Edge trên quy mô lớn. Đăng ký để yêu cầu quyền truy cập trong bản xem trước riêng tư.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Chạy LLM trên thiết bị bằng LiteRT-LM

Khung suy luận nguồn mở, sẵn sàng cho sản xuất, được thiết kế để cung cấp các hoạt động triển khai LLM hiệu suất cao, nhiều nền tảng trên các thiết bị biên.

Tổng quan Bắt đầu

Tiêu điểm

Hãy xem blog mới nhất của chúng tôi để khám phá cách LiteRT-LM tăng cường khả năng triển khai AI tạo sinh trên thiết bị, khai thác toàn bộ tiềm năng của Gemma 4 với tốc độ cực nhanh và hiệu quả đáng kinh ngạc nhờ các API Swift, JavaScript và Flutter mới được bổ sung.

Bài đăng trên blog Tổng quan

Tại sao nên dùng LiteRT-LM?

Nhiều nền tảng

Triển khai LLM trên Android, iOS, Web và máy tính.

Được tăng tốc bằng phần cứng

Tối đa hoá hiệu suất bằng tính năng tăng tốc GPU và NPU.

Nhiều chức năng AI tạo sinh

Hỗ trợ các LLM phổ biến cũng như đa phương thức (Thị giác, Âm thanh) và Sử dụng công cụ.

Bắt đầu xây dựng

Python

API Python có tính năng tăng tốc phần cứng trên Linux, MacOS, Windows và Raspberry Pi.

Hướng dẫn về Python

Android

Ứng dụng Android gốc và các công cụ dành cho máy tính dựa trên JVM.

Hướng dẫn về Android

iOS

API Swift gốc của iOS (sắp có trên macOS).

Hướng dẫn về Swift

Web

API JavaScript và TypeScript cho các ứng dụng web dựa trên trình duyệt có tính năng tăng tốc WebGPU.

Web Guide

Flutter

Tạo ứng dụng Flutter nhiều nền tảng bằng gói flutter_gemma do cộng đồng duy trì.

Hướng dẫn về Flutter

C++

API C++ đa nền tảng .

Hướng dẫn về C++

File Builder

Tạo tệp .litertlm từ các mô hình LiteRT đã chuyển đổi.

Hướng dẫn về File Builder

Tham gia cộng đồng

LiteRT-LM trên GitHub

Đóng góp cho dự án nguồn mở, báo cáo vấn đề và xem ví dụ.

Xem trên GitHub

Khuôn mặt ôm

Tải các mô hình đã chuyển đổi trước (Gemma, Qwen và nhiều mô hình khác) xuống và tham gia thảo luận.

Xem trên Hugging Face

Blog và thông báo

Tăng cường khả năng suy luận trên thiết bị của Gemma 4 bằng tính năng Dự đoán nhiều mã thông báo (MTP)

Trải nghiệm tốc độ giải mã nhanh hơn gấp 2 lần trên GPU di động mà không làm giảm chất lượng.

Đưa các kỹ năng của tác nhân AI tiên tiến đến thiết bị biên bằng Gemma 4.

Triển khai Gemma 4 trong ứng dụng và trên nhiều loại thiết bị hơn với hiệu suất và phạm vi tiếp cận vượt trội bằng cách sử dụng LiteRT-LM.

AI tạo sinh trên thiết bị trong Chrome, Chromebook Plus và Pixel Watch

Triển khai mô hình ngôn ngữ trên các nền tảng dựa trên trình duyệt và thiết bị đeo bằng LiteRT-LM ở quy mô lớn.

Tính năng gọi hàm trên thiết bị trong Google AI Edge Gallery

Khám phá cách tinh chỉnh FunctionGemma và bật các chức năng gọi hàm nhờ API Sử dụng công cụ LiteRT-LM.

Mô hình ngôn ngữ nhỏ, đa phương thức và gọi hàm của Google AI Edge

Thông tin chi tiết mới nhất về RAG, tính đa phương thức và tính năng gọi hàm cho các mô hình ngôn ngữ biên.

Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.

Cập nhật lần gần đây nhất: 2026-05-19 UTC.