部署和端點

Gemini Enterprise Agent Platform 上的 Google 和合作夥伴模型,以及生成式 AI 功能,會以特定區域端點和全域端點的形式公開。全域端點涵蓋全世界,與單一區域相比,可用性和可靠性更高。

指定端點

標準區域端點 (例如 us-central) 和全域端點:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

多區域端點

多區域端點可確保服務對客戶資料執行的機器學習處理作業,會保留在特定管轄範圍內,例如美國或歐盟。

下表列出多區域端點的主機名稱:

多區域 位置 主機名稱
美國 us https://aiplatform.us.rep.googleapis.com
歐盟 eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

全域端點

為要求選取全域端點,可提高整體可用性,同時減少資源耗盡 (429) 錯誤。如有機器學習處理要求,請勿使用全域端點,因為發出要求時,您無法控管或瞭解機器學習處理要求傳送至哪個區域。

支援的模型

在特定區域,下列 Google 模型支援使用全域端點。如要瞭解哪些模型支援全域端點,請參閱 Google 模型端點位置表格中的「全球」分頁。

如要瞭解合作夥伴模型全球端點的可用情形,請參閱Google Cloud 合作夥伴模型端點位置表中的「全球」分頁。

限制

使用全域端點時,無法使用下列功能:

  • 調整
  • Anthropic 和 OpenMaaS 模型的批次預測
  • 檢索增強生成 (RAG) 語料庫 (支援 RAG 要求)

搭配佈建輸送量使用全域端點時,僅適用於下列模型:

使用佈建輸送量時,按一下即可查看全域端點支援的模型

型號 最新支援的模型版本
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Gemini 3.1 Flash Image 預先發布版 gemini-3.1-flash-image-preview
Gemini 3.1 Pro 預先發布版 gemini-3.1-pro-preview
Gemini 3 Flash 預先發布版 gemini-3-flash-preview
Gemini 3 Pro 圖片 預先發布版 gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash 預先發布版 gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite 預先發布版 gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Google 模型端點位置

Gemini Enterprise Agent Platform 中的 Google 模型適用於下列端點:

全球

全域(全域)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

多區域

美國多區域(us) 歐盟多區域(eu)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 預先發布版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 預先發布版 (gemini-3.1-pro-preview)
Gemini 3 Flash 預先發布版 (gemini-3-flash-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預覽版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Gemini Enterprise Agent Platform 模型中的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 預覽 (veo-2.0-generate-exp)
Veo 2 Generate 預覽 (veo-2.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-generate-preview)
Veo 3 Generate 預覽 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast 生成 (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite 生成 預覽 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

Google Cloud 合作夥伴模型端點位置

Google 會從您指定的區域提供要求。Google 也為部分模型提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱「 Gemini Enterprise Agent Platform 平台合作夥伴 models for MaaS」一文的「Regional and global endpoint」一節。

Agent Platform 的合作夥伴模型端點可在下列地區使用:

全球

全域(全域)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

多區域

美國多區域(us) 歐盟多區域(eu)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Anthropic 模型
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku (已淘汰)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud 開放模型端點位置

Google 會從您指定的區域提供要求。Google 也為部分模型提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱「 Gemini Enterprise Agent Platform open models for MaaS」的「Regional and global endpoint」(區域和全域端點) 一節。

Agent Platform 的開放模型端點可在下列地區使用:

全球

全域(全域)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

多區域

美國多區域(us) 歐盟多區域(eu)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
Multilingual E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)