Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Gemini Enterprise Agent Platform se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Especifica un extremo

Para los extremos regionales estándar (como us-central) y el extremo global, haz lo siguiente:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

Nota: Cuando uses el extremo global, usa

https://aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/global/publishers/google/models/${MODEL_ID}:generateContent

en lugar de un extremo de servicio antepuesto con https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com.

Extremos multirregionales

Los extremos multirregionales te permiten garantizar que el procesamiento de aprendizaje automático de los Datos del Cliente por parte del servicio permanezca dentro de un límite jurisdiccional específico, como Estados Unidos o la Unión Europea.

En la siguiente tabla, se enumeran los nombres de host para los extremos multirregionales:

Multirregión	Ubicación	Nombre de host
Estados Unidos	`us`	`https://aiplatform.us.rep.googleapis.com`
Unión Europea	`eu`	`https://aiplatform.eu.rep.googleapis.com`

Python

Nota: Los agentes del ADK usan automáticamente la ubicación especificada cuando se inicializa el entorno con vertexai.init() o cuando se crea un vertexai.Client().

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué modelos admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Gemini 3.5 Flash
Gemini 3.1 Flash-Lite
Imagen de Gemini 3.1 Flash (versión preliminar)
Gemini 3.1 Pro (versión preliminar)
Gemini 3 Flash (versión preliminar)
Gemini 3 Pro Image (versión preliminar)
Gemini 2.5 Pro
Gemini 2.5 Flash (versión preliminar)
Gemini 2.5 Flash-Lite (versión preliminar)
Gemini 2.5 Flash Image
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

Para obtener información sobre la disponibilidad global de extremos para los modelos de socios, consulta la pestaña Global en la Google Cloud tabla de ubicaciones de extremos de modelos de socios.

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

Ajuste
Predicción por lotes para modelos de Anthropic y OpenMaaS
Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con la capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada

Modelo	Versión del modelo compatible más reciente
Gemini 3.5 Flash	`gemini-3.5-flash`
Gemini 3.1 Flash-Lite	`gemini-3.1-flash-lite`
Imagen de Gemini 3.1 Flash vista previa	`gemini-3.1-flash-image-preview`
Gemini 3.1 Pro versión preliminar	`gemini-3.1-pro-preview`
Gemini 3 Flash vista previa	`gemini-3-flash-preview`
Imagen de Gemini 3 Pro vista previa	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash vista previa	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite vista previa	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`

Ubicaciones de los extremos de los modelos de Google

Los modelos de Google en Gemini Enterprise Agent Platform están disponibles para los siguientes extremos:

Global

	Global(global)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Multirregión

	Estados Unidos multirregión(us)	Multirregión de la Unión Europea(eu)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de Gemini
Gemini 3.5 Flash `(gemini-3.5-flash)`
Gemini 3.1 Flash-Lite `(gemini-3.1-flash-lite)`
Gemini 3.1 Flash Image vista previa `(gemini-3.1-flash-image-preview)`
Gemini 3.1 Pro vista previa `(gemini-3.1-pro-preview)`
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Imagen de Gemini 3 Pro versión preliminar `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Modelos de embeddings
Gemini Embedding 2 `(gemini-embedding-2)`
Gemini Embedding `(gemini-embedding-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate preview `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Veo 3.1 Lite Generate vista previa `(veo-3.1-lite-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto independiente de cuotas del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de plataforma de Gemini Enterprise para MaaS.

Los extremos de los modelos de socios para Agent Platform están disponibles en las siguientes regiones:

Global

	Global(global)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Multirregión

	Estados Unidos multirregión(us)	Multirregión de la Unión Europea(eu)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto independiente de cuotas del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección “Extremos regionales y globales” en Modelos abiertos de Gemini Enterprise Agent Platform para MaaS.

Los extremos de modelos abiertos para Agent Platform están disponibles en las siguientes regiones:

Global

	Global(global)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Multirregión

	Estados Unidos multirregión(us)	Multirregión de la Unión Europea(eu)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Implementaciones y extremos Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Especifica un extremo

Python

Python

REST

Extremos multirregionales

Python

Python

REST

Extremo global

Modelos compatibles

Limitaciones

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada

Ubicaciones de los extremos de los modelos de Google

Global

Multirregión

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Global

Multirregión

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

Google Cloud ubicaciones de extremos de modelos abiertos

Global

Multirregión

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

Implementaciones y extremos