Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Gemini Enterprise Agent Platform se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Especifica un extremo

Para los extremos regionales estándar (como us-central) y el extremo global, haz lo siguiente:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

Extremos multirregionales

Los extremos multirregionales te permiten garantizar que el procesamiento de aprendizaje automático de los Datos del Cliente por parte del servicio permanezca dentro de un límite jurisdiccional específico, como Estados Unidos o la Unión Europea.

En la siguiente tabla, se enumeran los nombres de host para los extremos multirregionales:

Multirregión Ubicación Nombre de host
Estados Unidos us https://aiplatform.us.rep.googleapis.com
Unión Europea eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué modelos admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Para obtener información sobre la disponibilidad global de extremos para los modelos de socios, consulta la pestaña Global en la Google Cloud tabla de ubicaciones de extremos de modelos de socios.

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes para modelos de Anthropic y OpenMaaS
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con la capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada

Modelo Versión del modelo compatible más reciente
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Imagen de Gemini 3.1 Flash vista previa gemini-3.1-flash-image-preview
Gemini 3.1 Pro versión preliminar gemini-3.1-pro-preview
Gemini 3 Flash vista previa gemini-3-flash-preview
Imagen de Gemini 3 Pro vista previa gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash vista previa gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite vista previa gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Ubicaciones de los extremos de los modelos de Google

Los modelos de Google en Gemini Enterprise Agent Platform están disponibles para los siguientes extremos:

Global

Global(global)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Multirregión

Estados Unidos multirregión(us) Multirregión de la Unión Europea(eu)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image vista previa (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro vista previa (gemini-3.1-pro-preview)
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Imagen de Gemini 3 Pro versión preliminar (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Veo en los modelos de Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate preview (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate vista previa (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto independiente de cuotas del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de plataforma de Gemini Enterprise para MaaS.

Los extremos de los modelos de socios para Agent Platform están disponibles en las siguientes regiones:

Global

Global(global)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Multirregión

Estados Unidos multirregión(us) Multirregión de la Unión Europea(eu)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic (obsoleto)
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto independiente de cuotas del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección “Extremos regionales y globales” en Modelos abiertos de Gemini Enterprise Agent Platform para MaaS.

Los extremos de modelos abiertos para Agent Platform están disponibles en las siguientes regiones:

Global

Global(global)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Multirregión

Estados Unidos multirregión(us) Multirregión de la Unión Europea(eu)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)