El futuro de los data lakehouses: abiertos e interoperables para la era de los agentes. Lee el blog.

Lakehouse para Apache Iceberg (antes BigLake)

Lakehouse abierto y entre nubes para la era de los agentes

Almacenamiento, administración y rendimiento empresarial para crear casos de uso de IA escalables, analíticos, operativos y en tiempo real en un lakehouse abierto unificado, entre nubes y multimodal.

Apache Iceberg es una marca comercial de The Apache Software Foundation.

Funciones

Iceberg completamente administrado con interoperabilidad de lectura y escritura

Las tablas de Apache Iceberg, administradas con el catálogo REST de Lakehouse Iceberg, proporcionan interoperabilidad de lectura y escritura entre BigQuery y Google Cloud Managed Service para Apache Spark, así como motores OSS compatibles con Iceberg como Spark, Trino y Flink, y ahora con motores externos como Snowflake y Databricks (versión preliminar). Esto te ayuda a conectar fácilmente tus tablas de Iceberg directamente a motores como BigQuery y Spark administrado por Google para que puedas acelerar tus cargas de trabajo de IA.

La IA de Google conectada a tus datos de Iceberg en la nube

Aprovecha la interconexión y el almacenamiento en caché entre nubes (versión preliminar) para obtener acceso rápido y de baja latencia a los datos de S3 Iceberg. Ejecuta BigQuery, Spark y Gemini Enterprise a través de trabajos de API de análisis conversacional en datos de AWS con características de precio y rendimiento comparables a las soluciones nativas de plataformas de datos. Además, la nueva federación de catálogos de Lakehouse Runtime (versión preliminar) une tu ecosistema sin problemas, lo que permite que BigQuery y Google Managed Spark descubran y analicen datos empresariales en Snowflake, Databricks y AWS Glue.

Aceleración del precio y el rendimiento para Iceberg

La ejecución vectorizada mejorada de BigQuery ahora es el valor predeterminado para las tablas de catálogo REST de Lakehouse Iceberg, así como para las tablas de Iceberg y Parquet en el catálogo de BigQuery. Descarga el mantenimiento rutinario de Iceberg, como la compactación, la agrupación en clústeres y la recolección de elementos no utilizados, directamente a Google Lakehouse. Las nuevas funciones automatizadas, que incluyen administración de tablas, partición, agrupamiento en clústeres y optimización basada en el historial (DG para tablas de Iceberg en el catálogo de BigQuery; versión preliminar para el catálogo de REST), aceleran el rendimiento en relación con el precio sin sobrecarga manual.

BigQuery y Spark diferenciados

Potencia las estadísticas en tiempo real con Iceberg usando la transmisión de BigQuery para una transferencia de alto rendimiento con latencia de lectura cero. Crea canalizaciones de procesamiento complejas con transacciones de varias instrucciones y replicación de datos de cambio de BigQuery en tablas de Iceberg (DG para el catálogo de BigQuery; versión preliminar para el catálogo de REST). Une datos estructurados y no estructurados con BigQueryObjectRefs para desbloquear análisis multimodales, vectoriales y de gráficos. Potencia las cargas de trabajo de ciencia de datos de Spark con Lightning Engine con un rendimiento hasta 4.5 veces más rápido.

Contexto y administración en tiempo real para los agentes

Potencia los agentes de IA con datos transaccionales en tiempo real. Transmite datos operativos desde Spanner, AlloyDB y Cloud SQL a BigQuery y tablas Iceberg administradas para un análisis instantáneo, y envía estas estadísticas analíticas directamente a AlloyDB o Spanner para entregarlas con una latencia de submilisegundos y QPS alta. Obtén una administración unificada con linaje, generación de perfiles y calidad de los datos a través de la integración de Knowledge Catalog (antes Dataplex). Asigna datos transaccionales, no estructurados y de iceberg a tu lógica empresarial, lo que les da a tus agentes el contexto profundo que necesitan para entregar resultados precisos, confiables y totalmente controlados.

Cómo funciona

El catálogo de REST de Lakehouse actúa como un centro central para tus tablas de Iceberg. Proporciona acceso universal de lectura y escritura en BigQuery, Managed Service para Apache Spark, motores OSS y socios, lo que conecta tus datos sin problemas a cualquier motor para acelerar la IA.

Usos comunes

Fundamentos y modernización de Lakehouse

Moderniza a una arquitectura de lakehouse abierta y unificada

Moderniza tu base de datos con Lakehouse de Google. Migra Hadoop heredado a Cloud Storage sin servidores y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo de REST de Iceberg de Lakehouse elimina los silos y ofrece un entorno de ejecución interoperable para Spark, Trino y Flink. Con la compatibilidad del catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

Instructivos, guías de inicio rápido y labs

Moderniza a una arquitectura de lakehouse abierta y unificada

Moderniza tu base de datos con Lakehouse de Google. Migra Hadoop heredado a Cloud Storage sin servidores y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo de REST de Iceberg de Lakehouse elimina los silos y ofrece un entorno de ejecución interoperable para Spark, Trino y Flink. Con la compatibilidad del catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

Interoperabilidad de varios motores

Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

Trae tus canalizaciones de Iceberg existentes y lee o escribe en esas tablas sin problemas con BigQuery o Spark administrado, mientras modernizas fácilmente con las capacidades avanzadas de BigQuery. Potencia la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de análisis conversacional en BigQuery que trabajen con tus datos en S3.

Instructivos, guías de inicio rápido y labs

Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

Trae tus canalizaciones de Iceberg existentes y lee o escribe en esas tablas sin problemas con BigQuery o Spark administrado, mientras modernizas fácilmente con las capacidades avanzadas de BigQuery. Potencia la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de análisis conversacional en BigQuery que trabajen con tus datos en S3.

Incorpora datos de Iceberg en flujos de trabajo de IA

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Potencia el análisis multimodal con la IA de BigQuery combinando tablas Iceberg estructuradas con datos no estructurados usando ObjectRefs de BigQuery para la inferencia de SQL único. Entrenar modelos de la plataforma de agentes de Gemini Enterprise con viajes en el tiempo para depurar el desvío de datos. Federa catálogos REST globales en una malla de datos unificada, analiza registros a gran escala de forma económica y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.

Instructivos, guías de inicio rápido y labs

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Potencia el análisis multimodal con la IA de BigQuery combinando tablas Iceberg estructuradas con datos no estructurados usando ObjectRefs de BigQuery para la inferencia de SQL único. Entrenar modelos de la plataforma de agentes de Gemini Enterprise con viajes en el tiempo para depurar el desvío de datos. Federa catálogos REST globales en una malla de datos unificada, analiza registros a gran escala de forma económica y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.

Experiencia de Spark de primer nivel

Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

Accede a una experiencia de Spark sin problemas. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg con IDE unificados. La nueva extensión de VS Code Antigravity actúa como un socio de IA para generar canalizaciones, depurar código y automatizar CI/CD a partir de lenguaje natural. Además, nuestro Lightning Engine vectorizado acelera la ejecución de Spark hasta 4.5 veces, sin necesidad de realizar cambios en el código.

Instructivos, guías de inicio rápido y labs

Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

Accede a una experiencia de Spark sin problemas. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg con IDE unificados. La nueva extensión de VS Code Antigravity actúa como un socio de IA para generar canalizaciones, depurar código y automatizar CI/CD a partir de lenguaje natural. Además, nuestro Lightning Engine vectorizado acelera la ejecución de Spark hasta 4.5 veces, sin necesidad de realizar cambios en el código.

Análisis de alto rendimiento con BigQuery

Optimización del rendimiento con BigQuery

Aprovecha la escala de BigQuery mientras mantienes un almacenamiento flexible. Ejecutar transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa la compatibilidad avanzada de BigQuery con el entorno de ejecución y la partición para Iceberg para crear tablas particionadas o agrupadas que aprovechen la reducción de bloques para una ejecución de consultas de alta velocidad y rentable.

Instructivos, guías de inicio rápido y labs

Optimización del rendimiento con BigQuery

Aprovecha la escala de BigQuery mientras mantienes un almacenamiento flexible. Ejecutar transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa la compatibilidad avanzada de BigQuery con el entorno de ejecución y la partición para Iceberg para crear tablas particionadas o agrupadas que aprovechen la reducción de bloques para una ejecución de consultas de alta velocidad y rentable.

Inteligencia en tiempo real

Combinación de datos transaccionales y analíticos para la IA de agentes

Potencia los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en tablas de Iceberg de Lakehouse. Luego, usa consultas continuas de SQL para supervisar estos datos de transmisión, ejecutar inferencias de IA de forma instantánea y activar acciones posteriores, lo que proporciona inteligencia en tiempo real para tus cargas de trabajo operativas más importantes.

Instructivos, guías de inicio rápido y labs

Combinación de datos transaccionales y analíticos para la IA de agentes

Potencia los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en tablas de Iceberg de Lakehouse. Luego, usa consultas continuas de SQL para supervisar estos datos de transmisión, ejecutar inferencias de IA de forma instantánea y activar acciones posteriores, lo que proporciona inteligencia en tiempo real para tus cargas de trabajo operativas más importantes.

Administración de lakehouse de extremo a extremo

Administra tu lakehouse con Knowledge Catalog

Knowledge Catalog proporciona una capa de administración unificada descubriendo automáticamente tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de entornos de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garantizan un control de acceso coherente a nivel de fila y columna en BigQuery y en motores de procesamiento de código abierto.

Instructivos, guías de inicio rápido y labs

Administra tu lakehouse con Knowledge Catalog

Knowledge Catalog proporciona una capa de administración unificada descubriendo automáticamente tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de entornos de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garantizan un control de acceso coherente a nivel de fila y columna en BigQuery y en motores de procesamiento de código abierto.

Precios

Cómo funcionan los precios de Lakehouse (BigLake)	Los precios de Lakehouse (BigLake) se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos.
Servicios y uso	Descripción	Precio (USD)
Administración de tablas de Lakehouse (BigLake)	Recursos de procesamiento para administrar tablas de Lakehouse (BigLake) que se usan para la optimización automática del almacenamiento de tablas.	A partir de $0.12 por hora de DCU
Almacenamiento de metadatos de Lakehouse (BigLake)	El metastore de Lakehouse para Apache Iceberg (catálogo de entornos de ejecución de Lakehouse) cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes.	A partir de $0.04 por GiB al mes
Acceso a metadatos de Lakehouse (BigLake)	Operaciones de clase A: Los cargos de acceso a los metadatos de Lakehouse (BigLake) incluyen operaciones de escritura, actualización, creación, listado y configuración, con un nivel gratuito de 5,000 operaciones por mes.	A partir de $6.00 por millón de operaciones
Acceso a metadatos de Lakehouse (BigLake)	Operaciones de clase B: Los cargos de acceso a los metadatos de Lakehouse (BigLake) se aplican a las operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50,000 operaciones por mes incluidas.	A partir de $0.90 por millón de operaciones

Cómo funcionan los precios de Lakehouse (BigLake)

Los precios de Lakehouse (BigLake) se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos.

Administración de tablas de Lakehouse (BigLake)

Descripción

Recursos de procesamiento para administrar tablas de Lakehouse (BigLake) que se usan para la optimización automática del almacenamiento de tablas.

Precio (USD)

Starting at

$0.12

por hora de DCU

Almacenamiento de metadatos de Lakehouse (BigLake)

Descripción

El metastore de Lakehouse para Apache Iceberg (catálogo de entornos de ejecución de Lakehouse) cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes.

Precio (USD)

Starting at

$0.04

por GiB al mes

Acceso a metadatos de Lakehouse (BigLake)

Descripción

Operaciones de clase A: Los cargos de acceso a los metadatos de Lakehouse (BigLake) incluyen operaciones de escritura, actualización, creación, listado y configuración, con un nivel gratuito de 5,000 operaciones por mes.

Precio (USD)

Starting at

$6.00

por millón de operaciones

Operaciones de clase B: Los cargos de acceso a los metadatos de Lakehouse (BigLake) se aplican a las operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50,000 operaciones por mes incluidas.

Descripción

Starting at

$0.90

por millón de operaciones

Calculadora de precios

Calcula los costos mensuales de Lakehouse, incluidos los precios y las tarifas específicos de una región.

Presupuesto personalizado

Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.

Lakehouse para Apache Iceberg (antes BigLake)

Lakehouse abierto y entre nubes para la era de los agentes

Aspectos destacados del producto

Iceberg completamente administrado con interoperabilidad de lectura y escritura

La IA de Google conectada a tus datos de Iceberg en la nube

Aceleración del precio y el rendimiento para Iceberg

BigQuery y Spark diferenciados

Contexto y administración en tiempo real para los agentes

El catálogo de REST de Lakehouse actúa como un centro central para tus tablas de Iceberg. Proporciona acceso universal de lectura y escritura en BigQuery, Managed Service para Apache Spark, motores OSS y socios, lo que conecta tus datos sin problemas a cualquier motor para acelerar la IA.

Fundamentos y modernización de Lakehouse

Moderniza a una arquitectura de lakehouse abierta y unificada

Instructivos, guías de inicio rápido y labs

Moderniza a una arquitectura de lakehouse abierta y unificada

Interoperabilidad de varios motores

Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

Instructivos, guías de inicio rápido y labs

Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

Incorpora datos de Iceberg en flujos de trabajo de IA

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Instructivos, guías de inicio rápido y labs

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Experiencia de Spark de primer nivel

Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

Instructivos, guías de inicio rápido y labs

Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

Análisis de alto rendimiento con BigQuery

Optimización del rendimiento con BigQuery

Instructivos, guías de inicio rápido y labs

Optimización del rendimiento con BigQuery

Inteligencia en tiempo real

Combinación de datos transaccionales y analíticos para la IA de agentes

Instructivos, guías de inicio rápido y labs

Combinación de datos transaccionales y analíticos para la IA de agentes

Administración de lakehouse de extremo a extremo

Administra tu lakehouse con Knowledge Catalog

Instructivos, guías de inicio rápido y labs

Administra tu lakehouse con Knowledge Catalog

Calculadora de precios

Presupuesto personalizado

Comienza tu prueba de concepto

Iniciar prueba gratuita

¿Tienes un proyecto grande?

Tablas de Apache Iceberg completamente administradas

Usa el catálogo REST de Apache Iceberg

Consulta datos de Apache Iceberg