Lakehouse para Apache Iceberg (antes BigLake)

Lakehouse abierto y entre nubes para la era de los agentes

Almacenamiento, administración y rendimiento empresarial para crear casos de uso de IA escalables, analíticos, operativos y en tiempo real en un lakehouse abierto unificado, entre nubes y multimodal.

Apache Iceberg es una marca comercial de The Apache Software Foundation.



Funciones

Iceberg completamente administrado con interoperabilidad de lectura y escritura

Las tablas de Apache Iceberg, administradas con el catálogo REST de Lakehouse Iceberg, proporcionan interoperabilidad de lectura y escritura entre BigQuery y Google Cloud Managed Service para Apache Spark, así como motores OSS compatibles con Iceberg como Spark, Trino y Flink, y ahora con motores externos como Snowflake y Databricks (versión preliminar). Esto te ayuda a conectar fácilmente tus tablas de Iceberg directamente a motores como BigQuery y Spark administrado por Google para que puedas acelerar tus cargas de trabajo de IA.

La IA de Google conectada a tus datos de Iceberg en la nube

Aprovecha la interconexión y el almacenamiento en caché entre nubes (versión preliminar) para obtener acceso rápido y de baja latencia a los datos de S3 Iceberg. Ejecuta BigQuery, Spark y Gemini Enterprise a través de trabajos de API de análisis conversacional en datos de AWS con características de precio y rendimiento comparables a las soluciones nativas de plataformas de datos. Además, la nueva federación de catálogos de Lakehouse Runtime (versión preliminar) une tu ecosistema sin problemas, lo que permite que BigQuery y Google Managed Spark descubran y analicen datos empresariales en Snowflake, Databricks y AWS Glue.

Aceleración del precio y el rendimiento para Iceberg

La ejecución vectorizada mejorada de BigQuery ahora es el valor predeterminado para las tablas de catálogo REST de Lakehouse Iceberg, así como para las tablas de Iceberg y Parquet en el catálogo de BigQuery. Descarga el mantenimiento rutinario de Iceberg, como la compactación, la agrupación en clústeres y la recolección de elementos no utilizados, directamente a Google Lakehouse. Las nuevas funciones automatizadas, que incluyen administración de tablas, partición, agrupamiento en clústeres y optimización basada en el historial (DG para tablas de Iceberg en el catálogo de BigQuery; versión preliminar para el catálogo de REST), aceleran el rendimiento en relación con el precio sin sobrecarga manual.

BigQuery y Spark diferenciados

Potencia las estadísticas en tiempo real con Iceberg usando la transmisión de BigQuery para una transferencia de alto rendimiento con latencia de lectura cero. Crea canalizaciones de procesamiento complejas con transacciones de varias instrucciones y replicación de datos de cambio de BigQuery en tablas de Iceberg (DG para el catálogo de BigQuery; versión preliminar para el catálogo de REST). Une datos estructurados y no estructurados con BigQueryObjectRefs para desbloquear análisis multimodales, vectoriales y de gráficos. Potencia las cargas de trabajo de ciencia de datos de Spark con Lightning Engine con un rendimiento hasta 4.5 veces más rápido. 

Contexto y administración en tiempo real para los agentes

Potencia los agentes de IA con datos transaccionales en tiempo real. Transmite datos operativos desde Spanner, AlloyDB y Cloud SQL a BigQuery y tablas Iceberg administradas para un análisis instantáneo, y envía estas estadísticas analíticas directamente a AlloyDB o Spanner para entregarlas con una latencia de submilisegundos y QPS alta. Obtén una administración unificada con linaje, generación de perfiles y calidad de los datos a través de la integración de Knowledge Catalog (antes Dataplex). Asigna datos transaccionales, no estructurados y de iceberg a tu lógica empresarial, lo que les da a tus agentes el contexto profundo que necesitan para entregar resultados precisos, confiables y totalmente controlados.

Cómo funciona

El catálogo de REST de Lakehouse actúa como un centro central para tus tablas de Iceberg. Proporciona acceso universal de lectura y escritura en BigQuery, Managed Service para Apache Spark, motores OSS y socios, lo que conecta tus datos sin problemas a cualquier motor para acelerar la IA.

Usos comunes

Fundamentos y modernización de Lakehouse

Moderniza a una arquitectura de lakehouse abierta y unificada

Moderniza tu base de datos con Lakehouse de Google. Migra Hadoop heredado a Cloud Storage sin servidores y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo de REST de Iceberg de Lakehouse elimina los silos y ofrece un entorno de ejecución interoperable para Spark, Trino y Flink. Con la compatibilidad del catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

    Moderniza a una arquitectura de lakehouse abierta y unificada

    Moderniza tu base de datos con Lakehouse de Google. Migra Hadoop heredado a Cloud Storage sin servidores y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo de REST de Iceberg de Lakehouse elimina los silos y ofrece un entorno de ejecución interoperable para Spark, Trino y Flink. Con la compatibilidad del catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

      Interoperabilidad de varios motores

      Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

      Trae tus canalizaciones de Iceberg existentes y lee o escribe en esas tablas sin problemas con BigQuery o Spark administrado, mientras modernizas fácilmente con las capacidades avanzadas de BigQuery. Potencia la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de análisis conversacional en BigQuery que trabajen con tus datos en S3.

        Lectura y escritura compartidas sin interrupciones entre BigQuery y los motores de OSS

        Trae tus canalizaciones de Iceberg existentes y lee o escribe en esas tablas sin problemas con BigQuery o Spark administrado, mientras modernizas fácilmente con las capacidades avanzadas de BigQuery. Potencia la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de análisis conversacional en BigQuery que trabajen con tus datos en S3.

          Incorpora datos de Iceberg en flujos de trabajo de IA

          Análisis de datos multimodales y flujos de trabajo de IA acelerados

          Potencia el análisis multimodal con la IA de BigQuery combinando tablas Iceberg estructuradas con datos no estructurados usando ObjectRefs de BigQuery para la inferencia de SQL único. Entrenar modelos de la plataforma de agentes de Gemini Enterprise con viajes en el tiempo para depurar el desvío de datos. Federa catálogos REST globales en una malla de datos unificada, analiza registros a gran escala de forma económica y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.


            Análisis de datos multimodales y flujos de trabajo de IA acelerados

            Potencia el análisis multimodal con la IA de BigQuery combinando tablas Iceberg estructuradas con datos no estructurados usando ObjectRefs de BigQuery para la inferencia de SQL único. Entrenar modelos de la plataforma de agentes de Gemini Enterprise con viajes en el tiempo para depurar el desvío de datos. Federa catálogos REST globales en una malla de datos unificada, analiza registros a gran escala de forma económica y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.


              Experiencia de Spark de primer nivel

              Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

              Accede a una experiencia de Spark sin problemas. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg con IDE unificados. La nueva extensión de VS Code Antigravity actúa como un socio de IA para generar canalizaciones, depurar código y automatizar CI/CD a partir de lenguaje natural. Además, nuestro Lightning Engine vectorizado acelera la ejecución de Spark hasta 4.5 veces, sin necesidad de realizar cambios en el código.

                Potencia las cargas de trabajo de ciencia de datos en entornos de desarrolladores

                Accede a una experiencia de Spark sin problemas. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg con IDE unificados. La nueva extensión de VS Code Antigravity actúa como un socio de IA para generar canalizaciones, depurar código y automatizar CI/CD a partir de lenguaje natural. Además, nuestro Lightning Engine vectorizado acelera la ejecución de Spark hasta 4.5 veces, sin necesidad de realizar cambios en el código.

                  Análisis de alto rendimiento con BigQuery

                  Optimización del rendimiento con BigQuery

                  Aprovecha la escala de BigQuery mientras mantienes un almacenamiento flexible. Ejecutar transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa la compatibilidad avanzada de BigQuery con el entorno de ejecución y la partición para Iceberg para crear tablas particionadas o agrupadas que aprovechen la reducción de bloques para una ejecución de consultas de alta velocidad y rentable.

                    Optimización del rendimiento con BigQuery

                    Aprovecha la escala de BigQuery mientras mantienes un almacenamiento flexible. Ejecutar transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa la compatibilidad avanzada de BigQuery con el entorno de ejecución y la partición para Iceberg para crear tablas particionadas o agrupadas que aprovechen la reducción de bloques para una ejecución de consultas de alta velocidad y rentable.

                      Inteligencia en tiempo real

                      Combinación de datos transaccionales y analíticos para la IA de agentes

                      Potencia los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en tablas de Iceberg de Lakehouse. Luego, usa consultas continuas de SQL para supervisar estos datos de transmisión, ejecutar inferencias de IA de forma instantánea y activar acciones posteriores, lo que proporciona inteligencia en tiempo real para tus cargas de trabajo operativas más importantes.

                        Combinación de datos transaccionales y analíticos para la IA de agentes

                        Potencia los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en tablas de Iceberg de Lakehouse. Luego, usa consultas continuas de SQL para supervisar estos datos de transmisión, ejecutar inferencias de IA de forma instantánea y activar acciones posteriores, lo que proporciona inteligencia en tiempo real para tus cargas de trabajo operativas más importantes.

                          Administración de lakehouse de extremo a extremo

                          Administra tu lakehouse con Knowledge Catalog

                          Knowledge Catalog proporciona una capa de administración unificada descubriendo automáticamente tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de entornos de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garantizan un control de acceso coherente a nivel de fila y columna en BigQuery y en motores de procesamiento de código abierto.

                            Administra tu lakehouse con Knowledge Catalog

                            Knowledge Catalog proporciona una capa de administración unificada descubriendo automáticamente tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de entornos de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garantizan un control de acceso coherente a nivel de fila y columna en BigQuery y en motores de procesamiento de código abierto.

                              Precios

                              Cómo funcionan los precios de Lakehouse (BigLake)Los precios de Lakehouse (BigLake) se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos.
                              Servicios y usoDescripciónPrecio (USD)

                              Administración de tablas de Lakehouse (BigLake)

                              Recursos de procesamiento para administrar tablas de Lakehouse (BigLake) que se usan para la optimización automática del almacenamiento de tablas.

                              A partir de

                              $0.12

                              por hora de DCU

                              Almacenamiento de metadatos de Lakehouse (BigLake)

                              El metastore de Lakehouse para Apache Iceberg (catálogo de entornos de ejecución de Lakehouse) cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes.

                              A partir de

                              $0.04

                              por GiB al mes

                              Acceso a metadatos de Lakehouse (BigLake)

                              Operaciones de clase A: Los cargos de acceso a los metadatos de Lakehouse (BigLake) incluyen operaciones de escritura, actualización, creación, listado y configuración, con un nivel gratuito de 5,000 operaciones por mes.

                              A partir de

                              $6.00

                              por millón de operaciones

                              Operaciones de clase B: Los cargos de acceso a los metadatos de Lakehouse (BigLake) se aplican a las operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50,000 operaciones por mes incluidas.

                              A partir de

                              $0.90

                              por millón de operaciones

                              Cómo funcionan los precios de Lakehouse (BigLake)

                              Los precios de Lakehouse (BigLake) se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos.

                              Administración de tablas de Lakehouse (BigLake)

                              Descripción

                              Recursos de procesamiento para administrar tablas de Lakehouse (BigLake) que se usan para la optimización automática del almacenamiento de tablas.

                              Precio (USD)

                              Starting at

                              $0.12

                              por hora de DCU

                              Almacenamiento de metadatos de Lakehouse (BigLake)

                              Descripción

                              El metastore de Lakehouse para Apache Iceberg (catálogo de entornos de ejecución de Lakehouse) cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes.

                              Precio (USD)

                              Starting at

                              $0.04

                              por GiB al mes

                              Acceso a metadatos de Lakehouse (BigLake)

                              Descripción

                              Operaciones de clase A: Los cargos de acceso a los metadatos de Lakehouse (BigLake) incluyen operaciones de escritura, actualización, creación, listado y configuración, con un nivel gratuito de 5,000 operaciones por mes.

                              Precio (USD)

                              Starting at

                              $6.00

                              por millón de operaciones

                              Operaciones de clase B: Los cargos de acceso a los metadatos de Lakehouse (BigLake) se aplican a las operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50,000 operaciones por mes incluidas.

                              Descripción

                              Starting at

                              $0.90

                              por millón de operaciones

                              Calculadora de precios

                              Calcula los costos mensuales de Lakehouse, incluidos los precios y las tarifas específicos de una región.

                              Presupuesto personalizado

                              Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.

                              Comienza tu prueba de concepto

                              Iniciar prueba gratuita

                              ¿Tienes un proyecto grande?

                              Tablas de Apache Iceberg completamente administradas

                              Usa el catálogo REST de Apache Iceberg

                              Consulta datos de Apache Iceberg

                              Google Cloud