Compila aplicaciones con tecnología de LLM a través de LlamaIndex

Selecciona una versión de la documentación:

En esta página, se describen algunos casos de uso para compilar aplicaciones con tecnología de LLM a través de LlamaIndex integrado con AlloyDB Omni. Se proporcionan vínculos a notebooks en GitHub para ayudarte a explorar enfoques o desarrollar tu aplicación.

LlamaIndex es un framework de organización de IA generativa que te permite conectar e integrar fuentes de datos con modelos de lenguaje grandes (LLM). Puedes usar LlamaIndex para compilar aplicaciones que accedan a información de datos privados o específicos del dominio y la consulten con consultas en lenguaje natural.

LlamaIndex actúa como un puente entre los datos personalizados y los LLM, lo que facilita el desarrollo de aplicaciones de asistente de conocimiento con capacidades de generación aumentada de recuperación (RAG).

LlamaIndex es adecuado para aplicaciones centradas en documentos porque enfatiza la administración estructurada de documentos, lo que simplifica la indexación y la recuperación. Este framework incluye mecanismos de consulta optimizados que mejoran la velocidad y la relevancia del acceso a la información, junto con un manejo sólido de metadatos para el filtrado matizado.

Para obtener más información sobre el framework de LlamaIndex, consulta la documentación del producto LlamaIndex.

Componentes de LlamaIndex

AlloyDB Omni ofrece las siguientes interfaces de LlamaIndex:

  • Almacén de vectores
  • Almacén de documentos
  • Almacenes de índices
  • Almacenes de chat
  • Lector de documentos

Aprende a usar LlamaIndex con el inicio rápido de AlloyDB Omni.

Almacén de vectores

Esta integración de LlamaIndex te permite usar la naturaleza sólida y escalable de AlloyDB Omni para almacenar y administrar tus datos de LlamaIndex. Si combinas las capacidades de indexación y consulta de LlamaIndex con el alto rendimiento y la confiabilidad de AlloyDB Omni, puedes compilar aplicaciones con tecnología de LLM más eficientes y escalables.

LlamaIndex desglosa un documento (doc, texto y PDF) en componentes de documentos llamados nodos. El VectorStore solo puede contener los vectores de incorporación del contenido del nodo ingerido y el texto de los nodos. Un nodo contiene contenido de texto, incorporaciones de vectores y metadatos. Puedes aplicar filtros en estos campos de metadatos para restringir la recuperación de nodos a aquellos que coincidan con los criterios de metadatos especificados.

Para trabajar con almacenes de vectores en AlloyDB Omni, usa la clase AlloyDBVectorStore. Para obtener más información, consulta Almacenes de vectores de LlamaIndex.

Almacena incorporaciones de vectores con la clase AlloyDBVectorStore

En el notebook de AlloyDB Omni para el almacén de vectores, se muestra cómo hacer lo siguiente:

  • Crea un AlloyDBEngine para conectarte a tu instancia de AlloyDB Omni con AlloyDBEngine.from_connection_string().
  • Inicializa una tabla para almacenar incorporaciones de vectores.
  • Crea una instancia de clase de incorporación con cualquier modelo de incorporaciones de Llama Index.
  • Inicializa un almacén de vectores AlloyDBVectorStore predeterminado.
  • Crea y consulta un índice desde el almacén de vectores con VectorStoreIndex.
  • Crea un almacén de vectores personalizado para almacenar y filtrar metadatos.
  • Agrega un índice ANN para mejorar la latencia de búsqueda.

Almacenes de documentos e índices

La integración de los almacenes de documentos de LlamaIndex administra el almacenamiento y la recuperación de documentos estructurados, y se optimiza para las capacidades centradas en documentos de LlamaIndex. El almacén de documentos almacena el contenido relacionado con los vectores en el almacén de vectores.

Para obtener más información, consulta la documentación del producto Almacenes de documentos de LlamaIndex.

Los almacenes de índices facilitan la administración de índices para permitir consultas rápidas y recuperación de datos, por ejemplo, índice de resumen, de palabras clave y de árbol. Index en LlamaIndex es un almacenamiento ligero solo para los metadatos del nodo. Las actualizaciones de los metadatos del nodo no requieren la reindexación (lectura de la generación de incorporación) del nodo completo o de todos los nodos de un documento.

Para obtener más información, consulta Almacenes de índices de LlamaIndex.

Almacena documentos e índices

En el notebook de AlloyDB Omni para los almacenes de documentos, se muestra cómo usar AlloyDB Omni para almacenar documentos e índices con las clases AlloyDBDocumentStore y AlloyDBIndexStore. Aprenderás a hacer lo siguiente:

  • Crea un AlloyDBEngine para conectarte a tu instancia de AlloyDB Omni con AlloyDBEngine.from_connection_string().
  • Crea tablas para DocumentStore y IndexStore.
  • Inicializa un AlloyDBDocumentStore predeterminado.
  • Configura un AlloyDBIndexStore.
  • Agrega documentos al Docstore.
  • Usa almacenes de documentos con varios índices.
  • Carga índices existentes.

Almacenes de chat

Los almacenes de chat mantienen el historial de conversaciones y el contexto de las aplicaciones basadas en chat, lo que permite interacciones personalizadas. Los almacenes de chat proporcionan un repositorio central que almacena y recupera mensajes de chat dentro de una conversación, lo que permite que el LLM mantenga el contexto y proporcione respuestas más relevantes según el diálogo en curso.

Los modelos de lenguaje grandes no tienen estado de forma predeterminada, lo que significa que no conservan las entradas anteriores, a menos que se proporcionen de forma explícita cada vez. Si usas un almacén de chat, puedes conservar el contexto de la conversación, lo que permite que el modelo genere respuestas más relevantes y coherentes con el tiempo.

El módulo de memoria en LlamaIndex permite el almacenamiento y la recuperación eficientes del contexto conversacional, lo que permite interacciones más personalizadas y contextuales en las aplicaciones de chat. Puedes integrar el módulo de memoria en LlamaIndex con un ChatStore y un ChatMemoryBuffer. Para obtener más información, consulta Almacenes de chat de LlamaIndex.

Almacena el historial de chat

En el notebook de AlloyDB Omni para los almacenes de chat, se muestra cómo usar AlloyDB for PostgreSQL para almacenar el historial de chat con la clase AlloyDBChatStore. Aprenderás a hacer lo siguiente:

  • Crea un AlloyDBEngine para conectarte a tu instancia de AlloyDB Omni con AlloyDBEngine.from_connection_string().
  • Inicializa un AlloyDBChatStore predeterminado.
  • Crea un ChatMemoryBuffer.
  • Crea una instancia de clase LLM.
  • Usa el AlloyDBChatStore sin un contexto de almacenamiento.
  • Usa el AlloyDBChatStore con un contexto de almacenamiento.
  • Crea y usa el motor de chat.

Lector de documentos

El lector de documentos recupera y transforma de manera eficiente los datos de AlloyDB Omni en formatos compatibles con LlamaIndex para la indexación. La interfaz del lector de documentos proporciona métodos para cargar datos de una fuente como Documents.

Document es una clase que almacena un fragmento de texto y metadatos asociados. Puedes usar lectores de documentos para cargar documentos que deseas almacenar en almacenes de documentos o que se usan para crear índices.

Para obtener más información, consulta Lector de documentos de LlamaIndex.

Recupera datos como documentos

En el notebook de AlloyDB Omni para el lector de documentos, se muestra cómo usar AlloyDB Omni para recuperar datos como documentos con la clase AlloyDBReader. Aprenderás a hacer lo siguiente:

  • Crea un AlloyDBEngine para conectarte a tu instancia de AlloyDB Omni con AlloyDBEngine.from_connection_string().
  • Crea AlloyDBReader.
  • Carga documentos con el argumento table_name.
  • Carga documentos con una consulta en SQL.
  • Configura el formato del contenido de la página.
  • Carga los documentos.

¿Qué sigue?