Adición de un recurso de índice de AI Search a una aplicación de Databricks

Agregue índices de AI Search como recursos de Databricks Apps para habilitar la búsqueda semántica y la recuperación basada en similitud en las aplicaciones. Los índices de BÚSQUEDA de IA almacenan y consultan incrustaciones de vectores de alta dimensionalidad, lo que potencia los casos de uso, como la generación aumentada por recuperación (RAG), la búsqueda semántica y los sistemas de recomendaciones.

Databricks AI Search se conocía anteriormente como Databricks Vector Search.

Requisitos de privilegios

Para acceder a un índice de búsqueda de IA, el principal de servicio de la aplicación debe tener el privilegio USE CATALOG en el catálogo principal, el privilegio USE SCHEMA en el esquema principal y el privilegio SELECT en el índice. Al agregar el recurso de índice, Azure Databricks concede automáticamente estos privilegios a la entidad de servicio de la aplicación.

Para que esta concesión automática se realice correctamente, uno de los siguientes valores debe ser verdadero para cada privilegio.

  • Para USE CATALOG: todos los usuarios de la cuenta tienen el USE CATALOG privilegio en el catálogo, o todos tienen el MANAGE privilegio en el catálogo.
  • Para USE SCHEMA: o todos los usuarios de la cuenta tienen el USE SCHEMA privilegio en el esquema, o usted tiene el MANAGE privilegio en el esquema.
  • Para SELECT: Todos los usuarios de la cuenta tienen el SELECT privilegio en el índice o usted tiene el MANAGE privilegio en el índice.

Para obtener más información sobre cómo consultar índices de BÚSQUEDA de IA con estos permisos, consulte Consulta de un índice de BÚSQUEDA de IA.

Consulte Referencia de privilegios del catálogo de Unity.

Adición de un recurso de índice de AI Search

Antes de agregar un índice de AI Search como recurso, revise los requisitos previos de los recursos de la aplicación.

  1. En la sección Recursos de la aplicación al crear o editar una aplicación, haga clic en + Agregaríndice de búsqueda de vectores>.
  2. Elija un índice de Búsqueda con IA entre los índices disponibles en el área de trabajo. El índice ya debe existir en el catálogo de Unity.
  3. Seleccione el nivel de permiso de la aplicación:
    • Puede seleccionar: Concede permiso a la aplicación para consultar el índice de búsqueda de IA para búsquedas de similitud. Corresponde al SELECT privilegio.
  4. (Opcional) Especifique una clave de recurso personalizada, que es la forma en que hace referencia al índice en la configuración de la aplicación. La clave predeterminada es vector-search-index.

Nota:

Los índices de búsqueda de IA son tablas de catálogo de Unity con tipo TABLE_ONLINE_VECTOR_INDEX_REPLICA o TABLE_ONLINE_VECTOR_INDEX_DIRECT. Al seleccionar un índice de búsqueda de IA, se selecciona una tabla especialmente configurada que admite operaciones de búsqueda semántica.

Variables de entorno

Al implementar una aplicación con un recurso de índice de AI Search, Azure Databricks expone el nombre completo de tres niveles a través de variables de entorno a las que puede hacer referencia mediante el valueFrom campo .

Configuración de ejemplo:

env:
  - name: VECTOR_SEARCH_INDEX
    valueFrom: vector-search-index # Use your custom resource key if different

Utilizando el índice en su aplicación:

import os
from databricks.sdk import WorkspaceClient

# Access the AI Search index name
index_name = os.getenv("VECTOR_SEARCH_INDEX")

# Initialize workspace client
w = WorkspaceClient()

# Query the AI Search index
results = w.vector_search_indexes.query_index(
    index_name=index_name,
    query_text="What is machine learning?",
    num_results=10
)

# Process results
for result in results.manifest.columns:
    print(f"Result: {result}")

Para obtener más información, consulte Uso de variables de entorno para acceder a los recursos.

Eliminación de un recurso de índice de AI Search

Al quitar un recurso de índice de AI Search de una aplicación, la entidad de servicio de la aplicación pierde el acceso al índice. El propio índice permanece sin cambios y sigue estando disponible para otros usuarios y aplicaciones que tienen los permisos adecuados.

procedimientos recomendados

Tenga en cuenta lo siguiente al trabajar con recursos de índice de Búsqueda de IA:

  • Asegúrese de que la entidad de servicio de la aplicación tiene acceso a orígenes de datos subyacentes si el índice hace referencia a otras tablas.
  • Supervise el rendimiento de las consultas y ajuste la configuración del índice o la inserción de modelos si los tiempos de respuesta se degradan.
  • Considere las programaciones de actualización de índices para mantener las incrustaciones sincronizadas con los datos de origen.
  • Utilice las métricas de similitud adecuadas (coseno, euclidiana, producto punto) en función del modelo de incrustación.