Creación de proyectos personalizados de Document Intelligence Studio

Este contenido se aplica a:checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (retirada)

Azure Document Intelligence en Foundry Tools Studio es una herramienta en línea que puede utilizar para explorar visualmente, comprender e integrar las características de Document Intelligence en sus aplicaciones. Este inicio rápido tiene como objetivo mostrar cómo configurar un proyecto personalizado en Document Intelligence Studio.

Requisitos previos

Para obtener información sobre la configuración de suscripción, recurso y autenticación, consulte Introducción a Document Intelligence Studio.

Requisitos previos para los nuevos usuarios

Además de una cuenta de Azure y el recurso de inteligencia de documentos o Microsoft Foundry, necesita un contenedor de Azure Blob Storage y las asignaciones de roles de Azure.

contenedor de Azure Blob Storage

Necesita una cuenta de rendimiento estándar Azure Blob Storage. Puede crear contenedores para almacenar y organizar los documentos de entrenamiento dentro de la cuenta de almacenamiento. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, siga estos inicios rápidos:

  • Crear una cuenta de almacenamiento: al crear la cuenta de almacenamiento, en el campo Rendimiento de detalles> de la instancia, seleccione Rendimiento estándar.
  • Crear un contenedor: al crear el contenedor, en el panel Nuevo contenedor , establezca el campo Nivel de acceso público en Contenedor (acceso de lectura anónimo para contenedores y blobs).

Asignaciones de Roles de Azure

En el caso de los proyectos personalizados, se requieren las siguientes asignaciones de roles para diferentes escenarios:

  • Básico

    • Cognitive Services User: Necesita este rol para el recurso Document Intelligence o Microsoft Foundry para entrenar el modelo personalizado o realizar análisis con modelos entrenados.
    • Colaborador de datos de Storage Blob: necesita este rol para que la cuenta de almacenamiento cree un proyecto y etiquete los datos.
  • Avanzado

    • Colaborador de la cuenta de almacenamiento: necesita este rol para la cuenta de almacenamiento para configurar la configuración de uso compartido de recursos entre orígenes (CORS). (Esta acción es un esfuerzo único si se reutiliza la misma cuenta de almacenamiento).
    • Colaborador: necesita este rol para crear grupos de recursos y sus respectivos recursos.

    Nota

    Si la autenticación local (basada en claves) está deshabilitada para el recurso del servicio Document Intelligence y la cuenta de almacenamiento, asegúrese de obtener los roles de usuario de Cognitive Services y colaborador de datos de blobs de Almacenamiento, respectivamente, para disponer de permisos suficientes para usar Document Intelligence Studio. Los roles de Colaborador de cuenta de almacenamiento y Colaborador le permiten ver las claves, pero no le conceden permiso para usar los recursos cuando se desactiva el acceso a las claves.

Configuración de CORS

Intercambio de recursos de origen cruzado debe configurarse en la cuenta de almacenamiento de Azure para que sea accesible desde Document Intelligence Studio. Para configurar CORS en el portal de Azure, necesita acceso a la pestaña CORS de la cuenta de almacenamiento.

  1. Seleccione la pestaña CORS de la cuenta de almacenamiento.

    Screenshot que muestra el menú de configuración de CORS en el Azure portal.

  2. Empiece por crear una nueva entrada de CORS en la pestaña Blob service .

  3. Establezca Orígenes permitidos en https://documentintelligence.ai.azure.com.

    Captura de pantalla que muestra la configuración de CORS para una cuenta de almacenamiento.

    Puede usar el carácter * comodín en lugar de un dominio especificado para permitir que todos los dominios de origen realicen solicitudes a través de CORS.

  4. Seleccione todas las ocho opciones disponibles para los métodos permitidos.

  5. Apruebe todos los encabezados permitidos y los encabezados expuestos escribiendo un asterisco (*) en cada campo.

  6. Establezca Antigüedad máxima en 120 segundos o cualquier valor aceptable.

  7. Para guardar los cambios, seleccione Guardar en la parte superior de la página.

CORS ahora debe configurarse para usar la cuenta de almacenamiento de Document Intelligence Studio.

Conjunto de documentos de ejemplo

  1. Inicie sesión en el portal Azure. Vaya a la cuenta de almacenamiento y seleccioneContenedores> datos.

    Screenshot que muestra el menú Almacenamiento de datos en el portal de Azure.

  2. Seleccione un contenedor de la lista.

  3. En el menú de la parte superior de la página, seleccione Cargar.

    Captura de pantalla que muestra el botón 'Cargar contenedor' en el portal de Azure.

  4. En el panel Cargar blob , seleccione los archivos que desea cargar.

    Captura de pantalla que muestra el panel Cargar blob en el portal de Azure.

Nota

De forma predeterminada, Document Intelligence Studio usa documentos que se encuentran en la raíz del contenedor. Puede usar los datos organizados en carpetas especificando la ruta de acceso de la carpeta en los pasos para crear un proyecto de formulario personalizado. Para obtener más información, consulte Organizar los datos en subcarpetas.

Uso de características de Document Intelligence Studio

Etiqueta automáticamente documentos con modelos predefinidos o con uno de tus propios modelos

En la página de etiquetado del modelo de extracción personalizado, ahora puede etiquetar automáticamente los documentos mediante uno de los modelos precompilados de Document Intelligent Service o los modelos entrenados.

Captura de pantalla animada que muestra la etiqueta automática.

En algunos documentos, es posible que se dupliquen las etiquetas después de ejecutar autolabel. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.

Captura de pantalla que muestra la advertencia de etiqueta duplicada tras el etiquetado automático.

Tablas con etiquetado automático

En la página de etiquetado del modelo de extracción personalizado, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.

Captura de pantalla animada que muestra el etiquetado de tabla automática.

Adición de archivos de prueba directamente al conjunto de datos de entrenamiento

Después de entrenar un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo mediante la carga de documentos de prueba en el conjunto de datos de entrenamiento, si es necesario.

Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de etiquetar correctamente el contenido. Si no es así, agréguelos al conjunto de datos de entrenamiento y re-etiquételos para mejorar la calidad del modelo.

Captura de pantalla animada que muestra cómo agregar archivos de prueba a un conjunto de datos de entrenamiento.

Usar las opciones y filtros de la lista de documentos en proyectos personalizados

Use la página de etiquetado del modelo de extracción personalizado para recorrer los documentos de entrenamiento con facilidad haciendo uso de las características de búsqueda, filtro y ordenación.

Use la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos con mayor facilidad.

Captura de pantalla que muestra las opciones y filtros de la vista de lista de documentos.

uso compartido de Project

Comparta proyectos de extracción personalizados con facilidad. Para obtener más información, consulte Compartición de proyectos con modelos personalizados.