Projetos personalizados do Create Document Intelligence Studio

Este conteúdo aplica-se a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (a retirar-se)

Azure Document Intelligence no Foundry Tools Studio é uma ferramenta online que pode usar para explorar visualmente, compreender e integrar funcionalidades do Document Intelligence nas suas aplicações. Este quickstart pretende mostrar-lhe como configurar um projeto personalizado no Document Intelligence Studio.

Pré-requisitos

Para informações sobre subscrição, recursos e configuração de autenticação, consulte Começar com o Document Intelligence Studio.

Pré-requisitos para novos utilizadores

Para além de uma conta Azure e do recurso Document Intelligence ou Microsoft Foundry, precisa de um contentor Armazenamento de Blobs do Azure e atribuições de funções no Azure.

Armazenamento de Blobs do Azure container

Precisas de uma conta de armazenamento de blob do Azure de desempenho padrão. Pode criar contentores para armazenar e organizar os seus documentos de formação dentro da sua conta de armazenamento. Se não sabe como criar uma conta de armazenamento Azure com um contentor, siga estes quickstarts:

  • Crie uma conta de armazenamento: Ao criar a sua conta de armazenamento, no campo Detalhes> daInstância, selecione Desempenho Padrão.
  • Crie um contentor: Quando criar o seu contentor, no painel de Novo Container , defina o campo de nível de acesso público para Container (acesso anónimo de leitura para containers e blobs).

Atribuições de funções do Azure

Para projetos personalizados, são necessárias as seguintes atribuições de funções para diferentes cenários:

  • Básico

    • Cognitive Services User: Precisa deste papel para o recurso de Inteligência de Documentos ou Microsoft Foundry para treinar o modelo personalizado ou fazer análise com modelos treinados.
    • Contribuidor de Dados de Blob de Armazenamento: Precisa desta função para criar um projeto e rotular dados na conta de armazenamento.
  • Avançado

    • Contribuidor da Conta de Armazenamento: Precisa deste papel para a conta de armazenamento para configurar as definições de partilha de recursos entre origens (CORS). (Esta ação é um esforço único se a mesma conta de armazenamento for reutilizada.)
    • Contribuidor: Precisa desta função para criar um grupo de recursos e recursos.

    Nota

    Se a autenticação local (baseada em chaves) estiver desativada para a sua conta de recursos e armazenamento do serviço Document Intelligence, certifique-se de obter as funções de Utilizador de Serviços Cognitivos e Contribuidor de Dados de Blob de Armazenamento, respetivamente, para que tenha permissões suficientes para usar o Document Intelligence Studio. Os papéis de Contribuidor da Conta de Armazenamento e Contribuidor permitem-lhe listar chaves, mas não lhe dão permissão para usar os recursos quando o acesso às chaves está desativado.

Configurar o CORS

Partilha de recursos entre origens deve estar configurada na sua conta de armazenamento Azure para ser acessível a partir do Document Intelligence Studio. Para configurar o CORS no portal Azure, precisa de aceder ao separador CORS da sua conta de armazenamento.

  1. Selecione a aba CORS para a conta de armazenamento.

    Captura de ecrã que mostra o menu de definições CORS no portal Azure.

  2. Comece por criar uma nova entrada CORS no separador do serviço Blob .

  3. Defina Origens permitidas para https://documentintelligence.ai.azure.com.

    Captura de ecrã que mostra a configuração do CORS para uma conta de armazenamento.

    Pode usar o carácter * curinga em vez de um domínio especificado para permitir que todos os domínios de origem façam pedidos via CORS.

  4. Selecione todas as oito opções disponíveis para métodos permitidos.

  5. Aprove todos os cabeçalhos Permitidos e Expostos inserindo um asterisco (*) em cada campo.

  6. Define a Idade Máxima para 120 segundos ou qualquer valor aceitável.

  7. Para guardar as alterações, selecione Guardar no topo da página.

O CORS deve agora ser configurado para usar a conta de armazenamento do Document Intelligence Studio.

Conjunto de exemplos de documentos

  1. Inicie sessão no portal Azure. Vá à sua conta de armazenamento e selecioneContentores> de Dados.

    Captura de ecrã que mostra o menu de armazenamento de dados no portal Azure.

  2. Selecione um contentor da lista.

  3. No menu no topo da página, selecione Carregar.

    Captura de ecrã que mostra o botão Upload do contentor no portal Azure.

  4. No painel de blob de Upload , selecione os seus ficheiros para carregar.

    Captura de ecrã que mostra o painel de blob de upload no portal Azure.

Nota

Por defeito, o Document Intelligence Studio utiliza documentos localizados na raiz do seu contentor. Pode usar dados organizados em pastas especificando o caminho da pasta nos passos para criar um projeto de formulário personalizado. Para mais informações, consulte Organizar os seus dados em subpastas.

Utilize as funcionalidades do Document Intelligence Studio

Autolabel documentos com modelos pré-desenhados ou um dos teus próprios modelos

Na página de rotulagem do modelo de extração personalizado, pode agora autoetiquetar os seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou os seus modelos treinados.

Captura de ecrã animada que mostra a autoetiquetagem.

Para alguns documentos, são possíveis etiquetas duplicadas após a execução do autolabel. Certifique-se de modificar as etiquetas para que não haja etiquetas duplicadas na página de rotulagem depois.

Captura de ecrã que mostra aviso de etiqueta duplicada após a autoetiquetagem.

Tabelas Autolabel

Na página de rotulagem do modelo personalizado de extração, agora pode rotular automaticamente as tabelas no documento sem ter de as rotular manualmente.

Captura de ecrã animada que mostra a etiquetagem do AutoTable.

Adicione ficheiros de teste diretamente ao seu conjunto de dados de treino

Depois de treinares um modelo de extração personalizado, usa a página de teste para melhorar a qualidade do teu modelo, carregando documentos de teste para o conjunto de dados de treino, se necessário.

Se for devolvido um score de confiança baixo para alguns rótulos, certifique-se de rotular corretamente o seu conteúdo. Se não, adicione-os ao conjunto de dados de treinamento e reclassifique para melhorar a qualidade do modelo.

Captura de ecrã animada que mostra como adicionar ficheiros de teste a um conjunto de dados de treino.

Aproveite as opções da lista de documentos e os filtros em projetos personalizados

Use a página de rotulagem do modelo de extração personalizado para analisar facilmente os seus documentos de formação, utilizando as funcionalidades de pesquisa, filtro e ordenação.

Use a vista de grelha para pré-visualizar documentos, ou use a vista de lista para percorrer documentos com mais facilidade.

Captura de ecrã que mostra as opções de visualização da lista de documentos e os filtros.

Partilha de projeto

Partilhe projetos personalizados de extração com facilidade. Para mais informações, consulte Partilha de projetos com modelos personalizados.