Criar projetos personalizados do Document Intelligence Studio

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)

Azure Document Intelligence no Foundry Tools Studio é uma ferramenta online que você pode usar para explorar, entender e integrar visualmente recursos do Document Intelligence em seus aplicativos. Este início rápido tem como objetivo mostrar como configurar um projeto personalizado no Document Intelligence Studio.

Pré-requisitos

Para obter informações sobre assinatura, recurso e configuração de autenticação, consulte Introdução ao Document Intelligence Studio.

Pré-requisitos para novos usuários

Além de uma conta Azure e o recurso Document Intelligence ou Microsoft Foundry, você precisa de um contêiner Armazenamento de Blobs do Azure e atribuições de função Azure.

contêiner de armazenamento de blobs do Azure

Você precisa de uma conta de Armazenamento de Blobs do Azure de desempenho padrão. Você pode criar contêineres para armazenar e organizar seus documentos de treinamento em sua conta de armazenamento. Se você não souber como criar uma conta de armazenamento Azure com um contêiner, siga estes guias de início rápido:

  • Crie uma conta de armazenamento: ao criar sua conta de armazenamento, no campoDesempenho> da Instância, selecione Desempenho Padrão.
  • Crie um contêiner: ao criar seu contêiner, no painel Novo Contêiner , defina o campo nível de acesso público como Contêiner (acesso de leitura anônimo para contêineres e blobs).

atribuições de função do Azure

Para projetos personalizados, as seguintes atribuições de função são necessárias para cenários diferentes:

  • Básico

    • Cognitive Services User: você precisa dessa função para o recurso Inteligência de Documento ou Microsoft Foundry para treinar o modelo personalizado ou fazer análise com modelos treinados.
    • Colaborador de dados de blob de armazenamento: você precisa desta função para a conta de armazenamento para criar um projeto e rotular dados.
  • Avançado

    • Colaborador da Conta de Armazenamento: você precisa dessa função para que a conta de armazenamento defina as configurações de CORS (compartilhamento de recursos entre origens). (Essa ação ocorrerá uma única vez se a mesma conta de armazenamento for reutilizada.)
    • Colaborador: você precisa dessa função para criar recursos e um grupo de recursos.

    Nota

    Se a autenticação local (baseada em chave) estiver desabilitada para sua conta de armazenamento e recurso de serviço da Document Intelligence, certifique-se de obter funções de Usuário dos Serviços Cognitivos e Colaborador de Dados de Blob de Armazenamento, respectivamente, para que você tenha permissões suficientes para usar o Estúdio da Document Intelligence. As funções Colaborador da Conta de Armazenamento e Colaborador só permitem que você liste chaves, mas não dá permissão para usar os recursos quando o acesso à chave estiver desabilitado.

Configurar o CORS

Compartilhamento de recursos de origem cruzada deve ser configurado em sua conta de armazenamento Azure para que ele fique acessível no Document Intelligence Studio. Para configurar o CORS no portal Azure, você precisa acessar a guia CORS da sua conta de armazenamento.

  1. Selecione a guia CORS para a conta de armazenamento.

    Captura de tela que mostra o menu de configuração CORS no portal do Azure.

  2. Comece criando uma nova entrada CORS na guia serviço Blob .

  3. Definir origens permitidas como https://documentintelligence.ai.azure.com.

    Captura de tela que mostra a configuração do CORS para uma conta de armazenamento.

    Você pode usar o caractere * curinga em vez de um domínio especificado para permitir que todos os domínios de origem façam solicitações por meio do CORS.

  4. Selecione todas as oito opções disponíveis para métodos permitidos.

  5. Aprove os cabeçalhos permitidos e os cabeçalhos expostos inserindo um asterisco (*) em cada campo.

  6. Defina a Idade Máxima como 120 segundos ou qualquer valor aceitável.

  7. Para salvar as alterações, selecione Salvar na parte superior da página.

O CORS agora deve ser configurado para usar a conta de armazenamento do Document Intelligence Studio.

Conjunto de documentos de exemplo

  1. Entre no portal Azure. Vá para sua conta de armazenamento e selecione Armazenamento de Dados>Contêineres.

    Screenshot que mostra o menu Armazenamento de dados no portal Azure.

  2. Selecione um contêiner na lista.

  3. No menu na parte superior da página, selecione Carregar.

    Screenshot que mostra o botão Carregar contêiner no portal Azure.

  4. No painel Carregar blob , selecione os arquivos a serem carregados.

    Captura de tela que mostra o painel Carregar blob no portal do Azure.

Nota

Por padrão, o Document Intelligence Studio usa documentos localizados na raiz do contêiner. Você pode usar dados organizados em pastas especificando o caminho da pasta nas etapas para criar um projeto de formulário personalizado. Para obter mais informações, consulte Organizar seus dados em subpastas.

Usar recursos do Document Intelligence Studio

Rotular automaticamente documentos com modelos predefinidos ou com um de seus próprios modelos

Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente seus documentos usando um dos modelos predefinidos do Serviço Inteligente de Documentos ou seus modelos treinados.

Captura de tela animada que mostra o rótulo automático.

Para alguns documentos, rótulos duplicados após a execução do rótulo automático são possíveis. Modifique os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

Captura de tela que mostra o aviso de rótulo duplicado após a rotulagem automática.

Tabelas de rótulo automático

Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

Captura de tela animada que mostra a rotulagem de tabela automática.

Adicionar arquivos de teste diretamente ao conjunto de dados de treinamento

Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste no conjunto de dados de treinamento, se necessário.

Se uma pontuação de confiança baixa for retornada para alguns rótulos, certifique-se de rotular corretamente seu conteúdo. Caso contrário, adicione-os ao conjunto de dados de treinamento e reclassifique para melhorar a qualidade do modelo.

Captura de tela animada que mostra como adicionar arquivos de teste a um conjunto de dados de treinamento.

Usar as opções e filtros da lista de documentos em projetos personalizados

Use a página de rotulagem do modelo de extração personalizado para percorrer seus documentos de treinamento com facilidade usando os recursos de pesquisa, filtro e classificação.

Use a exibição de grade para visualizar documentos ou use o modo de exibição de lista para percorrer documentos com mais facilidade.

Captura de tela que mostra as opções e filtros da exibição da lista de documentos.

Compartilhamento de projeto

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.