Document Intelligence Studio カスタム プロジェクトを作成する

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青色チェックマークv3.1 (GA)赤色チェックマークv3.0 (廃止)

Azure Foundry Tools Studio のドキュメント インテリジェンス は、ドキュメント インテリジェンスの機能を視覚的に調査し、理解し、アプリケーションに統合するために使用できるオンライン ツールです。 このクイック スタートでは、Document Intelligence Studio でカスタム プロジェクトを設定する方法について説明します。

前提 条件

サブスクリプション、リソース、認証のセットアップの詳細については、「 Document Intelligence Studio の概要」を参照してください。

新しいユーザーの前提条件

Azure アカウントとドキュメント インテリジェンスまたは Microsoft Foundry リソースに加えて、Azure Blob Storage コンテナーとAzureロールの割り当てが必要です。

Azure Blob Storage コンテナー

標準のパフォーマンス Azure Blob Storage アカウントが必要です。 ストレージ アカウント内にトレーニング ドキュメントを格納および整理するためのコンテナーを作成できます。 コンテナーを使用してAzure ストレージ アカウントを作成する方法がわからない場合は、次のクイック スタートに従います。

  • ストレージ アカウントを作成する: ストレージ アカウントを作成するときに、[インスタンスの 詳細>パフォーマンス ] フィールドで[Standard performance]\( 標準 パフォーマンス\) を選択します。
  • コンテナーを作成する: コンテナーを作成するときに、[ 新しいコンテナー ] ウィンドウで、[ パブリック アクセス レベル ] フィールドを [コンテナー ] (コンテナーと BLOB の匿名読み取りアクセス) に設定します。

Azure 役割の割り当て

カスタム プロジェクトでは、さまざまなシナリオで次のロールの割り当てが必要です。

  • Basic

    • Cognitive Services User: カスタム モデルをトレーニングしたり、トレーニング済みのモデルを使用して分析を行ったりするには、ドキュメント インテリジェンスまたは Microsoft Foundry リソースに対してこのロールが必要です。
    • ストレージ BLOB データ共同作成者: プロジェクトとラベル データを作成するには、ストレージ アカウントにこのロールが必要です。
  • 詳細

    • ストレージ アカウント共同作成者: クロスオリジン リソース共有 (CORS) 設定を設定するには、ストレージ アカウントにこのロールが必要です。 (同じストレージ アカウントが再利用される場合、このアクションは 1 回限りの作業です)。
    • 共同作成者: リソース グループとリソースを作成するには、このロールが必要です。

    メモ

    Document Intelligence サービス リソースとストレージ アカウントに対してローカル (キーベース) 認証が無効になっている場合は、Document Intelligence Studio を使用するための十分なアクセス許可が付与されるように、Cognitive Services ユーザーロールとストレージ BLOB データ共同作成者ロールをそれぞれ取得してください。 ストレージ アカウントの共同作成者ロールと共同作成者ロールを使用すると、キーを一覧表示できますが、キー アクセスが無効になっている場合にリソースを使用するアクセス許可は付与されません。

CORS の構成

クロス オリジン リソース共有は、Document Intelligence Studio からアクセスできるように、Azure ストレージ アカウントで構成する必要があります。 Azure ポータルで CORS を構成するには、ストレージ アカウントの [CORS] タブにアクセスする必要があります。

  1. ストレージ アカウントの [CORS] タブを選択します。

    Azure ポータル内の CORS 設定メニューを示すスクリーンショットです。

  2. まず、[ BLOB サービス ] タブで新しい CORS エントリを作成します。

  3. 許可される配信元をhttps://documentintelligence.ai.azure.comに設定します。

    ストレージ アカウントの CORS 構成を示すスクリーンショット。

    指定したドメインの代わりにワイルドカード文字 * を使用して、すべての配信元ドメインが CORS 経由で要求を行えるようにすることができます。

  4. Allowed メソッドで使用可能なすべての 8 つのオプションを選択します。

  5. 各フィールドにアスタリスク (*) を入力して、 許可されているすべてのヘッダー公開ヘッダー を承認します。

  6. 最大有効期間を 120 秒または任意の許容値に設定します。

  7. 変更を保存するには、ページの上部にある [保存] を選択します。

これで、Document Intelligence Studio のストレージ アカウントを使用するように CORS を構成する必要があります。

サンプル ドキュメント セット

  1. Azure ポータルにサインインします。 ストレージ アカウントに移動し、 データ ストレージ>Containers を選択します。

    Azure portal の [データ ストレージ] メニューを示すスクリーンショット

  2. 一覧からコンテナーを選択します。

  3. ページの上部にあるメニューで、[ アップロード] を選択します。

    Azure portal の [アップロード] ボタンを示すスクリーンショット。

  4. [ BLOB のアップロード ] ウィンドウで、アップロードするファイルを選択します。

    Azure portal の [BLOB のアップロード] ウィンドウを示すスクリーンショット。

メモ

既定では、Document Intelligence Studio はコンテナーのルートにあるドキュメントを使用します。 カスタム フォーム プロジェクトを作成する手順でフォルダー パスを指定することで、フォルダーに整理されたデータを使用できます。 詳細については、「 サブフォルダーにデータを整理する」を参照してください。

Document Intelligence Studio の機能を使用する

事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする

カスタム抽出モデルのラベル付けページで、ドキュメント インテリジェント サービスの事前構築済みモデルまたはトレーニング済みモデルのいずれかを使用して、ドキュメントに自動ラベル付けできるようになりました。

自動ラベル付けを示すアニメーション化されたスクリーンショット。

一部のドキュメントでは、自動ラベルの実行後にラベルが重複する可能性があります。 後でラベル付けページに重複するラベルがないように、ラベルを変更してください。

自動ラベル付け後の重複ラベルの警告を示すスクリーンショット。

自動ラベル付けテーブル

カスタム抽出モデルのラベル付けページで、手動でテーブルにラベルを付けなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。

自動テーブル のラベル付けを示すアニメーション化されたスクリーンショット。

トレーニング データセットにテスト ファイルを直接追加する

カスタム抽出モデルをトレーニングしたら、必要に応じてテスト ドキュメントをトレーニング データセットにアップロードして、テスト ページを使用してモデルの品質を向上させます。

一部のラベルに対して信頼度の低いスコアが返される場合は、コンテンツに正しいラベルを付けてください。 そうでない場合は、トレーニング データセットに追加し、モデルの品質を向上させるためにラベルを変更します。

トレーニング データセットにテスト ファイルを追加する方法を示すアニメーション化されたスクリーンショット。

カスタム プロジェクトでドキュメント リストのオプションとフィルターを使用する

カスタム抽出モデルのラベル付けページを使用すると、検索、フィルター、並べ替えの機能を使用して、トレーニング ドキュメントを簡単に確認できます。

グリッド ビューを使用してドキュメントをプレビューするか、リスト ビューを使用してドキュメントをより簡単にスクロールできます。

ドキュメント リスト ビューのオプションとフィルターを示すスクリーンショット。

Project 共有

カスタム抽出プロジェクトを簡単に共有できます。 詳細については、「カスタムモデルを使用したプロジェクトの共有」を参照してください。