Boxアプリケーションを作成して構成する
任意のBox Platform統合では、最初のステップとして、Boxアプリケーションを作成して構成します。
- Box開発者コンソールに移動します。
- このクイックスタートでは、アプリケーションの種類として
Client Credentials Grantを使用してアプリを作成します。 - アプリが作成されたら、以下のスコープを有効にします。
Boxに格納されているすべてのファイルとフォルダの読み取りBoxに格納されているすべてのファイルとフォルダへの書き込みAIを管理する
テストファイルをアップロードする
テンプレートを準備したら、テストするファイルを選択します。このクイックスタートでは、こちらの源泉徴収票のサンプルを使用してください。
- テスト用ドキュメントをダウンロードして、Boxアカウントにドラッグアンドドロップします。
-
ファイルIDを確認するには、Boxでファイルを開いてURLを調べます。パスの最後の部分がファイルIDです。たとえば、次のようなURLがあるとします:
https://app.box.com/file/2064123286902この場合、ファイルIDは2064123286902です。
環境を設定する
抽出を実行するために、開発環境を設定します。このクイックスタートでは、PythonとBox Python SDKバージョン10を使用します。お使いのマシンにPython 3.11以上がインストールされていることを確認してください。
- プロジェクト用に新しいディレクトリを作成し、そのディレクトリに移動します。
- 仮想環境を作成します。
- Box Python SDKをインストールします。
.envファイルから環境変数を読み込むためにpython-dotenvパッケージをインストールします。- プロジェクトディレクトリのルートに
.envファイルを作成し、以下の環境変数を追加します。その際、プレースホルダの値を実際のBoxアプリの資格情報と前の手順で確認したIDに置き換えます。
- [開発者トークンを生成] をクリックして新しいトークンを作成します。
freeform-extract.pyファイルを作成する
開発環境の準備ができました。Box AIを使用してドキュメントからデータを抽出するPythonスクリプトを作成できます。
-
プロジェクトディレクトリのルートに
freeform-extract.pyという名前の新しいファイルを作成し、以下のコードを追加します。このコードは、環境変数を.envファイルから読み込み、Box SDKクライアントを初期化し、現在のユーザーのIDを出力して、クライアントが正しく動作していることを確認します。 -
ターミナルで次のコマンドを使用してスクリプトを実行します。
Box SDKクライアントが正しく設定されると、コンソールにはユーザーIDが表示されます。次に例を示します。
データを抽出する
Box SDKクライアントが動作を開始したら、Box AIを使用してドキュメントからデータを抽出するためのコードを追加できます。
-
get_box_client関数とmain関数の間に次の関数を追加します。この関数では、Box AIのcreate_ai_extractメソッドを使用して、指定したファイルからメタデータを抽出します。BoxClientとファイルIDは関数に送信され、この関数により、抽出されたメタデータがディクショナリとして返されます。 -
main関数でメタデータを抽出する関数呼び出しを追加します。新しいmain関数に次のロジックが含まれていることを確認します。SDKはBox AIへのAPIコールを処理し、抽出されたメタデータをAiExtractResponseオブジェクトとして返します。このクイックスタートでは、このコードによって、このオブジェクトがディクショナリに変換され、抽出されたキー/値ペアを含むanswerフィールドが返されます。 -
ターミナルで次のコマンドを実行して、抽出されたメタデータをコンソールに出力し、抽出が成功したかどうかを確認します。
抽出が成功した場合、コンソールでは、ユーザーIDの後に、源泉徴収票から抽出されたメタデータが表示されます。
