本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Amazon Bedrock 資料自動化 (BDA) 處理檔案的一種方法是建立專案。專案是標準和自訂輸出組態的群組。專案需要標準輸出,但自訂輸出是選用的。當您使用專案 ARN 呼叫 InvokeDataAutomationAsync
API 時,檔案會使用該專案中定義的組態設定自動處理。接著會根據專案的組態產生輸出。
專案可以指定階段,可以是 LIVE
或 DEVELOPMENT
。每個階段都是專案的唯一且可變版本。這表示您可以使用DEVELOPMENT
階段編輯或測試,並使用LIVE
階段處理客戶請求。
專案可讓您針對多種檔案類型使用單一資源。例如,使用專案名稱 ABC 傳送至 BDA 的音訊檔案,將使用專案 ABC 的音訊標準輸出組態處理。使用專案名稱 ABC 傳送至 BDA 的文件,將使用專案 ABC 的文件標準輸出組態處理。
專案可讓您在設定標準輸出時擁有更大的彈性。每個標準輸出都有自己的一組可設定選項,例如文字記錄或摘要,而專案可讓您變更這些選項,以更符合您的使用案例。您也可以使用文件或映像的藍圖來設定專案,以定義自訂輸出。設定為產生自訂輸出的專案也會自動產生標準輸出。
以下各節將介紹幾個使用專案的範例。
搭配標準輸出使用專案
讓我們考慮一個使用案例,您只有興趣擷取完整音訊和影片檔案的轉錄摘要。根據預設,當您將音訊和視訊檔案傳送到 BDA 時,會收到文字記錄摘要,以及完整文字記錄、場景層級摘要、偵測到的文字和其他資訊。對於此使用案例,您不想花費額外的時間和資源來收集您不需要的資訊。對於此使用案例,您可以設定標準輸出專案,以僅啟用音訊和視訊檔案的摘要功能。
若要使用 API 或主控台執行此操作,請建立專案並修改音訊和視訊的標準輸出設定。對於影片,請啟用完整影片摘要,但請確保停用其他擷取 (例如,完整音訊文字記錄、場景摘要、內容調節等)。針對音訊重複此組態。將專案設定為僅產生摘要之後,請儲存專案並記下專案的 Amazon Resource Name (ARN)。此 ARN 可用於 InvokeDataAutomationAsync
操作,以大規模處理您的檔案。透過將音訊或影片檔案傳遞至 BDA 並指定此專案 ARN,您只會收到每個檔案的摘要輸出。請注意,在此範例中,未針對文件或映像執行組態。這表示如果您使用該專案 ARN 將映像或文件傳遞至 BDA,您將收到這些檔案的預設標準輸出。
使用具有自訂輸出和標準輸出的專案
在此使用案例中,假設您想要產生文件和音訊檔案的標準輸出摘要,以及從文件中擷取自訂欄位。建立專案之後,請設定音訊的標準輸出以啟用完整音訊摘要,並確保未啟用其他擷取。針對文件重複此標準輸出組態。然後,您可以透過新增 BDA 全球目錄中的新藍圖或預先存在的藍圖來設定文件的自訂輸出。使用此專案 ARN 傳遞給 BDA 的文件將產生標準輸出完整文件摘要,以及已定義自訂欄位的藍圖輸出。使用此專案 ARN 傳遞至 BDA 的音訊檔案將產生完整摘要。
處理文件時,您可能想要針對傳遞給專案的不同文件類型使用多個藍圖。專案機組最多連接 40 個文件藍圖。BDA 會自動將文件與專案中設定的適當藍圖相符,並使用該藍圖產生自訂輸出。此外,您可能想要大量傳遞文件。如果您傳遞的檔案包含多個文件,您可以選擇在建立專案時分割文件。如果您選擇這樣做,BDA 會掃描檔案,並根據內容將其分割成個別文件。然後,這些個別文件會符合正確的藍圖以進行處理。
目前,映像僅支援每個專案的單一藍圖定義。影像檔案類型 JPG 和 PNG 可能會根據其內容被視為影像或掃描文件。我們建議您在處理文件的自訂輸出時建立映像的自訂藍圖,以便 BDA 為包含文字的映像檔案提供所需的輸出。