對文件資料進行預測 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

對文件資料進行預測

下列程序描述如何針對文件資料集進行單一和批次預測。每個 Ready-to-use模型都支援資料集的單一預測批次預測單一預測是指您只需要進行一項預測的時候。例如您有一個要從中擷取文字的映像,或者要偵測優勢語言的一個文字段落。批次預測是指您想要對整個資料集進行預測的時候。例如,您可能有一個客戶評論CSV檔案,您想要分析客戶情緒,或者您可能有您想要偵測物件的影像檔案。

您可以針對下列 Ready-to-use模型類型使用這些程序:費用分析、身分文件分析和文件分析。

注意

針對文件查詢,目前僅支援單一預測。

單一預測

若要針對 Ready-to-use接受文件資料的模型進行單一預測,請執行下列動作:

  1. 在 Canvas 應用程式的左側導覽窗格中,選擇 Ready-to-use 模型

  2. Ready-to-use 模型頁面上,選擇 Ready-to-use使用案例的模型。針對文件資料,應該是下列其中一項:費用分析身分文件分析文件分析

  3. 在所選 Ready-to-use模型的執行預測頁面上,選擇單一預測

  4. 如果您的 Ready-to-use模型是身分文件分析或文件分析,請完成下列動作。如果您正在進行費用分析或文件查詢,請略過這個步驟並分別前往步驟 5 或步驟 6。

    1. 選擇上傳文件

    2. 系統會提示您從本機電腦上傳 JPG、 PDF或 PNG 檔案。從本機檔案中選取文件,然後產生預測結果。

  5. 如果您的 Ready-to-use模型是費用分析,請執行下列動作:

    1. 選擇上傳發票或收據

    2. 系統會提示您從本機電腦上傳 PDF、PNG、 JPG或 TIFF 檔案。從本機檔案中選取文件,然後產生預測結果。

  6. 如果您的 Ready-to-use模型是文件查詢,請執行下列動作:

    1. 選擇上傳文件

    2. 系統會提示您從本機電腦上傳PDF檔案。從本機檔案中選取文件。您的 長度PDF必須為 1–100 頁。

      注意

      如果您位於亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨) 或歐洲 (法蘭克福) 區域,則文件查詢PDF的大小上限為 20 頁。

    3. 在右側窗格中,輸入要搜尋文件中資訊的查詢。您可以在單一查詢中包含的字元數為 1-200。您可再新增最多 15 個查詢。

    4. 選擇提交查詢,然後產生結果並附上查詢的答案。每次提交查詢,我們都會向您收取一次費用。

在右窗格預測結果中,您將收到文件的分析。

下列資訊描述每種解決方案類型的結果:

  • 針對費用分析,結果會分類為摘要欄位,其中包括收據總額等欄位,以及明細項目欄位,其中包含收據上的個別項目等欄位。識別的欄位會在輸出的文件影像上反白顯示。

  • 對於身分文件分析,輸出會顯示模型識別的欄位 Ready-to-use,例如名字和姓氏、地址或出生日期。識別的欄位會在輸出的文件影像上反白顯示。

  • 針對文件分析,結果會分類為原始文字表格資料表簽章原始文字包括所有擷取文字,而表格資料表簽章則只包含屬於這些類別之表格上的資訊。例如資料表只包括從文件中的資料表中擷取到的資訊。識別的欄位會在輸出的文件影像上反白顯示。

  • 針對文件查詢,Canvas 會傳回每個查詢的答案。您可以開啟可折疊的查詢下拉式清單來檢視結果,以及預測的可信度分數。如果 Canvas 在文件中找到多個答案,則每個查詢可能會有一個以上的結果。

下列螢幕擷取畫面顯示使用文件分析解決方案進行單一預測的結果。

使用文件分析 Ready-to-use模型進行單一預測的結果螢幕擷取畫面。

批次預測

若要對 Ready-to-use接受文件資料的模型進行批次預測,請執行下列動作:

  1. 在 Canvas 應用程式的左側導覽窗格中,選擇 Ready-to-use 模型

  2. Ready-to-use 模型頁面上,選擇 Ready-to-use使用案例的模型。針對影像資料,應該是下列其中一項:費用分析身分文件分析文件分析

  3. 在所選 Ready-to-use模型的執行預測頁面上,選擇批次預測

  4. 如果您已匯入您的資料集,請選擇選取資料集。如果沒有,請選擇匯入新的資料集,然後系統將導引您完成匯入資料工作流程。

  5. 從可用資料集清單中,選取您的資料集,然後選擇產生預測。如果您的使用案例是文件分析,請繼續執行步驟 6。

  6. (選用) 如果您的使用案例是文件分析,則會出現另一個名為選取要包含在批次預測中的功能對話方塊。您可以選取表單資料表簽章,依這些功能將結果分組。然後,選擇產生預測

預測工作完成執行後,在執行預測頁面上,您會看到預測下方列出的輸出資料集。此資料集包含您的結果,且如果您選取了更多選項圖示 ( Vertical ellipsis icon representing a menu or more options. ),則您可以選擇檢視預測結果來預覽文件資料的分析。

下列資訊描述每種解決方案類型的結果:

  • 針對費用分析,結果會分類為摘要欄位,其中包括收據總額等欄位,以及明細項目欄位,其中包含收據上的個別項目等欄位。識別的欄位會在輸出的文件影像上反白顯示。

  • 對於身分文件分析,輸出會顯示模型識別的欄位 Ready-to-use,例如名字和姓氏、地址或出生日期。識別的欄位會在輸出的文件影像上反白顯示。

  • 針對文件分析,結果會分類為原始文字表格資料表簽章原始文字包括所有擷取文字,而表格資料表簽章則只包含屬於這些類別之表格上的資訊。例如資料表只包括從文件中的資料表中擷取到的資訊。識別的欄位會在輸出的文件影像上反白顯示。

預覽結果後,您可以選擇下載預測,並將結果下載為ZIP檔案。