本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
當您建立影片影格物件偵測或物件追蹤標籤工作時,您可以提供一系列影片影格 (影像),也可以使用 Amazon SageMaker AI 主控台讓 Ground Truth 自動從您的影片檔案擷取影片影格。使用以下各章節以進一步了解這些選項。
提供影片影格
影片影格是從影片檔案中擷取的映像序列。您可以建立一個 Ground Truth 標籤工作,讓工作者標籤多個影片影格序列。每個序列由單一影片中擷取的映像組成。
若要使用影片影格序列建立標籤工作,您必須在 Amazon S3 中使用專屬金鑰名稱字首儲存每個序列。在 Amazon S3 主控台內,金鑰名稱字首是資料夾。因此,在 Amazon S3 主控台內,每個影片影格畫面序列都必須位於 Amazon S3 內各自的資料夾內。
例如,如果您有兩個連續的影片影格,您可以使用金鑰名稱字首 sequence1/
和 sequence2/
以識別序列。在此範例中,您的序列可能位於 s3://amzn-s3-demo-bucket/video-frames/sequence1/
和 s3://amzn-s3-demo-bucket/video-frames/sequence2/
內。
如果您使用 Ground Truth 主控台建立一個輸入資訊清單檔案,則所有序列金鑰名稱字首都應位於 Amazon S3 內相同的位置。例如,在 Amazon S3 主控台中,每個序列都可以位於 s3://amzn-s3-demo-bucket/video-frames/
的資料夾內。在此範例中,您的第一個影片影格 (映像) 序列可能位於 s3://amzn-s3-demo-bucket/video-frames/sequence1/
內,而第二個序列可能位於 s3://amzn-s3-demo-bucket/video-frames/sequence2/
內。
重要
即使您只有單一序列影片影格需要工作者標籤,該序列在 Amazon S3 中也必須有金鑰名稱字首。如果您使用的是 Amazon S3 主控台,這表示您的序列位於一個資料夾中。它不能位於 S3 儲存貯體的根目錄中。
使用影片影格序列建立工作者任務時,Ground Truth 每個任務使用一個序列。在每個任務中,Ground Truth 使用 UTF-8
例如,Amazon S3 中的影片影格可能會是以下的排序:
[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]
它們的排列順序如同在工作者任務中的順序:0001.jpg,
0002.jpg, 0003.jpg, ..., 0011.jpg
。
也可以使用命名慣例來排序影格,如下所示:
[frame1.jpg, frame2.jpg, ..., frame11.jpg]
在這種情況下,在工作者任務中,frame10.jpg
和 frame11.jpg
在 frame2.jpg
之前。您的工作者會以下列排序查看您的影片影格:frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ...,
frame9.jpg
。
提供影片檔案
您可以透過使用 Ground Truth 影格分割功能從影片檔案 (MP4 檔案) 中擷取影片影格,在主控台中建立新的標籤工作。從單一影片檔案擷取的一系列影片影格稱為影片影格序列。
您可以讓 Ground Truth 自動從影片中擷取所有影格 (最多 2,000 個影格),或者可以指定影格擷取的頻率。例如,您可以讓 Ground Truth 在影片中每10 個影格擷取一次。
您可以使用自動化資料設定擷取影格時,您最多可以提供 50 部影片,但是當您建立影片影格物件追蹤和影片影格物件偵測標籤工作時,輸入資訊清單檔案無法參考超過 10 個影片影格序列檔案。如果您使用自動化資料設定主控台工具,從 10 個以上的影片檔案擷取影片影格,您將需要修改工具產生的資訊清單檔案,或建立一個新檔案以包含 10 個或以下的影片影格序列檔案。若要進一步了解這些配額,請參閱3D 點雲與影片影格標籤工作配額。
若要使用影片影格擷取工具,請參閱設定自動影片影格輸入資料。
成功從影片擷取所有影片影格後,您會在 S3 輸入資料集的位置看到以下內容:
-
以每部影片命名的金鑰名稱字首 (Amazon S3 主控台中的資料夾)。這些字首每一個都會導向:
-
用於命名該字首、從影片中擷取的一個影片影格序列。
-
一個序列檔案,用來識別組成該序列的所有映像。
-
-
副檔名為 .manifest 的輸入資訊清單檔案。這會用來識別用於建立標籤工作的所有序列檔案。
從單一影片檔案中擷取的所有影格,都用於標籤任務。如果您從多個影片檔案擷取影片影格,則會針對標籤工作建立多個工作,每個影片影格序列各一個工作。
Ground Truth 會使用專屬金鑰名稱字首,將擷取的每個影片影格序列儲存在 Amazon S3 的輸入資料集位置。在 Amazon S3 主控台內,金鑰名稱字首是資料夾。