ストリーミングラベル付けジョブにデータを送信する - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ストリーミングラベル付けジョブにデータを送信する

必要に応じて、入力マニフェストファイルを使用してラベル付けジョブを作成するときに、ストリーミングラベル付けジョブに入力データを送信できます。ラベル付けジョブが開始され、状態が になったらInProgress、Amazon SNS入力トピックと Amazon S3 イベント通知を使用して、新しいデータオブジェクトをラベル付けジョブにリアルタイムで送信できます。

ラベル付けジョブ 開始時にデータオブジェクトを送信する (1 回):

  • 入力マニフェストファイルを使用する – ストリーミングラベル付けジョブを作成するManifestS3Uriときに、オプションURIで で入力マニフェストファイル Amazon S3 を指定できます。Ground Truth は、ラベル付けジョブが開始されるとすぐに、ラベル付けのために、マニフェストファイル内の各データオブジェクトをワーカーに送信します。詳細については、「マニフェストファイルを作成する (オプション)」を参照してください。

    ストリーミングラベル付けジョブを作成するリクエストを送信すると、ステータスは Initializing になります。ラベル付けジョブがアクティブになると、状態は InProgress に変わり、リアルタイムオプションを使用して、ラベル付け用に追加のデータオブジェクトを送信できます。

データオブジェクトをリアルタイムで送信する:

  • Amazon SNS メッセージを使用してデータオブジェクトを送信する – Amazon メッセージを送信することで、Ground Truth の新しいデータオブジェクトをラベル付けに送信できますSNS。このメッセージは、ストリーミングラベル付けジョブの作成時に作成して指定する Amazon SNS入力トピックに送信します。詳細については、「Amazon を使用してデータオブジェクトを送信する SNS」を参照してください。

  • データオブジェクトを Amazon S3 バケットに配置して送信する - Amazon S3 バケットに新しいデータオブジェクトを追加するたびに、Ground Truth がそのオブジェクトをラベル処理するように促すことができます。これを行うには、バケットにイベント通知を追加して、新しいオブジェクトがそのバケットに追加 (またはバケットに作成される) たびに Amazon SNS入力トピックに通知されるようにします。詳細については、「Amazon S3 を使用してデータオブジェクトを送信する」を参照してください。このオプションは、テキスト分類や固有表現認識などのテキストベースのラベル付けジョブでは使用できません。

    重要

    Amazon S3 の設定を使用する場合は、入力データ設定と出力データに同じ Amazon S3 の場所を使用しないでください。ラベル付けジョブの作成時に、出力データの S3 プレフィックスを指定します。

Amazon を使用してデータオブジェクトを送信する SNS

Amazon Simple Notification Service (Amazon ) を使用して、ストリーミングラベル付けジョブにデータオブジェクトを送信できますSNS。Amazon SNS は、エンドポイント (E メールアドレスや AWS Lambda 関数など) との間で送受信されるメッセージの配信を調整および管理するウェブサービスです。Amazon SNSトピックは、2 つ以上のエンドポイント間の通信チャネルとして機能します。Amazon を使用して、 の CreateLabelingJobパラメータで指定されたトピックに新しいデータオブジェクトSNSを送信または発行SnsTopicArnしますInputConfig。これらのメッセージの形式は、入力マニフェストファイルからの 1 行と同じです。

例えば、テキストを入力トピックに発行することで、アクティブなテキスト分類ラベル付けジョブにテキストの一部を送信できます。発行するメッセージは、次のようになります。

{"source": "Lorem ipsum dolor sit amet"}

新しいイメージオブジェクトをイメージ分類ラベル付けジョブに送信するには、メッセージは次のようになります。

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
注記

Amazon SNS メッセージにカスタム重複排除キーIDsと重複排除キーを含めることもできます。詳細については、「重複メッセージの処理」を参照してください。

Ground Truth がストリーミングラベル付けジョブを作成すると、Amazon SNS入力トピックにサブスクライブします。

Amazon S3 を使用してデータオブジェクトを送信する

ストリーミングラベル付けジョブに 1 つ以上の新しいデータオブジェクトを送信するには、Amazon SNSイベント通知で設定された Amazon S3 バケットに配置します。バケットに新しいオブジェクトが作成されるたびに Amazon SNS入力トピックに通知するイベントを設定できます。の CreateLabelingJobパラメータで、この同じ Amazon SnsTopicArn SNS入力トピックを指定する必要がありますInputConfig

Amazon S3 バケットを設定して Amazon に通知を送信するたびにSNS、Ground Truth はテストイベント を発行し"s3:TestEvent"、トピックが存在し、指定された Amazon S3 バケットの所有者が指定されたトピックに発行するアクセス許可を持っていることを確認します。ストリーミングラベル付けジョブSNSを開始する前に、Amazon との Amazon S3 接続を設定することをお勧めします。これを行わない場合、このテストイベントがデータオブジェクトとして登録され、ラベル付けのために Ground Truth に送信されることがあります。

重要

Amazon S3 の設定を使用する場合は、入力データ設定と出力データに同じ Amazon S3 の場所を使用しないでください。ラベル付けジョブの作成時に、出力データの S3 プレフィックスを指定します。

イメージベースのラベル付けジョブの場合、Ground Truth ではすべての S3 バケットにCORSポリシーがアタッチされている必要があります。詳細については、「CORS 入力イメージデータの要件」を参照してください。

Amazon S3 バケットを設定してラベル付けジョブを作成したら、バケットにオブジェクトを追加でき、Ground Truth はそのオブジェクトをワーカーに送信するか、Amazon SQSキューに配置します。

詳細については、「ラベル付けジョブでSNS定義された Amazon に基づいて Amazon S3 ベースのバケットイベント通知を作成する」を参照してください。

重要

このオプションは、テキスト分類や固有表現認識などのテキストベースのラベル付けジョブでは使用できません。