サーバーレスエンドポイントを呼び出す - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

サーバーレスエンドポイントを呼び出す

サーバーレスエンドポイントを使用して推論を実行するには、エンドポイントにHTTPリクエストを送信する必要があります。InvokeEndpoint API または を使用して AWS CLI、エンドポイントを呼び出すPOSTリクエストを行うことができます。サーバーレス呼び出しのリクエストとレスポンスペイロードの最大サイズは 4 MB です。サーバーレスエンドポイントの場合:

  • モデルのダウンロードと /ping へのサーバーの応答は、3 分以内に行われる必要があります。

  • コンテナが /invocations への推論リクエストに応答するためのタイムアウトは 1 分です。

エンドポイントを呼び出すには

次の例では、 AWS SDK for Python (Boto3) を使用して InvokeEndpoint を呼び出しますAPI。このガイドの他のAPI呼び出しとは異なり、 では SageMaker ランタイムランタイムをクライアントとして使用InvokeEndpointする必要があることに注意してください。次の値を指定します。

  • endpoint_name では、呼び出すインサービスサーバーレスエンドポイントの名前を使用します。

  • ではcontent_type、リクエスト本文の入力データMIMEのタイプを指定します (例: application/json)。

  • payload では、推論のリクエストペイロードを使用します。ペイロードはバイト単位またはファイルのようなオブジェクトでなければなりません。

runtime = boto3.client("sagemaker-runtime") endpoint_name = "<your-endpoint-name>" content_type = "<request-mime-type>" payload = <your-request-body> response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )