翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
サーバーレスエンドポイントを呼び出す
サーバーレスエンドポイントを使用して推論を実行するには、エンドポイントにHTTPリクエストを送信する必要があります。InvokeEndpoint API または を使用して AWS CLI、エンドポイントを呼び出すPOST
リクエストを行うことができます。サーバーレス呼び出しのリクエストとレスポンスペイロードの最大サイズは 4 MB です。サーバーレスエンドポイントの場合:
モデルのダウンロードと
/ping
へのサーバーの応答は、3 分以内に行われる必要があります。コンテナが
/invocations
への推論リクエストに応答するためのタイムアウトは 1 分です。
エンドポイントを呼び出すには
次の例では、 AWS SDK for Python (Boto3)InvokeEndpoint
する必要があることに注意してください。次の値を指定します。
-
endpoint_name
では、呼び出すインサービスサーバーレスエンドポイントの名前を使用します。 -
では
content_type
、リクエスト本文の入力データMIMEのタイプを指定します (例:application/json
)。 -
payload
では、推論のリクエストペイロードを使用します。ペイロードはバイト単位またはファイルのようなオブジェクトでなければなりません。
runtime = boto3.client("sagemaker-runtime") endpoint_name = "
<your-endpoint-name>
" content_type = "<request-mime-type>
" payload =<your-request-body>
response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )