Amazon による推論のための高度なエンドポイントオプション SageMaker - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon による推論のための高度なエンドポイントオプション SageMaker

リアルタイム推論では、以下の高度な推論オプションを使用してパフォーマンスとコストをさらに最適化できます。

  • マルチモデルエンドポイント – 同じフレームワークを使用し、コンテナを共有できるモデルが複数ある場合は、このオプションを使用します。このオプションは、エンドポイントの利用率を高め、デプロイのオーバーヘッドを減らすことでコストを最適化するのに役立ちます。

  • マルチコンテナエンドポイント – このオプションは、異なるフレームワークを使用し、独自のコンテナを必要とする複数のモデルがある場合に使用します。マルチモデルエンドポイントには多くの利点があり、さまざまなフレームワークやモデルをデプロイできます。

  • シリアル推論パイプライン – エンドポイントの背後にある前処理ロジックと後処理ロジックを使用してモデルをホストする場合は、このオプションを使用します。推論パイプラインは によって完全に管理 SageMaker され、すべてのコンテナが同じ Amazon EC2インスタンスでホストされるため、レイテンシーが低くなります。