大型模型推理 (LMI) 容器文档

大型模型推理 (LMI) 容器文档在 Deep Java Library 文档网站上提供。

本文档专为需要在 Amazon 上部署和优化大型语言模型 (LLMs) 的开发人员、数据科学家和机器学习工程师编写 SageMaker。它可以帮助您使用LMI容器，这些容器是专门用于LLM推理的 Docker 容器，由提供。 AWS它提供了概述、部署指南、支持的推理库的用户指南和高级教程。

通过使用LMI容器文档，您可以：

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

模型并行和大型模型推理

SageMaker LMI 的端点参数