亚马逊 SageMaker 功能 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 SageMaker 功能

Amazon SageMaker 包含以下功能。

re: Invent 2023 的新功能

SageMaker 包括 re: Invent 2023 的以下新功能。

SageMaker 用于数据准备的画布聊天

SageMaker 用于数据准备的 Canvas 聊天可帮助您使用 LLM 创建数据准备流程。

代码编辑器

代码编辑器扩展了 Studio,这样你就可以在基于 Visual Studio 代码——开源(“Code-OSS”)的环境中编写、测试、调试和运行分析和机器学习代码。

用于大型模型推理的深度学习容器

SageMaker 已将默认的 NCCL 内核替换为推理优化的内核,以提高 GPU 利用率并提供与 OSS 相比的差异化性能。

部署模型以进行实时推理

SageMaker Inference 提供开发者体验和用户界面抽象,可帮助您更快地开始部署模型。

SageMaker 现在,客户可以通过向 SageMaker 端点部署多达数千个模型,从而提高其加速计算实例的利用率,保证吞吐量并根据每个模型进行自动缩放。

SageMaker分发图片

SageMaker 分发是一组专为机器学习、数据科学和数据分析而设计的 Docker 镜像。这些图像可在 Studio、Studio Lab、Studio 笔记本电脑和 Github

域名注册简化

为单个用户和组织管理员提供简化和指导性的 Amazon SageMaker 域名注册体验,为单个用户和组织管理员提供新功能。这些功能包括直接的 IAM Identity Center 集成、精细的访问策略管理、无缝的 SageMaker 应用程序管理和配置以及 VPC 和存储配置。

亚马逊 S3 Express One 专区

Amazon S3 Express One Zone 是一种新的存储类别,它为对延迟最敏感的应用程序提供个位数毫秒的访问权限。Amazon S3 Express One Zone 允许客户将其对象存储和计算资源配置在单个 AWS 可用区中,从而通过提高数据处理速度来优化计算性能和成本。

基础模型评估 (fmeVal)

基础模型评估 (fmeVal) 可帮助您量化在语言模型中提供不准确、有毒或有偏见的内容的风险,以便您可以为自己的用例选择最佳的语言模型。自带自定义数据集或使用内置数据集来评估任何语言模型。FMeVal 与数十种基于文本的基础模型集成在一起, JumpStart 也可以自带。您也可以使用 FMeVal 库创建自定义评估。

SageMaker HyperPod

SageMaker HyperPod 是一种功能 SageMaker ,它在弹性集群上提供了一个始终在线的机器学习环境,您可以运行任何机器学习工作负载来开发大型机器学习模型,例如大型语言模型 (LLM) 和扩散模型。

jupyterAI

Jupyter AI 和 Code Whisperer 已包含在发行版中。 SageMaker 通过此更新,Studio 或 Code Editor 的用户可以轻松使用笔记本电脑中的生成式 AI,并利用 Code Whisperer 的代码完成功能。

JupyterLab 在工作室里

JupyterLab Studio 提高了 Studio 笔记本电脑的延迟和可靠性

SageMaker笔记本职位

SageMaker Notebook Jobs 为笔记本作业提供 SDK 支持,因此您可以通过编程方式安排笔记本作业。

SageMaker 管道

SageMaker Pipelines 为您提供了将本地机器学习代码转换为 SageMaker 流水线步骤的选项,您可以从中创建和运行管道。

SageMaker智能筛选

SageMaker 智能筛选是 Training SageMaker 的一项功能,它可以提高训练数据集的效率并减少总训练时间和成本。

SageMaker Studio

Studio 是运行机器学习工作流程的最新基于 Web 的体验。Studio 提供了一套 IDE,包括代码编辑器、新的 Jupyterlab 应用程序、rStudio 和 Studio Classic。

机器学习环境

SageMaker 包括以下机器学习环境。

SageMaker 地理空间功能

使用地理空间数据构建、训练和部署机器学习模型。

SageMaker 帆布

一项自动机器学习服务,使没有编码经验的人能够构建模型并使用这些模型进行预测。

SageMaker 工作室

一体式机器学习环境,您可以在同一应用程序中构建、训练、部署和分析模型。

SageMaker 工作室实验室

一项免费服务,允许客户在基于开源的环境中访问 AWS 计算资源 JupyterLab。

亚马逊上的 RStudio SageMaker

RStudio on Amazon SageMaker 是 R 的集成开发环境,具有控制体、支持直接代码执行的语法突出显示编辑器以及用于绘制、历史记录、调试和工作区管理的工具。

主要特征

SageMaker 按字母顺序包括以下主要功能,不包括任何 SageMaker前缀。

Amazon Augmented AI

构建人工审核机器学习预测所需的工作流。Amazon A2I 使所有开发人员都能使用人工审核,消除了与构建人工审核系统或管理大量人工审核人员相关的千篇一律的繁重工作。

AutoML 步骤

创建 AutoML 作业以在 Pipelines 中自动训练模型。 SageMaker

SageMaker 自动驾驶

不了解机器学习的用户可以快速构建分类和回归模型。

批量转换

预处理数据集,在不需要持久终端节点时运行推理,并将输入记录与推理相关联,以帮助解释结果。

SageMaker 澄清

通过检测潜在的偏见来改进机器学习模型,并协助解释模型所做的预测。

使用共享空间进行协作

共享空间由共享 JupyterServer 应用程序和共享目录组成。Amazon SageMaker 域中的所有用户个人资料均可访问该域中的所有共享空间。

SageMaker Data Wrangler

在 Studio 中导入、分析、准备和展示数据。 SageMaker 您可以将 Data Wrangler 集成到机器学习工作流中,以简化数据预处理和特征工程,只需少量甚至不需要编写代码。您还可以添加自己的 Python 脚本和转换来自定义数据准备工作流。

Data Wrangler 数据准备小部件

与您的数据进行交互、探索切实可行的见解并修复数据质量问题。

SageMaker 调试器

在整个训练过程中检查训练参数和数据。自动检测常见错误并向用户发出警报,例如参数值变得太大或太小。

SageMaker 边缘管理器

优化边缘设备的自定义模型,创建和管理队列,并在有效的运行时系统中运行模型。

SageMaker Elastic Inference

提高吞吐量并减少获取实时推理的延迟。

SageMaker 实验

实验管理和跟踪。您可以使用跟踪的数据重新构建实验,在对等方进行的实验基础上逐步构建,并跟踪模型谱系以进行合规性和审核验证。

SageMaker 精选商店

特征和关联元数据的集中化存储,以便轻松发现和重用特征。您可以创建两种类型的存储,即在线存储和离线存储。在线存储可用于低延迟、实时推理使用案例,离线存储可用于训练和批量推断。

SageMaker Ground Truth

高质量的训练数据集,通过安排工作人员和使用机器学习来创建标注数据集。

SageMaker Ground Truth

一个功能齐全的数据标注功能,可创建高质量的训练数据集,而无需自行构建标注应用程序和管理标签人力。

SageMaker 推理推荐器

获取有关推理实例类型和配置的建议(例如实例计数、容器参数和模型优化),以便使用机器学习模型和工作负载。

推理影子测试

通过将模型服务基础设施的性能与当前部署的基础设施进行比较,评估对模型服务基础设施进行的任何更改。

SageMaker JumpStart

通过精选的一键式解决方案、示例笔记本和您可以部署的预训练模型,了解 SageMaker 特性和功能。您还可以微调模型并进行部署。

SageMaker ML 血统追踪

跟踪机器学习工作流的流水线。

SageMaker 建模管道

创建和管理与 SageMaker作业直接集成的机器学习管道。

SageMaker 模型卡

在一个位置记录有关机器学习模型的信息,以便在整个机器学习生命周期中简化管理和报告。

SageMaker 模型仪表板

账户中所有模型的预构建的可视化概览。Model Dashboard 集成了来自 SageMaker 模型监视器、转换作业、端点、谱系跟踪的信息, CloudWatch 因此您可以在一个统一的视图中访问高级模型信息并跟踪模型性能。

SageMaker 模型监视器

监控和分析生产中的模型(端点),以检测数据偏差和模型质量偏差。

SageMaker 模型注册表

用于部署机器学习模型的版本控制、构件和任务流水线追踪功能、审批工作流和跨账户支持。

SageMaker Neo

训练机器学习模型一次,然后在云端和边缘的任何位置运行。

基于笔记本的工作流

将您的 SageMaker Studio 笔记本作为非交互式的计划作业运行。

预处理

分析和预处理数据,处理特征工程问题,并评估模型。

SageMaker 项目

使用 SageMaker 项目创建带有 CI/CD 的 end-to-end 机器学习解决方案。

强化学习

代理通过其操作获得最大化的长期奖励。

SageMaker 角色管理器

管理员可以使用基于自定义和预配置的角色的 IAM 角色,为常见机器学习活动定义最低权限。

SageMaker 无服务器端点

用于托管机器学习模型的无服务器端点选项。自动横向缩减容量以提供端点流量。无需在端点上选择实例类型或管理扩展策略。

工作室经典 Git 扩展

一个 Git 扩展,供您输入 Git 存储库的 URL、将其克隆到您的环境中、推送更改以及查看提交历史记录。

SageMaker Studio 笔记本

下一代 SageMaker 笔记本包括 AWS IAM Identity Center (IAM Identity Center)集成、快速启动时间和一键共享。

SageMaker Studio 笔记本和 Amazon EMR

直接从 SageMaker Studio 使用单账户和跨账户配置轻松发现、连接、创建、终止和管理 Amazon EMR 集群。

SageMaker 训练编译器

在由管理的可扩展 GPU 实例上更快地训练深度学习模型 SageMaker。