Amazon SageMaker AI 功能 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 功能

Amazon SageMaker AI 包含下列功能。

re:Invent 2024 的新功能

SageMaker AI 包含下列 re:Invent 2024 的新功能。

HyperPod 配方

您可以在 Amazon SageMaker HyperPod 中執行配方,或做為 SageMaker 訓練任務執行。您可以使用 HyperPod 訓練轉接器做為架構,協助您執行end-to-end訓練工作流程。訓練轉接器是以 NVIDIA NeMo 架構和 Neuronx 分散式訓練套件為基礎。

Studio 中的 HyperPod

在 Amazon SageMaker Studio 中,您可以在 HyperPod 叢集上啟動機器學習工作負載,並檢視 HyperPod 叢集資訊。提高對叢集詳細資訊和硬體指標的可見性,可協助您的團隊識別適合預先訓練或微調工作負載的合適選項。

HyperPod 任務控管

Amazon SageMaker HyperPod 任務控管是一種強大的管理系統,旨在簡化資源配置,並確保 Amazon EKS 叢集跨團隊和專案有效利用運算資源。HyperPod 任務控管也提供 Amazon EKS 叢集可觀測性,提供叢集容量的即時可見性、運算可用性和用量、團隊配置和使用率,以及任務執行和等待時間資訊。

Amazon SageMaker 合作夥伴 AI 應用程式

透過 Amazon SageMaker 合作夥伴 AI 應用程式,使用者可以存取由業界領先的應用程式提供者建置、發佈和分發的生成式人工智慧 (AI) 和機器學習 (ML) 開發應用程式。合作夥伴 AI 應用程式已通過認證,可在 SageMaker AI 上執行。使用合作夥伴 AI 應用程式,使用者可以加速和改善他們根據基礎模型 (FM) 和傳統 ML 模型建置解決方案的方式,而不會影響敏感資料的安全性,這完全保持在其信任的安全組態內,而且永遠不會與第三方共用。

Q 開發人員可在 Canvas 中使用

您可以使用自然語言與 Amazon SageMaker Canvas 中的 Amazon Q Developer 聊天,以協助解決機器學習問題。您可以與 Q 開發人員討論機器學習工作流程的步驟,並利用 Canvas 功能,例如資料轉換、模型建置和部署。

SageMaker 訓練計劃

Amazon SageMaker 訓練計劃是一種運算保留功能,專為在 SageMaker 訓練任務和 HyperPod 叢集上執行的大規模 AI 模型訓練工作負載而設計。它們可在指定的時間表內提供對高需求 GPU 加速運算資源的可預測存取。您可以指定所需的時間軸、持續時間和最大運算資源,而 SageMaker 訓練計劃會自動管理基礎設施設定、工作負載執行和故障復原。這可讓使用可預測的成本模型,有效率地規劃和執行任務關鍵 AI 專案。

機器學習環境

SageMaker AI 包含下列機器學習環境。

SageMaker Canvas

自動機器學習 (ML) 服務,讓沒有編碼經驗的人員能夠建置模型,並利用模型進行預測。

程式碼編輯器

Code Editor 擴展 Studio,讓您可以根據 Visual Studio Code - Open Source ("Code-OSS") 在環境中撰寫、測試、偵錯和執行分析和機器學習程式碼。

SageMaker 地理空間功能

使用地理空間資料建置、訓練及部署機器學習 (ML) 模型。

SageMaker HyperPod

Amazon SageMaker HyperPod 是 SageMaker AI 的功能,可在彈性叢集上提供全年無休的機器學習環境,您可以執行任何機器學習工作負載,以開發大型機器學習模型,例如大型語言模型 (LLMs) 和擴散模型。

Studio 中的 JupyterLab

Studio 中的 JupyterLab 可改善 Studio 筆記本的延遲和可靠性

Studio

Studio 是執行 ML 工作流程的最新 Web 型體驗。Studio 提供一組 IDEs,包括 Code Editor、新的 Jupyterlab 應用程式、RStudio 和 Studio Classic。

Amazon SageMaker Studio Classic

整合式機器學習環境,可讓您完全在同一個應用程式中建置、訓練、部署和分析模型。

SageMaker Studio Lab

一種免費服務,可讓客戶存取以開放原始碼 JupyterLab 為基礎的環境中的 AWS 運算資源。

Amazon SageMaker AI 上的 RStudio

適用於 R 的整合式開發環境,具有支援直接程式碼執行的主控台、語法強調顯示編輯器,以及繪圖、歷史記錄、偵錯和工作區管理的工具。

主要功能

SageMaker AI 包含下列主要功能,依字母順序排列,不含任何 SageMaker AI 字首。

Amazon 增強版 AI

建置人工審核機器學習 (ML) 預測所需的工作流程。Amazon A2I 消除與建置人工審核系統或管理大量人工審核者相關的繁重工作,為所有開發人員提供人工審核。

AutoML 步驟

建立 AutoML 任務以在管道中自動訓練模型。

SageMaker Autopilot

不熟悉機器學習的使用者可以快速建立分類和迴歸模型。

批次轉換

預處理資料集、在您不需要持久的端點時執行推論,然後將輸入記錄與推論產生關聯,以協助詮釋結果。

SageMaker Clarify

透過偵測潛在的偏差並協助解釋模型所做的預測,改善您的機器學習模型。

與共用空間協作

共用空間包含共用的 JupyterServer 應用程式和共用目錄。Amazon SageMaker AI 網域中的所有使用者設定檔都可以存取網域中的所有共用空間。

SageMaker Data Wrangler

在 SageMaker Studio 中匯入、分析、準備和特徵化資料。您可以將 Data Wrangler 整合到您的機器學習工作流程中,幾乎不使用程式碼,即可簡化和精簡資料預處理和特徵工程。您也可以新增自己的 Python 指令碼和轉換來自訂資料準備工作流程。

Data Wrangler 資料準備小工具

與您的資料互動、取得視覺化的檢視、探索可指引行動的深入解析,並修正資料品質問題。

SageMaker Debugger

在整個訓練過程中檢查訓練參數和資料。自動偵測常見的錯誤並提醒使用者,例如參數值變得太大或太小。

SageMaker Edge Manager

最佳化邊緣裝置的自訂模型、建立和管理機群,並以有效率的執行期執行模型。

SageMaker Experiments

實驗管理和追蹤。您可以使用追蹤的資料來重建實驗、根據同儕所做的實驗來累加建置,以及為了合規性和稽核驗證而追蹤模型譜系。

SageMaker Feature Store

特徵和相關中繼資料的集中儲存庫,可以輕鬆探索和重複使用特徵。您可以建立兩種類型的儲存庫:線上儲存庫或離線儲存庫。線上儲存庫可用於低延遲的即時推論使用案例,而離線儲存庫則用於訓練和批次推論。

SageMaker Ground Truth

高品質訓練資料集,使用工作者加上機器學習來建立有標籤的資料集。

SageMaker Ground Truth Plus

統包式資料標籤功能,可以建立高品質的訓練資料集,無需自行建置標籤應用程式和管理標籤人力資源。

SageMaker Inference Recommender

取得推論執行個體類型和組態 (例如執行個體計數、容器參數和模型最佳化) 的建議,以使用您的機器學習 (ML) 模型和工作負載。

推論陰影測試

透過比較模型服務基礎設施與目前已部署基礎設施的效能,評估模型服務基礎設施的任何變更。

SageMaker JumpStart

透過可部署的精選單鍵式解決方案、範例筆記本和預先訓練模型,了解 SageMaker AI 功能。您還可以微調和部署模型。

SageMaker ML Lineage Tracking

追蹤機器學習工作流程的譜系。

SageMaker Model Building Pipelines

建立和管理直接與 SageMaker AI 任務整合的機器學習管道。

SageMaker 模型卡

請在單一位置記錄機器學習 (ML) 模型的相關資訊,以簡化整個機器學習生命週期中的控管和報告。

SageMaker 模型儀表板

在您的帳戶中所有模型的預先建置視覺化概觀。模型儀表板會整合 SageMaker Model Monitor、轉換工作、端點、歷程追蹤和 CloudWatch 的資訊,讓您在一個統一檢視中存取高階模型資訊並追蹤模型效能。

SageMaker Model Monitor

監控和分析生產中的模型 (端點),以偵測模型品質中的資料漂移和偏差。

SageMaker Model Registry

為機器學習模型部署提供版本控制、成品和歷程追蹤、核准工作流程,以及跨帳戶支援。

SageMaker Neo

將機器學習模型訓練一次,即可在雲端和邊緣的任何地方執行。

以筆記本為基礎的工作流程

將 SageMaker Studio 筆記本做為非互動式排程工作執行。

預處理

分析和預處理資料、進行特徵工程和評估模型。

SageMaker 專案

使用 SageMaker Projects 建立具有 CI/CD 的end-to-end ML 解決方案。

強化學習

將代理人採取行動而獲得的長期報酬最大化。

SageMaker 角色管理器

管理員可以使用自訂、預先設定的角色型 IAM 角色,為常見機器學習 (ML) 活動定義最低權限許可。

SageMaker 無伺服器端點

託管機器學習 (ML) 模型的無伺服器端點選項。自動擴充容量來提供端點流量。無需在端點上選取執行個體類型或管理擴充政策。

Studio Classic Git 延伸模組

Git 延伸模組,可輸入 Git 儲存庫 URL、將其複製到您的環境中、推送變更,以及檢視遞交歷史記錄。

SageMaker Studio 筆記本

新一代 SageMaker 筆記本,其中包含 AWS IAM Identity Center (IAM Identity Center) 整合、快速啟動時間和單鍵共用。

SageMaker Studio 筆記本和 Amazon EMR

直接從 SageMaker Studio 在單一帳戶和跨帳戶組態中輕鬆探索、連線、建立、終止和管理 Amazon EMR 叢集。

SageMaker Training Compiler

在 SageMaker AI 管理的可擴展 GPU 執行個體上更快速地訓練深度學習模型。