Amazon SageMaker の機能 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker の機能

Amazon SageMaker には以下の機能が含まれています。

re:Invent 2023 の新機能

SageMaker には、re:Invent 2023 用の次の新機能が含まれています。

SageMaker データ準備用の Canvas チャット

SageMaker データ準備用の Canvas チャットは、 を使用してデータ準備フローを作成するのに役立ちますLLMs。

コードエディタ

Code Editor は Studio を拡張し、Visual Studio Code - Open Source (「Code-OSS」) に基づく環境で分析コードと機械学習コードを記述、テスト、デバッグ、実行できるようにします。

大規模なモデル推論用の深層学習コンテナ

SageMaker は、デフォルトのNCCLカーネルを推論最適化カーネルに置き換えて、GPU使用率を向上させ、 とのパフォーマンスを差別化しますOSS。

リアルタイム推論のためのモデルのデプロイ

SageMaker 推論は、開発者エクスペリエンスとユーザーインターフェイスの抽象化を提供し、モデルデプロイをより迅速に開始できるようにします。

SageMaker 顧客は、最大数千のモデルを、モデルごとにスループットと自動スケーリングが保証された SageMaker エンドポイントにデプロイすることで、高速コンピューティングインスタンスの使用率を向上させることができます。

SageMaker ディストリビューションイメージ

SageMaker ディストリビューションは、機械学習、データサイエンス、データ分析用に設計された Docker イメージのコレクションです。イメージは Studio、Studio Lab、Studio ノートブック、Github で利用できます。

ドメインオンボーディングの簡素化

単一ユーザーと組織管理者向けの新機能により、Amazon SageMaker ドメインのオンボーディングが簡素化され、ガイドされます。機能には、IAMIdentity Center の直接統合、きめ細かなアクセスポリシー管理、シームレスな SageMaker アプリケーション管理と設定、VPCおよびストレージ設定が含まれます。

Amazon S3 Express 1 ゾーン

Amazon S3 Express One Zone は、最もレイテンシーの影響を受けやすいアプリケーションに 1 桁のミリ秒アクセスを提供する新しいストレージクラスです。Amazon S3 Express One Zone を使用すると、お客様はオブジェクトストレージとコンピューティングリソースを 1 つの AWS アベイラビリティーゾーンにコロケーションできるため、データ処理速度が向上し、コンピューティングパフォーマンスとコストの両方を最適化できます。

Foundation モデル評価 (FMEval)

Foundation モデル評価 (FMEval) は、不正確、有害、またはバイアスのあるコンテンツを言語モデルに提供するリスクを定量化し、ユースケースに最適なコンテンツを選択できるようにします。独自のカスタムデータセットを作成するか、組み込みを使用して言語モデルを評価します。FMEval は、 JumpStart または独自の で、数十のテキストベースの基盤モデルと統合されています。FMEval ライブラリを使用してカスタマイズされた評価を作成することもできます。

SageMaker HyperPod

SageMaker HyperPod は、回復力のあるクラスターで常時稼働の機械学習環境 SageMaker を提供する の機能です。この環境では、大規模な言語モデル (LLMs) や拡散モデルなどの大規模な機械学習モデルを開発するために、任意の機械学習ワークロードを実行できます。

JupyterAI

Jupyter AI と Code Whisperer が SageMaker ディストリビューションに含まれています。この更新により、Studio または Code Editor のユーザーはノートブックから生成 AI を簡単に使用でき、Code Whisperer のコード完了機能を活用できます。

JupyterLab Studio で

JupyterLab の Studio が Studio Notebook のレイテンシーと信頼性を向上

SageMaker ノートブックジョブ

SageMaker Notebook Jobs はノートブックジョブSDKをサポートしているため、ノートブックジョブをプログラムでスケジュールできます。

SageMaker パイプライン

SageMaker Pipelines には、ローカル機械学習コードを SageMaker パイプラインステップに変換するオプションがあり、そこからパイプラインを作成して実行できます。

SageMaker スマートふるい分け

SageMaker スマートふるい分けは、 SageMaker トレーニングデータセットの効率を向上させ、総トレーニング時間とコストを削減するトレーニングの一機能です。

SageMaker Studio

Studio は、ML ワークフローを実行するための最新のウェブベースのエクスペリエンスです。Studio は、コードエディタIDEs、新しい Jupyterlab アプリケーション、、Studio Classic などRStudio、 のスイートを提供します。

機械学習環境

SageMaker には、次の機械学習環境が含まれています。

SageMaker 地理空間機能

地理空間データを使用して ML モデルを構築、トレーニング、デプロイします。

SageMaker キャンバス

コーディング経験のないユーザーに、モデルを構築しそれを使って予測を行う機能を提供する自動 ML サービス。

SageMaker Studio

統合された機械学習環境。この環境では、モデルの構築、トレーニング、デプロイ、分析をすべて同じアプリケーションで行うことができます。

SageMaker Studio Lab

オープンソース に基づいて、環境内の AWS コンピューティングリソースへのアクセスを顧客に許可する無料サービス JupyterLab。

RStudio Amazon で SageMaker

コンソール、直接コード実行をサポートする構文強調表示エディタ、プロット、履歴、デバッグ、ワークスペース管理のためのツールを備えた R 向けの統合開発環境です。

主な機能

SageMaker には、プレフィックスを除くアルファベット順に次の主要な機能が含まれています SageMaker。

Amazon Augmented AI

ML 予測の人間によるレビューに必要なワークフローを構築します。Amazon A2I は、人間によるレビューのシステム構築や人間によるレビューの多数の担当者の管理に伴う画一的で面倒な作業を取り除き、すべてのデベロッパーが人間によるレビューが行えるようにします。

AutoML ステップ

AutoML ジョブを作成して、パイプラインでモデルを自動的にトレーニングします。

SageMaker Autopilot

機械学習の知識を持たないユーザーでも、分類モデルと回帰モデルをすばやく構築できます。

バッチ変換

データセットを事前処理し、永続的なエンドポイントが不要なときに推論を実行し、入力レコードを推論に関連付けて結果の解釈を支援します。

SageMaker 明確化

潜在的なバイアスの検出によって機械学習モデルを改善し、モデルが作成する予測を説明するのに役立ちます。

共有スペースでコラボレーション

共有スペースは、共有 JupyterServer アプリケーションと共有ディレクトリで構成されます。Amazon SageMaker ドメイン内のすべてのユーザープロファイルは、ドメイン内のすべての共有スペースにアクセスできます。

SageMaker Data Wrangler

SageMaker Studio でデータをインポート、分析、準備、特徴付けします。Data Wrangler を機械学習ワークフローに統合して、コーディングをほとんどまたはまったく使わずにデータの前処理と特徴エンジニアリングを簡素化および合理化できます。独自の Python スクリプトと変換を追加してデータの事前ワークフローをカスタマイズすることもできます。

Data Wrangler データ準備ウィジェット

データを操作し、視覚化し、実用的なインサイトを探索して、データ品質の問題を修正します。

SageMaker デバッガー

トレーニングプロセス全体を通して、トレーニングパラメータとデータを検査します。パラメータ値が大きすぎたり小さすぎたりするなど、一般的に発生するエラーを自動的に検出し、ユーザーに警告します。

SageMaker Edge Manager

エッジデバイスのカスタムモデルを最適化し、フリートの作成および管理を行い、効率的なランタイムでモデルを実行します。

SageMaker 実験

実験の管理と追跡。追跡されたデータを使用して実験を再構築し、ピアによって実施された実験を段階的に構築できるほか、コンプライアンスと監査の検証のためにモデル系統をトレースできます。

SageMaker Feature Store

特徴の検出と再利用を容易にする、特徴と関連メタデータの一元管理ストア。2 種類のストア (オンラインストアまたはオフラインストア) を作成できます。オンラインストアは低レイテンシーのリアルタイム推論のユースケースに、オフラインストアはトレーニングやバッチ推論に使用されます。

SageMaker Ground Truth

ワーカーと機械学習を使用して、ラベル付きデータセットを作成する高品質のトレーニングデータセット。

SageMaker Ground Truth Plus

ターンキーデータラベリング機能により、ラベリングアプリケーションを構築したり、ラベリングワークフォースを自分で管理したりすることなく、高品質のトレーニングデータセットを作成できます。

SageMaker 推論レコメンダー

ML モデルとワークロードを使用するための推論インスタンスタイプと構成 (インスタンス数、コンテナパラメータ、モデルの最適化など) に関する推奨事項を取得します。

推論、シャドーテスト

現在デプロイされているインフラストラクチャのパフォーマンスと比較して、モデルを提供するインフラストラクチャへの変更を評価します。

SageMaker JumpStart

厳選されたワンクリックソリューション、サンプルノートブック、デプロイできる事前トレーニング済みモデルを通じて、 SageMaker 機能と機能について説明します。モデルを微調整してデプロイすることもできます。

SageMaker ML 系統の追跡

機械学習ワークフローの系統を追跡します。

SageMaker モデル構築パイプライン

ジョブと SageMaker直接統合された機械学習パイプラインを作成および管理します。

SageMaker モデルカード

ML モデルに関する情報を 1 か所に文書化して、ML ライフサイクル全体にわたってガバナンスとレポートを合理化します。

SageMaker モデルダッシュボード

アカウント内すべてのモデルの視覚的な概要が事前に構築されています。Model Dashboard は、 SageMaker Model Monitor、変換ジョブ、エンドポイント、系統追跡などの情報を統合 CloudWatch するため、高レベルのモデル情報にアクセスし、1 つの統合ビューでモデルのパフォーマンスを追跡できます。

SageMaker モデルモニター

本番環境のモデル (エンドポイント) を監視および分析して、データドリフトとモデル品質の偏差を検出します。

SageMaker モデルレジストリ

機械学習モデルのデプロイに対するバージョニング、アーティファクトと系統の追跡、承認ワークフロー、クロスアカウントのサポート。

SageMaker Neo

機械学習モデルを一度トレーニングすれば、クラウド内およびエッジ内の任意の場所で実行できます。

ノートブックベースのワークフロー

SageMaker Studio ノートブックを非インタラクティブでスケジュールされたジョブとして実行します。

前処理

データの分析と前処理、特徴エンジニアリングへの取り組み、モデルの評価を行います。

SageMaker プロジェクト

SageMaker プロジェクトを使用して CI/CD で ML ソリューションを作成します end-to-end。

強化学習

エージェントがその行動の結果として受け取る長期的な報酬を最大化します。

SageMaker ロールマネージャー

管理者は、カスタムおよび事前設定されたペルソナベースのIAMロールを使用して、一般的な ML アクティビティの最小権限のアクセス許可を定義できます。

SageMaker サーバーレスエンドポイント

ML モデルをホストするためのサーバーレスエンドポイントオプション。エンドポイントトラフィックを処理するために容量を自動的にスケールします。エンドポイントでインスタンスタイプを選択したり、スケーリングポリシーを管理したりする必要がなくなります。

Studio Classic Git 拡張機能

Git リポジトリURLの を入力し、環境にコピーし、変更をプッシュし、コミット履歴を表示する Git 拡張機能。

SageMaker Studio ノートブック

AWS IAM Identity Center (IAM Identity Center) 統合、起動時間の短縮、ワンクリック共有を含む次世代の SageMaker ノートブック。

SageMaker Studio Notebooks と Amazon EMR

SageMaker Studio から直接、単一アカウントおよびクロスアカウント設定で Amazon EMRクラスターを簡単に検出、接続、作成、終了、管理できます。

SageMaker Training Compiler

によって管理されるスケーラブルGPUインスタンスで深層学習モデルをより迅速にトレーニングします SageMaker。