

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon SageMaker の組み込みアルゴリズムと事前トレーニング済みモデル
<a name="algos"></a>

Amazon SageMaker は、データサイエンティストや機械学習の実践者が機械学習モデルのトレーニングとデプロイを迅速に開始できるようにする一連の組み込みアルゴリズム、トレーニング済みモデルおよび構築済みソリューションテンプレートを提供しています。SageMaker を初めて使う方にとって、特定のユースケースに適したアルゴリズムを選択するのは難しい作業です。次の表に、サンプル問題またはユースケースから開始し、その問題タイプに有効な SageMaker によって提供される適切な組み込みアルゴリズムを見つける方法を示すクイックチートシートを示します。学習パラダイム (教師ありと教師なし) と重要なデータドメイン (テキストとイメージ) によって構成される追加のガイダンスについては、表の次のセクションを参照してください。

表: 組み込みアルゴリズムへのユースケースのマッピング

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/algos.html)

SageMaker AI が提供するすべての組み込みアルゴリズムに共通する以下の項目の重要な情報については、「[組み込みアルゴリズムのパラメータ](common-info-all-im-models.md)」を参照してください。
+ Docker レジストリパス
+ データ形式
+ 推奨される Amazon EC2 インスタンスタイプ
+ CloudWatch ログ

次のセクションでは、属している教師あり学習パラダイムと教師なし学習パラダイム別にグループ化された Amazon SageMaker AI 組み込みアルゴリズムに関する追加のガイダンスを示します。これらの学習パラダイムとそれに関連する問題タイプの詳細については、「[アルゴリズムのタイプ](algorithms-choose.md)」を参照してください。また、テキスト解析と画像処理という 2 つの重要な機械学習ドメインに対処するために使用できる SageMaker AI 組み込みアルゴリズムに関するセクションも用意されています。
+ [事前トレーニング済みモデルとソリューションテンプレート](#algorithms-built-in-jumpstart)
+ [教師あり学習](#algorithms-built-in-supervised-learning)
+ [教師なし学習](#algorithms-built-in-unsupervised-learning)
+ [テキスト分析](#algorithms-built-in-text-analysis)
+ [画像処理](#algorithms-built-in-image-processing)

## 事前トレーニング済みモデルとソリューションテンプレート
<a name="algorithms-built-in-jumpstart"></a>

Amazon SageMaker JumpStart は、トレーニング済みのさまざまなモデル、構築済みのソリューションテンプレート、一般的な問題タイプの例を提供します。これらは SageMaker SDK と Studio Classic を使用します。Amazon SageMaker JumpStart が提供するモデル、ソリューション、サンプルノートブックの詳細については、「」を参照してください[SageMaker JumpStart の事前トレーニング済みモデル](studio-jumpstart.md)。

## 教師あり学習
<a name="algorithms-built-in-supervised-learning"></a>

Amazon SageMaker AI には、分類問題または回帰問題に使用できる組み込みの汎用アルゴリズムがいくつか用意されています。
+ [AutoGluon-Tabular](autogluon-tabular.md) — モデルをアンサンブルして複数のレイヤーに積み重ねることで成功するオープンソースの AutoML フレームワーク。
+ [CatBoost](catboost.md) - 順序付けされたブースティングとカテゴリ別機能を処理するための革新的なアルゴリズムを導入する勾配ブーストツリーアルゴリズムの実装。
+ [因数分解機アルゴリズム](fact-machines.md) - 高次元スパースデータセット内の特徴間の相互作用を経済的にキャプチャするように設計された線形モデルの拡張。
+ [K 最近傍 (k-NN) アルゴリズム](k-nearest-neighbors.md) — K 個の最も近いラベル付きポイントを使用して値を割り当てるノンパラメトリック手法。分類の場合は、新しいデータポイントに対するラベルとなり、リグレッションの場合は、K 個の最も近いポイントの平均から予測されるターゲット値となります。
+ [LightGBM](lightgbm.md) — 効率とスケーラビリティを向上させるための 2 つの新しい技法を追加した勾配ブーストツリーアルゴリズムの実装。2 つの新しい技法は、Gradient-based One-Side Sampling (GOSS) と Exclusive Feature Bundling (EFB) です。
+ [線形学習アルゴリズム](linear-learner.md) - 回帰の線形関数または分類の線形しきい値関数を学習します。
+ [TabTransformer](tabtransformer.md) — セルフアテンションベースの Transformers で構築された、新しい深層表形式データモデル化アーキテクチャ。
+ [Amazon SageMaker AI の XGBoost アルゴリズム](xgboost.md) - より単純で弱いモデルのセットから推定のアンサンブルを組み合わせる勾配ブーストツリーアルゴリズムの実装。

Amazon SageMaker AI には、時系列データからの特徴量エンジニアリングおよび予測時のより特殊なタスクに使用される、教師あり学習アルゴリズムもいくつか組み込まれています。
+ [Object2Vec アルゴリズム](object2vec.md) — 特徴量エンジニアリングに使用される新しい高度にカスタマイズ可能な汎用アルゴリズム。高次元オブジェクトの低次元高密度埋め込みを学習して、下流モデルのトレーニング効率を向上する特徴を生成できます。教師ありアルゴリズムではあるものの、データ内の自然なクラスタリングから関係ラベルを単純に取得できるシナリオが多数あります。トレーニングのためにラベル付きデータが必要ですが、人間による明示的な注釈なしの学習が可能です。
+ [SageMaker AI DeepAR 予測アルゴリズムを使用する](deepar.md) - 予測アルゴリズムは、再帰型ニューラルネットワーク (RNN) を使用してスカラー (1 次元) 時系列を予測する教師あり学習アルゴリズム。

## 教師なし学習
<a name="algorithms-built-in-unsupervised-learning"></a>

Amazon SageMaker AI には、多様な教師なし学習タスクに使用できる組み込みアルゴリズムがいくつか用意されています。これらのタスクには、クラスタリング、次元削減、パターン認識、異常検出などが含まれます。
+ [主成分分析法 (PCA) アルゴリズム](pca.md) - データポイントを最初のいくつかの主成分に射影することにより、データセット内の次元 (特徴の数) を縮退させます。目的は、できるだけ多くの情報やバリエーションを保持することです。数学者の場合、主成分はデータの共分散行列の固有ベクトルです。
+ [K-Means アルゴリズム](k-means.md) — データ内にある離散グループを検出します。同一グループのメンバーができるだけ類似し、かつ他のグループのメンバーとできるだけ異なるものを特定します。
+ [IP Insights](ip-insights.md) - IPv4 アドレスの使用パターンを学習します。このアルゴリズムは、IPv4 アドレスと、ユーザー ID やアカウント番号などの各種エンティティとの間の関連付けをキャプチャするように設計されています。
+ [ランダムカットフォレスト (RCF) アルゴリズム](randomcutforest.md) - その他の高度に構造化またはパターン化されたデータとは異なるデータセット内の異常なデータポイントを検出します。

## テキスト分析
<a name="algorithms-built-in-text-analysis"></a>

SageMaker AI は、テキスト文書の分析用に調整されたアルゴリズムを提供しています。対象となるのは、自然言語処理、文書の分類または要約、トピックのモデリングまたは分類、言語の文字起こしまたは翻訳で使用されるテキストです。
+ [BlazingText アルゴリズム](blazingtext.md) - 大規模なデータセットに簡単に拡張できる Word2vec とテキスト分類アルゴリズムの高度に最適化された実装。これは、多くの下流の自然言語処理 (NLP) タスクに役立ちます。
+ [Sequence to Sequence アルゴリズム](seq-2-seq.md) - 一般的にニューラル機械翻訳に使用される教師ありアルゴリズム。
+ [潜在的ディリクレ配分 (LDA) アルゴリズム](lda.md) - 一連のドキュメントのトピックを決定するのに適しているアルゴリズム。これは *教師なしアルゴリズム*です。つまり、トレーニング時に回答を含むサンプルデータを使用しないということです。
+ [ニューラルトピックモデル (NTM) アルゴリズム](ntm.md) - ニューラルネットワークアプローチを使用して一連のドキュメントのトピックを決定する別の教師なし手法。
+ [テキスト分類 - TensorFlow](text-classification-tensorflow.md) — テキスト分類用のトレーニング済みモデルを使用して転移学習をサポートする教師ありアルゴリズム。

## 画像処理
<a name="algorithms-built-in-image-processing"></a>

SageMaker AI は、イメージ分類、オブジェクト検出、コンピュータビジョンに使用される画像処理アルゴリズムも提供しています。
+ [画像分類 - MXNet](image-classification.md) - 回答を含むサンプルデータを使用します (教師ありアルゴリズムと呼ばれる)。** このアルゴリズムを使用してイメージを分類します。
+ [画像分類 - TensorFlow](image-classification-tensorflow.md) — トレーニング済 TensorFlow Hub モデルを使用して、特定のタスクに合わせて微調整します (教師ありアルゴリズムと呼ばれる)。 このアルゴリズムを使用してイメージを分類します。
+ [セマンティックセグメンテーションアルゴリズム](semantic-segmentation.md) - コンピュータビジョンアプリケーション開発のためのピクセルレベルのきめ細かいアプローチを提供します。
+ [オブジェクト検出 - MXNet](object-detection.md) — 1 つの深層ニューラルネットワークを使用して、イメージ内のオブジェクトを検出および分類します。このアルゴリズムは、入力としてイメージを取得し、イメージシーン内のオブジェクトのすべてのインスタンスを識別する、教師あり学習アルゴリズムです。
+ [オブジェクト検出 - TensorFlow](object-detection-tensorflow.md) — 画像内の境界ボックスとオブジェクトラベルを検出します。これは教師あり学習アルゴリズムで、利用可能なトレーニング済み TensorFlow モデルによる転移学習をサポートします。

**Topics**
+ [事前トレーニング済みモデルとソリューションテンプレート](#algorithms-built-in-jumpstart)
+ [教師あり学習](#algorithms-built-in-supervised-learning)
+ [教師なし学習](#algorithms-built-in-unsupervised-learning)
+ [テキスト分析](#algorithms-built-in-text-analysis)
+ [画像処理](#algorithms-built-in-image-processing)
+ [組み込みアルゴリズムのパラメータ](common-info-all-im-models.md)
+ [表形式データ用の組み込みの SageMaker AI アルゴリズム](algorithms-tabular.md)
+ [テキストデータ用の組み込み SageMaker AI アルゴリズム](algorithms-text.md)
+ [時系列データ用の組み込み SageMaker AI アルゴリズム](algorithms-time-series.md)
+ [教師なし組み込み SageMaker AI アルゴリズム](algorithms-unsupervised.md)
+ [コンピュータビジョン用の組み込み SageMaker AI アルゴリズム](algorithms-vision.md)