翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデルの構築
以下のセクションでは、カスタムモデルの主なタイプごとにモデルを構築する方法を示します。
-
数値予測モデル、2 カテゴリ予測モデル、または 3+ カテゴリ予測モデルを作成するには、「数値予測カスタムモデルまたはカテゴリ予測カスタムモデルを構築する」を参照してください。
-
単一ラベル画像予測モデルを構築するには、「画像予測カスタムモデルを構築する」を参照してください。
-
マルチカテゴリテキスト予測モデルを構築するには、「テキスト予測カスタムモデルを構築する」を参照してください。
-
時系列予測モデルを構築するには、「時系列予測モデルを構築する」を参照してください。
注記
構築後の分析中に、ml.m5.2xlarge
インスタンスのクォータを増やすように指示するエラーが発生した場合は、「Request a Quota Increase」を参照してください。
数値予測カスタムモデルまたはカテゴリ予測カスタムモデルを構築する
数値予測モデルとカテゴリ予測モデルは、[クイックビルド] と [標準ビルド] の両方をサポートします。
数値予測モデルまたはカテゴリ予測モデルを構築するには、次の手順に従います。
-
SageMaker Canvas アプリケーションを開きます。
-
左側のナビゲーションペインで [自分のモデル] を選択します。
-
[新規モデル] を選択します。
-
[新規モデルの作成] ダイアログボックスで、次の操作を行います。
-
[モデル名] フィールドに名前を入力します。
-
[予測分析] の問題タイプを選択します。
-
[Create] (作成) を選択します。
-
-
[データセットを選択] で、データセットのリストからデータセットを選択します。データをまだインポートしていない場合は、[インポート] を選択して、データのインポートワークフローを実行します。
-
モデルを構築する準備ができたら、[データセットを選択] を選択します。
-
[ビルド] タブの [ターゲット] 列のドロップダウンリストで、予測するモデルのターゲットを選択します。
-
[モデルタイプ] では、Canvas が問題タイプを自動的に検出します。タイプを変更したり、高度なモデルを設定したりする場合は、[モデルの設定] を選択します。
[モデルの設定] ダイアログボックスが開いたら、次の操作を行います。
[モデルタイプ] で、構築するモデルタイプを選択します。
-
モデルタイプを選択した後には、追加の [詳細設定] があります。高度な各設定の詳細については、「高度なモデル構築設定」を参照してください。詳細を設定するには、次の操作を行います。
(オプション) [目標メトリクス] ドロップダウンメニューで、モデルの構築中に Canvas で最適化するメトリクスを選択します。メトリクスを選択しない場合、Canvas はデフォルトでメトリクスを選択します。利用可能なメトリクスの説明については、「メトリクスのリファレンス」を参照してください。
[トレーニング方法] では、[自動]、[アンサンブル]、または [ハイパーパラメータの最適化 (HPO) モード] を選択します。
[アルゴリズム] では、モデル候補を構築するために含めるアルゴリズムを選択します。
[データ分割] では、[トレーニングセット] と [検証セット] の間でデータを分割する方法を割合で指定します。トレーニングセットはモデルの構築に使用され、検証セットはモデル候補の精度のテストに使用されます。
-
[最大候補数とランタイム] については、以下を実行します。
[最大候補数] の値、つまり Canvas が生成できるモデル候補の最大数を設定します。[最大候補数] は、HPO モードでのみ使用できることに注意してください。
[最大ジョブランタイム] の時間と分の値、つまり Canvas がモデルの構築に費やすことができる最大時間を設定します。最大時間が経過すると、Canvas は構築を停止し、最適なモデル候補を選択します。
詳細を設定したら、[保存] を選択します。
-
データ内の列を選択または選択解除して、構築に含めたり削除したりします。
注記
構築後にモデルを使用してバッチ予測を行うと、Canvas は削除された列を予測結果に追加します。ただし、Canvas はドロップされた列を時系列モデルのバッチ予測に追加しません。
-
(オプション) Canvas に用意されている視覚化ツールと分析ツールを使用してデータを視覚化し、モデルに含める機能を決定します。詳細については、「Explore and analyze your data」を参照してください。
-
(オプション) データ変換を使用して、モデル構築用のデータの整理、変換、準備を行います。詳細については、「Prepare your data with advanced transformations」を参照してください。[モデルレシピ] を選択して [モデルレシピ] サイドパネルを開くと、変換の表示や削除を行えます。
-
(オプション) モデル精度のプレビュー、データセットの検証、Canvas がデータセットから取得するランダムサンプルのサイズの変更などの追加機能については、「モデルをプレビューする」を参照してください。
-
データを確認してデータセットに変更を加えたら、[クイックビルド] または [標準ビルド] を選択してモデルの構築を開始します。次のスクリーンショットは、[ビルド] ページの [クイックビルド] オプションおよび [標準ビルド] オプションを示しています。
モデルの構築が始まったら、ページを閉じます。[自分のモデル] ページで、モデルが [準備完了] と表示されたら、分析と予測の準備は完了です。
画像予測カスタムモデルを構築する
単一ラベル画像予測モデルは、[クイックビルド] と [標準ビルド] の両方をサポートします。
単一ラベル画像予測モデルを構築するには、次の手順に従います。
-
SageMaker Canvas アプリケーションを開きます。
-
左側のナビゲーションペインで [自分のモデル] を選択します。
-
[新規モデル] を選択します。
-
[新規モデルの作成] ダイアログボックスで、次の操作を行います。
-
[モデル名] フィールドに名前を入力します。
-
[画像分析] 問題タイプを選択します。
-
[Create] (作成) を選択します。
-
-
[データセットを選択] で、データセットのリストからデータセットを選択します。データをまだインポートしていない場合は、[インポート] を選択して、データのインポートワークフローを実行します。
-
モデルを構築する準備ができたら、[データセットを選択] を選択します。
-
[ビルド] タブには、データセット内の画像の [ラベル分布] が表示されます。[モデルタイプ] は [単一ラベル画像予測] に設定されています。
-
このページでは、画像をプレビューしたり、データセットを編集したりできます。ラベルの付いていない画像がある場合は、[データセットの編集] を選択して ラベルがない画像にはラベルを割り当てる。画像データセットを編集する際は、ラベル名の変更やデータセットへの画像の追加など、他のタスクも実行できます。
-
データを確認してデータセットに変更を加えたら、[クイックビルド] または [標準ビルド] を選択してモデルの構築を開始します。次のスクリーンショットは、ビルドの準備ができている画像予測モデルの [ビルド] ページを示しています。
モデルの構築が始まったら、ページを閉じます。[自分のモデル] ページで、モデルが [準備完了] と表示されたら、分析と予測の準備は完了です。
テキスト予測カスタムモデルを構築する
マルチカテゴリテキスト予測モデルは、[クイックビルド] と [標準ビルド] の両方をサポートします。
テキスト予測モデルを構築するには、次の手順に従います。
-
SageMaker Canvas アプリケーションを開きます。
-
左側のナビゲーションペインで [自分のモデル] を選択します。
-
[新規モデル] を選択します。
-
[新規モデルの作成] ダイアログボックスで、次の操作を行います。
-
[モデル名] フィールドに名前を入力します。
-
[テキスト分析] 問題タイプを選択します。
-
[Create] (作成) を選択します。
-
-
[データセットを選択] で、データセットのリストからデータセットを選択します。データをまだインポートしていない場合は、[インポート] を選択して、データのインポートワークフローを実行します。
-
モデルを構築する準備ができたら、[データセットを選択] を選択します。
-
[ビルド] タブの [ターゲット] 列のドロップダウンリストで、予測するモデルのターゲットを選択します。ターゲット列はバイナリデータ型またはカテゴリデータ型でなければならず、ターゲット列の一意のラベルごとに少なくとも 25 エントリ (データ行) が必要です。
-
[モデルタイプ] で、モデルタイプが自動的に [マルチカテゴリテキスト予測] に設定されていることを確認します。
-
トレーニング列で、テキストデータのソース列を選択します。この列は、分析するテキストを含む列である必要があります。
-
[クイックビルド] または [標準ビルド] を選択して、モデルの構築を開始します。次のスクリーンショットは、ビルドの準備ができているテキスト予測モデルの [ビルド] ページを示しています。
モデルの構築が始まったら、ページを閉じます。[自分のモデル] ページで、モデルが [準備完了] と表示されたら、分析と予測の準備は完了です。
時系列予測モデルを構築する
時系列予測モデルは、クイックビルドと標準ビルドの両方をサポートしています。
時系列予測モデルを構築するには、次の手順に従います。
-
SageMaker Canvas アプリケーションを開きます。
-
左側のナビゲーションペインで [自分のモデル] を選択します。
-
[新規モデル] を選択します。
-
[新規モデルの作成] ダイアログボックスで、次の操作を行います。
-
[モデル名] フィールドに名前を入力します。
-
[時系列予測] の問題タイプを選択します。
-
[Create] (作成) を選択します。
-
-
[データセットを選択] で、データセットのリストからデータセットを選択します。データをまだインポートしていない場合は、[インポート] を選択して、データのインポートワークフローを実行します。
-
モデルを構築する準備ができたら、[データセットを選択] を選択します。
-
[ビルド] タブの [ターゲット] 列のドロップダウンリストで、予測するモデルのターゲットを選択します。
[モデルタイプ] セクションで、[モデルの設定] を選択します。
-
[モデルの設定] ボックスが開きます。[時系列設定] セクションでは、次のフィールドに入力します。
[項目 ID 列] で、各行を一意に識別するデータセット内の列を選択します。
(オプション) [グループ列] では、予測値のグループ化に使用する 1 つ以上のカテゴリ列を選択します。
[タイムスタンプ列] では、タイムスタンプ付き列 (日時形式) を選択します。承認されている日時形式の詳細については、「Amazon SageMaker Canvas の時系列予測」を参照してください。
[予測の長さ] フィールドに、値を予測する期間を入力します。Canvas では、データ内の時間単位を自動的に検出します。
(オプション) [祝祭日スケジュールを使用] トグルをオンにして、さまざまな国の祝祭日スケジュールを選択し、祝祭日データを使用して予測をより正確にします。
-
[モデルの設定] ボックスの [詳細] セクションには、追加の設定があります。高度な各設定の詳細については、「高度なモデル構築設定」を参照してください。[詳細] を設定するには、次の操作を行います。
[目標メトリクス] ドロップダウンメニューで、モデルの構築中に Canvas で最適化するメトリクスを選択します。メトリクスを選択しない場合、Canvas はデフォルトでメトリクスを選択します。利用可能なメトリクスの説明については、「メトリクスのリファレンス」を参照してください。
-
標準ビルドを実行している場合は、[アルゴリズム] セクションが表示されます。このセクションでは、モデルの構築に使用する時系列予測アルゴリズムを選択します。使用可能なアルゴリズムのサブセットを選択できます。あるいは、どれを試したらいいかわからない場合は、すべてを選択できます。
標準ビルドを実行すると、すべてのアルゴリズムを組み合わせて予測精度を最適化するアンサンブルモデルが構築されます。
注記
クイックビルドを実行している場合は、単一のツリーベースの学習アルゴリズムを使用してモデルがトレーニングされるため、アルゴリズムを選択する必要はありません。
[予測分位数] には、最大 5 つのカンマ区切り分位数値を入力して、予測の上限と下限を指定します。
[詳細] を設定したら、[保存] を選択します。
-
データ内の列を選択または選択解除して、構築に含めたり削除したりします。
注記
構築後にモデルを使用してバッチ予測を行うと、Canvas は削除された列を予測結果に追加します。ただし、Canvas はドロップされた列を時系列モデルのバッチ予測に追加しません。
-
(オプション) Canvas に用意されている視覚化ツールと分析ツールを使用してデータを視覚化し、モデルに含める機能を決定します。詳細については、「Explore and analyze your data」を参照してください。
-
(オプション) データ変換を使用して、モデル構築用のデータの整理、変換、準備を行います。詳細については、「Prepare your data with advanced transformations」を参照してください。[モデルレシピ] を選択して [モデルレシピ] サイドパネルを開くと、変換の表示や削除を行えます。
-
(オプション) モデル精度のプレビュー、データセットの検証、Canvas がデータセットから取得するランダムサンプルのサイズの変更などの追加機能については、「モデルをプレビューする」を参照してください。
-
データを確認してデータセットに変更を加えたら、[クイックビルド] または [標準ビルド] を選択してモデルの構築を開始します。
モデルの構築が始まったら、ページを閉じます。[自分のモデル] ページで、モデルが [準備完了] と表示されたら、分析と予測の準備は完了です。