翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
注記
Amazon QuickSight で ML 搭載の機能を使用する分析やダッシュボードを作成するのに 機械学習 (ML) の技術的な経験は必要ありません。
Amazon QuickSight Enterprise Edition のデータは、Amazon SageMaker AI 機械学習モデルで拡張できます。Amazon QuickSight でサポートされている任意のデータソースからインポートされ、SPICE に保存されているデータに対して推論を実行できます。サポートされているデータソースの詳細な一覧については、サポートされているデータソースを参照してください。
SageMaker AI モデルで Amazon QuickSight を使用すると、データ移動の管理やコードの記述に費やす時間を節約できます。この結果は、モデルの評価や、(結果に満足している場合は) 意思決定者との共有に有用です。モデルが作成された直後に開始できます。これにより、データサイエンティストが事前に構築したモデルが表れ、データサイエンスをデータセットに適用できるようになります。その後、予測ダッシュボードでこれらのインサイトを共有できます。Amazon QuickSight のサーバーレスアプローチでは、プロセスがシームレスに拡張されるため、推論やクエリの容量について心配する必要はありません。
Amazon QuickSight は、回帰アルゴリズムと分類アルゴリズムを使用する SageMaker AI モデルをサポートしています。この機能を適用すると、ほぼすべてのビジネスユースケースに関する予測を立てることができます。例えば、顧客の解約、従業員の離職、セールスリードの採点、信用リスクの評価などに予測を利用できます。Amazon QuickSight を使用して予測を提供するには、入力と出力の両方の SageMaker AI モデルデータが表形式である必要があります。マルチクラス分類またはマルチラベル分類のユースケースでは、各出力列に単一の値を含める必要があります。Amazon QuickSight では、単一の列内に複数の値を含めることをサポートしていません。
トピック
SageMaker AI 統合の仕組み
一般に、プロセスは次のように動作します。
-
Amazon QuickSight 管理者は、Amazon QuickSight が SageMaker AI にアクセスするためのアクセス許可を追加します。これを行うには、[Manage QuickSight (QuickSight の管理)] ページから、[Security & Permissions (セキュリティとアクセス許可)] 設定を開きます。 AWS サービスへの QuickSight アクセスに移動し、SageMaker AI を追加します。
これらのアクセス許可を追加すると、Amazon QuickSight が AWS Identity and Access Management (IAM) ロールに追加され、 AWS アカウント内のすべての SageMaker AI モデルを一覧表示するためのアクセスが提供されます。また、 というプレフィックスが付いた名前の SageMaker AI ジョブを実行するアクセス許可も提供します
quicksight-auto-generated-
。 -
推論パイプラインを持つ SageMaker AI モデルに接続することをお勧めします。これは、データの前処理が自動的に実行されるためです。詳細については、「SageMaker AI デベロッパーガイド」の「推論パイプラインをデプロイする」を参照してください。 SageMaker
-
一緒に使用するデータと事前トレーニング済みモデルを特定したら、モデルの所有者がスキーマファイルを作成し、提供します。この JSON ファイルは SageMaker AI との契約です。モデルが想定するフィールド、データタイプ、列の順序、出力、設定に関するメタデータを提供します。オプションの設定コンポーネントは、ジョブに使用するコンピュートインスタンスのインスタンスサイズと数を提供します。
モデルを構築したデータサイエンティストは、次に説明する’形式でこのスキーマファイルを作成します。モデルのコンシューマは、モデルの所有者からスキーマファイルを取得します。
-
Amazon QuickSight で、まず最初に、予測を行うデータを含む新しいデータセットを作成します。ファイルをアップロードする場合は、アップロード設定画面に SageMaker AI モデルを追加できます。それ以外の場合は、データ準備ページでモデルを追加します。
先に進む前に、データセットとモデルの間のマッピングを確認します。
-
データがデータセットにインポートされると、出力フィールドには SageMaker AI から返されたデータが含まれます。これらのフィールドは、「使用上のガイドライン」で説明されているガイドライン内で、他のフィールドと同じように使用できます。
SageMaker AI 統合を実行すると、Amazon QuickSight は SageMaker AI にリクエストを渡し、推論パイプラインを使用してバッチ変換ジョブを実行します。Amazon QuickSight は、 AWS アカウントに必要なインスタンスのプロビジョニングとデプロイを開始します。処理が完了すると、これらのインスタンスはシャットダウンされ、終了します。コンピューティング性能は、モデルの処理時にのみコストが発生します。
これらを簡単に識別できるように、Amazon QuickSight はすべての SageMaker AI ジョブにプレフィックス を付けます
quicksight-auto-generated-
。 -
推論の出力は SPICE に保存され、データセットに追加されます。推論が完了するとすぐに、データセットを使用して、予測データを使用して視覚化やダッシュボードを作成できます。
-
データ更新は、データセットを保存するたびに開始されます。SPICE データセットを更新してデータ更新プロセスを手動で開始する、または定期的に更新プロセスが実行されるようにスケジュールすることができます。データ更新のたびに、システムは SageMaker AI バッチ変換を自動的に呼び出して、出力フィールドを新しいデータで更新します。
Amazon QuickSight の SPICE 取り込み API オペレーションを使用して、データ更新プロセスを制御できます。これらの API オペレーションの使用に関する詳細については、Amazon QuickSight API リファレンスを参照してください。
発生したコスト(統合自体による追加コストはありません)
この機能を使用すること自体に追加料金はかかりません。費用には以下が含まれます。
-
SageMaker AI によるモデルデプロイのコスト。モデルの実行時にのみ発生します。データセットの作成もしくは編集後、またはデータの更新後にデータセットを保存すると、データの取り込みが開始されます。このプロセスには、データセットに推定フィールドがある場合の SageMaker AI の呼び出しが含まれます。コストは、QuickSight サブスクリプションと同じ AWS アカウントで発生します。
-
QuickSight サブスクリプションのコストは次のとおりです。
-
QuickSight (SPICE) のインメモリ計算エンジンにデータを保存するためのコスト。SPICE に新しいデータを追加するときは、それに対応するために十分な SPICE 容量を購入する必要が生じる場合があります。
-
データセットを構築する作成者または管理者のための QuickSight サブスクリプション。
-
表示者(閲覧者)がインタラクティブなダッシュボードにアクセスするためのセッションごとの料金。
-
使用上のガイドライン
Amazon QuickSight では、この Enterprise Edition 機能には次の使用上のガイドラインが適用されます。
-
モデルの処理は SPICE で行われます。そのため、これは SPICE に保存されているデータセットにのみ適用できます。現在このプロセスでは、データセットあたり最大 5 億行がサポートされています。
-
データセットを ML モデルで拡張できるのは、QuickSight の管理者または作成者のみです。閲覧者は、ダッシュボードの一部である場合にのみ結果を表示できます。
-
各データセットは、1 つの ML モデルのみを処理できます。
-
出力フィールドを使用して新しいフィールドを計算することはできません。
-
データセットは、モデルと統合されているフィールドでフィルタリングすることはできません。つまり、データセットフィールドが現在、機械学習モデルにマッピングされている場合、そのフィールドでフィルタリングすることはできません。
SageMaker AI では、Amazon QuickSight で使用する事前トレーニング済みモデルに次の使用ガイドラインが適用されます。
-
モデルを作成するときに、適切な IAM ロールの Amazon リソースネーム (ARN) に関連付けます。SageMaker AI モデルの IAM ロールは、Amazon QuickSight が使用する Amazon S3 バケットにアクセスできる必要があります。
-
モデルが入力と出力の両方で .csv ファイルをサポートしていることを確認します。データが表形式であることを確認します。
-
入力フィールドと出力フィールドのリストを含む、モデルに関するメタデータを含むスキーマファイルを指定します。現在、このスキーマファイルは手動で作成する必要があります。
-
推論を完了するのにかかる時間を考慮してください。これはいくつかの要因に依存します。これには、モデルの複雑さ、データ量、定義されたコンピューティング性能が含まれます。推論の完了には数分から数時間かかることがあります。Amazon QuickSight では、すべてのデータ取り込みジョブと推定ジョブが最長 10 時間に制限されます。推論の実行にかかる時間を短縮するには、インスタンスのサイズまたはインスタンスの数を増やすことを検討してください。
-
現在、SageMaker AI との統合にはバッチ変換のみを使用でき、リアルタイムデータは使用できません。SageMaker AI エンドポイントを使用することはできません。
スキーマファイルの定義
Amazon QuickSight データで SageMaker AI モデルを使用する前に、Amazon QuickSight がモデルを処理するために必要なメタデータを含む JSON スキーマファイルを作成します。Amazon QuickSight の作成者または管理者は、データセットの設定時にスキーマファイルをアップロードします。
スキーマフィールドは次のように定義されます。次の説明で指定されていない限り、すべてのフィールドは必須です。属性では、大文字と小文字が区別されます。
- inputContentType
-
この SageMaker AI モデルが入力データに期待するコンテンツタイプ。これに対してサポートされている値は
"text/csv"
のみです。QuickSight には、入力ファイルに追加するヘッダー名は含まれません。 - outputContentType
-
使用する SageMaker AI モデルによって生成される出力のコンテンツタイプ。これに対してサポートされている値は
"text/csv"
のみです。 - input
-
モデルが入力データで期待する機能のリスト。QuickSight では、入力データがまったく同じ順序で生成されます。このリストには次の属性が含まれています。
-
名前 – 列の名前 可能な場合は、QuickSight データセットの対応する列の名前と同じ名前にします。この属性は最大 100 文字に制限されています。
-
型 – この列のデータ型 この属性は、
"INTEGER"
、"STRING"
、および"DECIMAL"
の値をとります。 -
nullable – (オプション) フィールドの NULL 値。デフォルト値は
true
です。nullable
を に設定するとfalse
、QuickSight は SageMaker AI を呼び出す前に、この値を含まない行を削除します。これにより、SageMaker AI が必要なデータ不足で失敗するのを防ぐことができます。
-
- output
-
SageMaker AI モデルが生成する出力列のリスト。QuickSight では、これらのフィールドはまったく同じ順序であると想定しています。このリストには次の属性が含まれています。
-
名前 — この名前は、QuickSight で作成された、対応する新しい列のデフォルト名になります。QuickSight で、ここで指定した名前を上書きできます。この属性は最大 100 文字に制限されています。
-
型 – この列のデータ型 この属性は、
"INTEGER"
、"STRING"
、および"DECIMAL"
の値をとります。
-
- instanceTypes
-
SageMaker AI が変換ジョブを実行するためにプロビジョニングできる ML インスタンスタイプのリスト。このリストは QuickSight ユーザーに提供され、ユーザーはその中から選択できます。このリストは、SageMaker AI でサポートされているタイプに制限されています。サポートされているタイプの詳細については、「SageMaker AI デベロッパーガイド」のTransformResources」を参照してください。 SageMaker
- defaultInstanceType
-
(オプション) QuickSight の SageMaker AI ウィザードでデフォルトオプションとして表示されるインスタンスタイプ。このインスタンスタイプを
instanceTypes
に含めます。 - instanceCount
-
(オプション) インスタンス数は、SageMaker AI が変換ジョブを実行するためにプロビジョニングする選択したインスタンスの数を定義します。値は正の整数である必要があります。
- 説明
-
このフィールドは、SageMaker AI モデルを所有するユーザーが QuickSight でこのモデルを使用しているユーザーと通信するための場所を提供します。このフィールドを使用して、このモデルを正常に使用するためのヒントを提供します。たとえばこのフィールドには、データセットのサイズに基づいて、
instanceTypes
のリストから選択する有効なインスタンスタイプの選択に関する情報を含めることができます。このフィールドは最大 1,000 文字に制限されています。 - version
-
スキーマのバージョン("
1.0"
など)。
次の例は、スキーマファイル内の JSON の構造を示しています。
{
"inputContentType": "CSV",
"outputContentType": "CSV",
"input": [
{
"name": "buying",
"type": "STRING"
},
{
"name": "maint",
"type": "STRING"
},
{
"name": "doors",
"type": "INTEGER"
},
{
"name": "persons",
"type": "INTEGER"
},
{
"name": "lug_boot",
"type": "STRING"
},
{
"name": "safety",
"type": "STRING"
}
],
"output": [
{
"name": "Acceptability",
"type": "STRING"
}
],
"description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB",
"version": "1.0",
"instanceCount": 1,
"instanceTypes": [
"ml.m4.xlarge",
"ml.m4.4xlarge"
],
"defaultInstanceType": "ml.m4.xlarge"
}
スキーマファイルの構造は、SageMaker AI が提供する例で使用されるモデルの種類に関連しています。
QuickSight データセットへの SageMaker AI モデルの追加
次の手順を使用して、事前トレーニング済みの SageMaker AI モデルをデータセットに追加し、分析とダッシュボードで予測データを使用できるようにします。
開始する前に、次の項目を使用可能にしておきます。
-
データセットの構築に使用するデータ。
-
データセットの拡張に使用する SageMaker AI モデルの名前。
-
モデルのスキーマ。このスキーマには、フィールド名のマッピングとデータ型が含まれます。インスタンスタイプと使用するインスタンス数の推奨設定も含まれている場合に便利です。
SageMaker AI で Amazon QuickSight データセットを補強するには
-
スタートページから [Datasets] (データセット) を選択し、続いて [New data set] (新しいデータセット) を選択します。
既存のデータセットを編集することもできます。
-
データ準備画面で [Augment with SageMaker] (SageMaker による拡張) を選択します。
-
[Select your model (モデルを選択)] で、次の設定を選択します。
-
モデル – フィールドを推測するために使用する SageMaker AI モデルを選択します。
-
名前 – モデルにわかりやすい名前を付けます。
-
スキーマ – モデル用に提供された JSON スキーマファイルをアップロードします。
-
アドバンスト設定 – QuickSight では、データセットに基づいて選択したデフォルトが推奨されます。特定のランタイム設定を使用して、ジョブの速度とコストのバランスをとることができます。これを行うには、インスタンスタイプに SageMaker AI ML インスタンスタイプを入力し、カウントにインスタンス数を入力します。
[次へ] を選択して続行します。
-
-
[Review inputs (レビュー入力)] で、データセットにマッピングされているフィールドを確認します。QuickSight は、スキーマ内のフィールドをデータセット内のフィールドに自動的にマップしようとします。マッピングを調整する必要がある場合は、ここで変更できます。
[次へ] を選択して続行します。
-
[Review outputs] (レビュー出力) で、データセットに追加されたフィールドを表示します。
[Save and prepare data (保存してデータを準備する)] を選択して、選択内容を確認します。
-
データを更新するには、詳細を表示するデータセットを選択します。次に、[Refresh Now (今すぐ更新)] を選択してデータを手動で更新するか [Schedule refresh (更新をスケジュール)] を選択して定期的な更新間隔を設定します。データ更新のたびに、システムは SageMaker AI バッチ変換ジョブを自動的に実行して、出力フィールドを新しいデータで更新します。