

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# データのインポート
<a name="canvas-importing-data"></a>

Amazon SageMaker Canvas は、表形式、画像、およびドキュメントデータのインポートをサポートしています。ローカルマシン、Amazon S3 や Amazon Redshift などの Amazon サービス、および外部データソースからデータセットをインポートできます。Amazon S3 からデータセットをインポートするときは、任意のサイズのデータセットを取り込むことができます。インポートしたデータセットを使用して、モデルの構築や他のデータセットの予測を行えます。

カスタムモデルを構築できる各ユースケースでは、それぞれ異なるタイプの入力を受け入れます。例えば、単一ラベルの画像分類モデルを構築する場合は、画像データをインポートする必要があります。さまざまなモデルタイプとそれらが受け入れるデータの詳細については、「[カスタムモデルの仕組み](canvas-build-model.md)」を参照してください。SageMaker Canvas では、次のデータ型のデータをインポートして、カスタムモデルを構築できます。
+ **表形式** (CSV、Parquet、または表)
  + カテゴリ — カテゴリデータを使用して、2 つ以上のカテゴリ予測と 3 つ以上のカテゴリ予測用のカスタムカテゴリ予測モデルを構築します。
  + 数値 — 数値データを使用して数値予測カスタムモデルを構築します。
  + テキスト — テキストデータを使用して、マルチカテゴリのテキスト予測カスタムモデルを構築します。
  + 時系列 — 時系列データを使用して時系列予測カスタムモデルを構築します。
+ **画像** (JPG または PNG) — 画像データを使用して単一ラベル画像予測カスタムモデルを構築します。
+ **ドキュメント** (PDF、JPG、PNG、TIFF) — ドキュメントデータは SageMaker Canvas の Ready-to-use モデルでのみサポートされています。ドキュメントデータの予測を行う Ready-to-use モデルの詳細については、「[Ready-to-use モデル](canvas-ready-to-use-models.md)」を参照してください。

Canvas には、以下のデータソースからデータをインポートできます。
+ コンピュータ上のローカルファイル
+ Amazon S3 バケット
+ Amazon Redshift でプロビジョニングされたクラスター (Amazon Redshift Serverless ではない)
+ AWS Glue Data Catalog Amazon Athena 経由
+ Amazon Aurora
+ Amazon Relational Database Service (Amazon RDS)
+ Salesforce Data Cloud
+ Snowflake
+ Databricks、SQLServer、MariaDB、およびその他の一般的なデータベース (JDBC コネクタを使用)
+ SAP OData などの 40 以上の外部 SaaS プラットフォーム

インポート元となるデータソースの完全なリストについては、次の表を参照してください。


| ソース | タイプ | サポートされているデータ型 | 
| --- | --- | --- | 
| ローカルファイルのアップロード | ローカル | 表形式、画像、ドキュメント | 
| Amazon Aurora | Amazon 内部 | 表形式 | 
| Amazon S3 バケット | Amazon 内部 | 表形式、画像、ドキュメント | 
| Amazon RDS | Amazon 内部 | 表形式 | 
| Amazon Redshift でプロビジョニングされたクラスター (Redshift Serverless ではない) | Amazon 内部 | 表形式 | 
| AWS Glue Data Catalog (Amazon Athena 経由) | Amazon 内部 | 表形式 | 
| [Databricks](https://www.databricks.com/) | 外部 | 表形式 | 
| Snowflake | 外部 | 表形式 | 
| [Salesforce Data Cloud](https://www.salesforce.com/products/genie/overview/) | 外部 | 表形式 | 
| SQLServer | 外部 | 表形式 | 
| MySQL | 外部 | 表形式 | 
| [PostgreSQL] | 外部 | 表形式 | 
| MariaDB | 外部 | 表形式 | 
| [Amplitude](https://docs.aws.amazon.com/appflow/latest/userguide/amplitude.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [CircleCI](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-circleci.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [DocuSign Monitor](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-docusign-monitor.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Domo](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-domo.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Datadog](https://docs.aws.amazon.com/appflow/latest/userguide/datadog.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Dynatrace](https://docs.aws.amazon.com/appflow/latest/userguide/dynatrace.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Facebook 広告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-facebook-ads.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Facebook Page Insights](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-facebook-page-insights.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Google 広告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-ads.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Google Analytics 4](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-analytics-4.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Google 検索コンソール](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-google-search-console.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [GitHub](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-github.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [GitLab](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-gitlab.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Infor Nexus](https://docs.aws.amazon.com/appflow/latest/userguide/infor-nexus.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Instagram 広告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-instagram-ads.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Jira Cloud](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-jira-cloud.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [LinkedIn 広告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-linkedin-ads.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [LinkedIn 広告](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-linkedin-ads.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Mailchimp](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-mailchimp.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Marketo](https://docs.aws.amazon.com/appflow/latest/userguide/marketo.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Microsoft Teams](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-microsoft-teams.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Mixpanel](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-mixpanel.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Okta](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-okta.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Salesforce](https://docs.aws.amazon.com/appflow/latest/userguide/salesforce.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Salesforce Marketing Cloud](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-salesforce-marketing-cloud.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Salesforce Pardot](https://docs.aws.amazon.com/appflow/latest/userguide/pardot.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [SAP OData](https://docs.aws.amazon.com/appflow/latest/userguide/sapodata.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [SendGrid](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-sendgrid.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [ServiceNow](https://docs.aws.amazon.com/appflow/latest/userguide/servicenow.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Singular](https://docs.aws.amazon.com/appflow/latest/userguide/singular.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Slack](https://docs.aws.amazon.com/appflow/latest/userguide/slack.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Stripe](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-stripe.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Trend Micro](https://docs.aws.amazon.com/appflow/latest/userguide/trend-micro.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Typeform](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-typeform.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Veeva](https://docs.aws.amazon.com/appflow/latest/userguide/veeva.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Zendesk](https://docs.aws.amazon.com/appflow/latest/userguide/zendesk.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Zendesk Chat](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-chat.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Zendesk Sell](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-sell.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Zendesk Sunshine](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zendesk-sunshine.html) | 外部 SaaS プラットフォーム | 表形式 | 
| [Zoom Meetings](https://docs.aws.amazon.com/appflow/latest/userguide/connectors-zoom.html) | 外部 SaaS プラットフォーム | 表形式 | 

データのインポート方法や、画像の最大ファイルサイズなどの入力データの要件に関する情報については、「[データセットの作成](canvas-import-dataset.md)」を参照してください。

また、Canvas をすぐに使用できるように、サンプルデータセットもいくつか用意されています。SageMaker AI が提供する実験可能なサンプルデータセットの詳細については、「[サンプルデータセットを使用する](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-sample-datasets.html)」を参照してください。

データセットを Canvas にインポートした後は、いつでもデータセットを更新できます。手動で更新することも、データセットを自動更新するスケジュールを設定することもできます。詳細については、「[データセットを更新する](canvas-update-dataset.md)」を参照してください。

各データセットの詳細については、以下のセクションを参照してください。

**表形式**

外部データソース (Snowflake データベースや SaaS プラットフォームなど) からデータをインポートするには、認証後に Canvas アプリケーションでデータソースに接続する必要があります。詳細については、「[データソースに接続する](canvas-connecting-external.md)」を参照してください。

5 GB を超えるデータセットを Amazon S3 から Canvas にインポートする場合は、Amazon Athena を使用して Amazon S3 からデータのクエリとサンプリングを行うことで、より高速なサンプリングを実現できます。

Canvas でデータセットを作成したら、Data Wrangler のデータ準備機能を使用してデータを準備および変換できます。Data Wrangler を使用すると、欠損値の処理、特徴量の変換、1 つのデータセットへの複数のデータセットの結合などができます。詳細については、「[データ準備](canvas-data-prep.md)」を参照してください。

**ヒント**  
データが表形式である限り、Amazon Redshift、Amazon Athena、Snowflake など、さまざまなソースのデータセットを結合できます。

**画像**

画像データセットを編集し、ラベルの割り当てや再割り当て、画像の追加や削除などのタスクを実行する方法については、「[画像データセットを編集する](canvas-edit-image.md)」を参照してください。