Forecast のデータセットのガイドライン - Amazon Forecast

Amazon Forecast は、新規顧客では利用できなくなりました。Amazon Forecast の既存のお客様は、通常どおりサービスを引き続き使用できます。詳細はこちら

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Forecast のデータセットのガイドライン

Amazon Forecast がデータセットのインポートに失敗する場合、またはデータセットが期待どおりに機能しない場合は、次のガイドラインを参照してください。

タイムスタンプ形式

年 (Y)、月 (M)、週 (W)、および日 (D) の収集頻度の場合、Forecast は yyyy-MM-dd タイムスタンプ形式 (例: 2019-08-21) と、オプションで HH:mm:ss 形式 (例: 2019-08-21 15:00:00) をサポートします。

時 (H) と分 (M) の頻度では、Forecast は yyyy-MM-dd HH:mm:ss 形式 (例: 2019-08-21 15:00:00) のみをサポートしています。

ガイドライン: データセットの収集頻度のタイムスタンプ形式をサポートされている形式に変更します。

Amazon S3 ファイルまたはバケット

データセットをインポートするときは、データを含む Amazon Simple Storage Service (Amazon S3) バケットの CSVまたは Parquet ファイルへのパス、またはデータを含む S3 バケットの名前を指定できます。CSV または Parquet ファイルを指定すると、Forecast はそのファイルのみをインポートします。S3 バケットを指定すると、Forecast はバケット内のすべての CSVまたは Parquet ファイルを最大 10,000 ファイルまでインポートします。バケット名を指定して複数のファイルをインポートする場合、すべての CSVまたは Parquet ファイルは指定されたスキーマに準拠する必要があります。

ガイドライン: 次の構文を使用して、特定のファイルまたは S3 バケットを指定します。

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

Parquet ファイルには、.parquet、.parq、.pqt という拡張子を付けることもできますが、拡張子をまったく付けなくてもかまいません。

データセットの完全更新

最初のデータセットのインポートは常に完全インポートで、それ以降のインポートは完全更新でも増分更新でもかまいません。Forecast を使用してインポートモードAPIを指定する必要があります。

完全更新では、既存のデータはすべて新しくインポートされたデータに置き換えられます。データセットの完全インポートジョブは集計されないため、最新のデータセットインポートは、予測子のトレーニング時や予想の生成時に使用されるものです。

ガイドライン: データセットを段階的に更新して、新しいデータを既存のデータに追加します。そうしない場合、最新のデータセットインポートに、前回のインポート以降に収集された新しいデータだけでなく、モデル化するすべてのデータが含まれていることを確認します。

データセットの増分更新

タイムスタンプ、データ形式、位置情報などのフィールドは、現在アクティブなデータセットから読み取られます。この情報をデータセットの増分インポートに含める必要はありません。これらが含まれる場合は、元々提供されていた値と一致する必要があります。

ガイドライン: これらの値を変更する場合は、データセット全体をインポートしてください。

属性の順序

スキーマ定義で指定された属性の順序は、インポートする CSVまたは Parquet ファイルの列の順序と一致する必要があります。たとえば、最初の属性として timestamp を定義した場合、timestamp は入力ファイルの最初の列でもある必要があります。

ガイドライン: 入力ファイルの列が、作成したスキーマ属性と同じ順序であることを確認してください。

Weather Index

Weather Index を適用するには、ターゲットの時系列および関連する時系列データセットに geolocation 属性を含める必要があります。また、ターゲットの時系列タイムスタンプのタイムゾーンを指定する必要があります。

ガイドライン: データセットに geolocation 属性が含まれており、タイムスタンプにタイムゾーンが割り当てられているようにしてください。詳細については、Weather Index の「Conditions and Restrictions」(条件と制約事項) を参照してください。

データセットヘッダー

入力内のデータセットヘッダーは、検証エラーを引き起こすCSV可能性があります。CSV ファイルのヘッダーは省略することをお勧めします。

ガイドライン: データセットヘッダーを削除し、インポートを再試行します。

Parquet ファイルにはデータセットヘッダーが必要です。

データセットのステータス

CreateDatasetImportJob オペレーションでトレーニングデータをインポートするには、データセットの StatusACTIVE である必要があります。

ガイドライン: DescribeDataset オペレーションを使用して、データセットのステータスを取得します。データセットの作成または更新に失敗した場合は、データセットファイルの形式を確認して、もう一度作成してください。

デフォルトファイル形式

デフォルトのファイル形式は ですCSV。

ファイル形式と区切り記号

Forecast は、カンマ区切り値 (CSV) ファイル形式と Parquet 形式のみをサポートします。タブ、スペース、コロン、またはその他の文字を使用して値を区切ることはできません。

ガイドライン: データセットをCSV形式 (区切り文字としてカンマのみを使用) または Parquet 形式に変換し、ファイルのインポートを再試行してください。

ファイル名

ファイル名には、アルファベットを 1 文字以上含める必要があります。名前が数値のみのファイルはインポートできません。

ガイドライン: 少なくともアルファベットが 1 文字以上含まれるように入力データファイルの名前を変更し、ファイルのインポートを再試行します。

パーティショニングされた Parquet データ

Forecast は、パーティショニングされた Parquet ファイルを読み取りません。

What-If 分析のデータセット要件

What-If 分析にはCSVデータセットが必要です。CreateWhatIfAnalysis アクションの TimeSeriesSelector オペレーションと の TimeSeriesReplacementDataSource オペレーションは Parquet ファイルを受け入れCreateWhatIfForecastません。