Dataset Penggantian - Amazon Forecast

Amazon Forecast tidak lagi tersedia untuk pelanggan baru. Pelanggan Amazon Forecast yang ada dapat terus menggunakan layanan seperti biasa. Pelajari lebih lanjut”

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dataset Penggantian

Dataset pengganti adalah versi modifikasi dari deret waktu terkait baseline yang hanya berisi nilai yang ingin Anda ubah dalam perkiraan bagaimana-jika. Dataset pengganti harus berisi dimensi perkiraan, pengidentifikasi item, dan stempel waktu dalam deret waktu terkait baseline, serta setidaknya 1 deret waktu yang diubah. Dataset ini digabungkan dengan deret waktu terkait dasar untuk membuat kumpulan data yang diubah yang digunakan untuk perkiraan bagaimana-jika. Dataset pengganti harus dalam format CSV.

Dataset ini tidak boleh berisi stempel waktu duplikat untuk deret waktu yang sama.

Berikut ini adalah beberapa contoh bagaimana Anda dapat menentukan deret waktu penggantian dan bagaimana spesifikasi tersebut ditafsirkan. Pertimbangkan kasus di mana Anda memperkirakan harian dan cakrawala perkiraan adalah 2022-08-01 sampai 2022-08-03. Deret waktu terkait dasar untuk semua contoh diberikan dalam tabel berikut.

item_id timestamp price stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Unchanged values

Untuk menerapkan diskon 10% pada item_1 untuk 2022-08-02 dan 2022-08-03, cukup untuk menentukan yang berikut untuk dataset pengganti:

Dataset pengganti
item_id timestamp price

item_1

2022-08-02

90

item_1

2022-08-03

90

Namun, itu juga valid untuk menentukan nilai yang tidak berubah dalam dataset pengganti. Ketika digunakan sebagai dataset pengganti, masing-masing dari tiga tabel berikut akan menghasilkan hasil yang sama seperti tabel yang disediakan sebelumnya.

Penggantian dataset dengan kolom yang tidak berubah
item_id timestamp price stock_count

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

Dataset pengganti dengan baris yang tidak berubah
item_id timestamp price

item_1

2022-08-01

100

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

75

item_2

2022-08-02

75

item_2

2022-08-03

75

Dataset pengganti dengan baris dan kolom yang tidak berubah
item_id timestamp price stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

90

50

item_1

2022-08-03

90

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

Missing values

Nilai yang hilang dalam deret waktu penggantian diganti dengan nilai dari deret waktu terkait baseline. Pertimbangkan skenario di mana Anda menerapkan diskon 10% untuk item_1 untuk 2022-08-02 dan 2022-08-03 dan tingkatkan stok item_2 pada 2022-08-01. Dataset pengganti ini cukup:

Penggantian dataset dengan nilai yang hilang
item_id timestamp price stock_count

item_1

2022-08-02

90

item_1

2022-08-03

90

item_2

2022-08-01

5000

Nilai-nilai yang hilang dari tabel ini dihitung dari deret waktu terkait baseline.

Extraneous values

Nilai asing dalam deret waktu penggantian diabaikan saat membuat perkiraan bagaimana-jika. Artinya, nilai dalam dataset pengganti yang tidak sesuai dengan nilai dalam deret waktu terkait baseline tidak dimodelkan. Pertimbangkan dataset pengganti ini:

Dataset pengganti dengan nilai asing
item_id timestamp price stock_count

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-01

50

125

item_3

2022-08-02

50

125

item_3

2022-08-03

50

125

Baris yang berisi item_3 diabaikan dan bukan bagian dari analisis bagaimana-jika.

Historical changes

Perubahan dalam dataset pengganti yang berada di luar cakrawala perkiraan diabaikan. Pertimbangkan dataset pengganti ini:

Penggantian dataset dengan nilai di luar cakrawala perkiraan
item_id timestamp price stock_count

item_1

2022-07-31

100

50

item_1

2022-08-01

100

50

item_1

2022-08-02

100

50

item_1

2022-08-03

100

50

item_1

2022-08-04

100

50

item_2

2022-07-31

75

500

item_2

2022-08-01

75

500

item_2

2022-08-02

75

500

item_2

2022-08-03

75

500

item_3

2022-08-04

75

500

Baris yang berisi 2022-07-31 dan 2022-08-04 diabaikan dan bukan bagian dari analisis bagaimana-jika.

Dimensi Forecast

Jika Anda menyertakan dimensi perkiraan dalam kumpulan data Anda, maka Anda harus memasukkannya ke dalam kumpulan data pengganti. Pertimbangkan deret waktu terkait dasar ini:

item_id store_id timestamp price stock_count

item_1

store_1

2022-08-01

100

50

item_1

store_1

2022-08-02

100

50

item_1

store_1

2022-08-03

100

50

item_1

store_2

2022-08-01

75

500

item_1

store_2

2022-08-02

75

500

item_1

store_2

2022-08-03

75

500

Oleh karena itu, dataset pengganti untuk diskon 10% di semua toko pada 2022-08-02 adalah sebagai berikut:

item_id store_id timestamp price

item_1

store_1

2022-08-02

90

item_1

store_2

2022-08-02

67.5