다양한 예측 빈도의 데이터 집계 - Amazon Forecast

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

다양한 예측 빈도의 데이터 집계

예측기를 생성할 때 예측 빈도를 지정해야 합니다. 예측 빈도에 따라 예측에서 예상의 빈도가 결정됩니다. 월별 판매 예측을 예로 들 수 있습니다. Amazon Forecast 예측기는 지정한 예측 빈도보다 높은 데이터 빈도의 예측을 생성할 수 있습니다. 예를 들어 데이터가 매일 기록되더라도 주간 예측을 생성할 수 있습니다. 훈련 중에 Forecast는 일별 데이터를 집계하여 주간 예측 빈도로 예측을 생성합니다.

시간 경계

시간 경계는 한 주가 시작되는 요일과 같은 시간 단위의 시작을 지정합니다. Amazon Forecast는 데이터를 집계하기 전에 예측 빈도의 시간 단위를 기준으로 데이터를 정렬합니다. Forecast는 데이터와 시간 경계의 관계를 기반으로 이 작업을 수행합니다.

예를 들어 일별 예측 빈도는 지정하지만 자체 시간 경계는 지정하지 않는 경우 Forecast는 각 시간별 레코드를 레코드가 속한 날을 기준으로 정렬합니다. 각 하루는 0시에 시작됩니다. 하루가 시작되는 시간의 정의인 0시가 시간 경계입니다. 그런 다음 Forecast는 시간별 레코드를 해당 날짜의 단일 레코드로 집계합니다.

Forecast는 예측 빈도의 시간 단위를 기반으로 하는 기본 시간 경계를 사용합니다. 자동 예측기를 생성할 경우 사용자 지정 시간 경계를 지정할 수 있습니다.

사용자 지정 시간 경계와 사용자 지정 예측 빈도를 모두 지정하는 경우 Forecast는 예측 빈도 내에서 데이터를 집계하여 사용자 지정 시간 경계에 정렬합니다. 예측 빈도는 데이터 집계 빈도를 결정하는 반면, 사용자 지정 시간 경계는 정렬의 위치를 결정합니다. 예를 들어 데이터가 매일 수집되고 Amazon Forecast에서 1년 동안 해당 월의 15일에 분기별 예측을 생성하기를 원한다고 가정해 보겠습니다. 이렇게 하려면 예측 빈도를 3개월마다로 설정하고 사용자 지정 시간 경계를 15로 설정합니다. 다음 AWS Command Line Interface 예를 참조하세요.

aws forecast create-predictor \ --predictor-name predictor_name \ --data-config DatasetGroupArn="arn:aws:forecast:region:account:dataset-group/datasetGroupName" \ --forecast-horizon 4 \ --forecast-frequency 3M \ --time-alignment-boundary DayOfMonth=15

이 예제에서는 모든 일별 데이터가 3개월마다 15일로 합산(기본 집계)됩니다.

단, 이 집계에는 일별 데이터가 필요하지 않으며, 데이터가 매월 또는 더 자주 수집됩니다.

기본 시간 경계

다음 표는 데이터를 집계할 때 Forecast가 사용하는 기본 시간 정렬 경계를 나열한 것입니다.

빈도 경계
마지막 정분(45:00, 06:00)
시간 마지막 정시(09:00:00, 13:00:00)
하루의 첫 시간(시간 0)
가장 최근 월요일
매월 첫째 날
연도 연초(1월 1일)

시간 경계 지정

참고

자동 예측기에는 시간 경계만 지정할 수 있습니다.

일별, 주별, 월별 또는 연도별 예측 빈도를 사용하여 자동 예측기를 생성하는 경우 Forecast가 데이터 집계에 사용하는 시간 경계를 지정할 수 있습니다. 비즈니스 달력이 기본 시간 경계에 정렬되지 않은 경우 시간 경계를 지정할 수 있습니다. 예를 들어 매월 3일에 시작하는 월별 예측을 생성할 수 있습니다. 시간 경계를 지정하지 않으면 Forecast는 기본 시간 경계 세트를 사용합니다.

지정하는 시간 경계 단위는 예측 빈도보다 한 단위 더 세밀해야 합니다. 다음 표에는 지정할 수 있는 시간 경계 단위와 값이 예측 빈도별로 나와 있습니다.

경계 값이 28보다 작거나 같은 Monthly 시간 경계만 지정할 수 있습니다.

예측 빈도 단위 경계 단위 경계 값
일별 시간 0~23
주별 요일 월요일부터 일요일까지
매월 1부터 28까지
매년 1월부터 12월까지

예측기를 생성할 때 다음과 같이 시간 정렬 경계를 지정합니다. 프로그래밍 방식으로 지정할 수 있는 다양한 시간 경계 단위 및 경계 값에 대한 자세한 내용은 TimeAlignmentBoundary를 참조하세요.

Console

예측기의 시간 정렬 경계를 지정하려면
  1. AWS Management Console에 로그인하고 https://console.aws.amazon.com/forecast/에서 Amazon Forecast 콘솔을 엽니다.

  2. 데이터 세트 그룹에서 데이터 세트 그룹을 선택합니다.

  3. 탐색 창에서 예측기를 선택합니다.

  4. 새 예측기 훈련을 선택합니다.

  5. 필수 이름, 예측 빈도, 예측 기간 필드에 값을 입력합니다.

  6. 시간 정렬 경계에 예측기가 데이터를 집계할 때 사용할 시간 경계를 지정합니다. 이 목록의 값은 선택한 예측 빈도에 따라 달라집니다.

  7. 시작을 선택합니다. Forecast는 예측기를 생성할 때 지정한 시간 정렬 경계를 사용하여 데이터를 집계합니다.

AWS CLI

AWS CLI를 사용하여 예측기의 시간 정렬 경계를 지정하려면 create-predictor 명령을 사용하세요. time-alignment-boundary 파라미터에 시간 단위와 경계 값을 제공합니다. 다음 코드는 매주의 시작이 화요일인 향후 5주를 예측하는 자동 예측기를 생성합니다.

DayOfWeek 값과 DayOfMonth 값은 모두 대문자여야 합니다. 지정할 수 있는 다양한 시간 경계 단위 및 경계 값에 대한 자세한 내용은 TimeAlignmentBoundary를 참조하세요. 필수 및 선택적 파라미터에 대한 자세한 내용은 CreateAutoPredictor를 참조하세요.

aws forecast create-predictor \ --predictor-name predictor_name \ --data-config DatasetGroupArn="arn:aws:forecast:region:account:dataset-group/datasetGroupName" \ --forecast-horizon 5 \ --forecast-frequency W \ --time-alignment-boundary DayOfWeek=TUESDAY
Python

SDK for Python(Boto3)을 사용하여 예측기의 시간 정렬 경계를 지정하려면 create_auto_predictor 메서드를 사용하세요. TimeAlignmentBoundary 파라미터에 키가 시간 단위이고 값이 경계 값인 사전을 제공합니다. 다음 코드는 매주의 시작이 화요일인 향후 5주를 예측하는 자동 예측기를 생성합니다.

DayOfWeek 값과 DayOfMonth 값은 모두 대문자여야 합니다. 지정할 수 있는 다양한 시간 경계 단위 및 경계 값에 대한 자세한 내용은 TimeAlignmentBoundary를 참조하세요. 필수 및 선택적 파라미터에 대한 자세한 내용은 CreateAutoPredictor를 참조하세요.

import boto3 forecast = boto3.client('forecast') create_predictor_response = forecast.create_auto_predictor( PredictorName = 'predictor_name', ForecastHorizon = 5, ForecastFrequency = 'W', DataConfig = { "DatasetGroupArn": "arn:aws:forecast:region:account:dataset-group/datasetGroupName" }, TimeAlignmentBoundary = { "DayOfWeek": "TUESDAY" } ) print(create_predictor_response['PredictorArn'])