

# 예약된 데이터베이스 유지 관리를 수행하는 앱 생성
<a name="scheduled-task-app"></a>

AWS Lambda를 사용하여 자동화된 시스템 백업, 파일 변환, 유지 관리 태스크와 같은 예약된 프로세스를 대체할 수 있습니다. 이 예제에서는 오래된 항목을 삭제하여 DynamoDB 테이블에서 정기적으로 예약된 유지 관리를 수행하는 서버리스 애플리케이션을 생성합니다. 앱은 EventBridge 스케줄러를 사용하여 cron 일정에 따라 Lambda 함수를 간접 호출합니다. 함수가 간접 호출되면 테이블에서 1년 이상 된 항목을 쿼리하여 삭제합니다. 함수는 삭제된 각 항목을 CloudWatch Logs에 기록합니다.

예제를 구현하려면 먼저 DynamoDB 테이블을 생성하고 쿼리할 함수에 대한 테스트 데이터로 채웁니다. 그런 다음 EventBridge 스케줄러 트리거와 테이블에서 항목을 읽고 삭제할 수 있는 권한을 함수에 부여하는 IAM 실행 역할이 있는 Python Lambda 함수를 생성합니다.

![\[\]](http://docs.aws.amazon.com/ko_kr/lambda/latest/dg/images/ExampleApps/cron_app.png)


**작은 정보**  
Lambda를 처음 사용하는 경우 이 예제 앱을 생성하기 전에 [첫 번째 Lambda 함수 생성](getting-started.md) 자습서를 완료하는 것이 좋습니다.

AWS Management Console을 사용하여 리소스를 생성하고 구성하여 앱을 수동으로 배포할 수 있습니다. AWS Serverless Application Model(AWS SAM)(을)를 사용하여 앱을 배포할 수도 있습니다. AWS SAM(은)는 코드형 인프라(IaC) 도구입니다. IaC를 사용하면 리소스를 수동으로 생성하지 않고 코드로 정의한 다음 자동으로 배포할 수 있습니다.

이 예제 앱을 배포하기 전에 IaC와 함께 Lambda를 사용하는 방법에 대해 자세히 알아보려면 [코드형 인프라(IaC)와 함께 Lambda 사용](foundation-iac.md) 섹션을 참조하세요.

## 사전 조건
<a name="scheduled-task-app-prereqs"></a>

예제 앱을 생성하기 전에 필수 명령줄 도구와 프로그램이 설치되어 있는지 확인하세요.
+ **Python**

  앱을 테스트하기 위해 생성한 DynamoDB 테이블을 채우기 위해 이 예제에서는 Python 스크립트와 CSV 파일을 사용하여 테이블에 데이터를 씁니다. 머신에 Python 버전 3.8 이상이 설치되어 있는지 확인하세요.
+ **AWS SAM CLI**

  AWS SAM을 사용하여 DynamoDB 테이블을 생성하고 예제 앱을 배포하려면 AWS SAM CLI를 설치해야 합니다. *AWS SAM 사용 설명서*의 [설치 지침](https://docs.aws.amazon.com/serverless-application-model/latest/developerguide/install-sam-cli.html)을 따르세요.
+ **AWS CLI**

  제공된 Python 스크립트를 사용하여 테스트 테이블을 채우려면 AWS CLI를 설치하고 구성해야 합니다. 이는 스크립트에서 AWS Identity and Access Management(IAM) 자격 증명에 액세스해야 하는 AWS SDK for Python (Boto3)을 사용하기 때문입니다. 또한 AWS SAM을 사용하여 리소스를 배포하려면 AWS CLI가 설치되어 있어야 합니다. *AWS Command Line Interface 사용 설명서*의 [설치 지침](https://docs.aws.amazon.com/cli/latest/userguide/getting-started-install.html)에 따라 CLI를 설치합니다.
+ **Docker**

  AWS SAM을 사용하여 앱을 배포하려면 Docker 또한 빌드 머신에 설치되어 있어야 합니다. Docker 설명서 웹사이트의 [Docker 엔진 설치](https://docs.docker.com/engine/install/)에 있는 지침을 따르세요.

## 예제 앱 파일 다운로드
<a name="scheduled-task-app-download"></a>

예제 데이터베이스와 예약된 유지 관리 앱을 생성하려면 프로젝트 디렉터리에 다음 파일을 생성해야 합니다.

**예제 데이터베이스 파일**
+ `template.yaml` - DynamoDB 테이블을 생성하는 데 사용할 수 있는 AWS SAM 템플릿
+ `sample_data.csv` - 테이블에 로드할 샘플 데이터가 포함된 CSV 파일
+ `load_sample_data.py` - CSV 파일의 데이터를 테이블에 쓰는 Python 스크립트

**예약된 유지 관리 앱 파일**
+ `lambda_function.py` - 데이터베이스 유지 관리를 수행하는 Lambda 함수에 대한 Python 함수 코드
+ `requirements.txt` - Python 함수 코드에 필요한 종속성을 정의하는 매니페스트 파일
+ `template.yaml` - 앱을 배포하는 데 사용할 수 있는 AWS SAM 템플릿

**테스트 파일**
+ `test_app.py` - 테이블을 스캔하고 1년이 지난 모든 레코드를 출력하여 함수의 성공적인 작동을 확인하는 Python 스크립트

다음 섹션을 확장하여 코드를 확인하고 앱의 생성과 테스트에서 각 파일의 역할에 대해 자세히 알아보세요. 로컬 머신에 파일을 생성하려면 아래 코드를 복사하여 붙여넣으세요.

### AWS SAM 템플릿(예: DynamoDB 테이블)
<a name="scheduled-task-app-table-yaml"></a>

다음 코드를 복사하여 새로운 `template.yaml` 파일에 붙여 넣습니다.

```
AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Description: SAM Template for DynamoDB Table with Order_number as Partition Key and Date as Sort Key

Resources:
  MyDynamoDBTable:
    Type: AWS::DynamoDB::Table
    DeletionPolicy: Retain
    UpdateReplacePolicy: Retain
    Properties:
      TableName: MyOrderTable
      BillingMode: PAY_PER_REQUEST
      AttributeDefinitions:
        - AttributeName: Order_number
          AttributeType: S
        - AttributeName: Date
          AttributeType: S
      KeySchema:
        - AttributeName: Order_number
          KeyType: HASH
        - AttributeName: Date
          KeyType: RANGE
      SSESpecification:
        SSEEnabled: true
      GlobalSecondaryIndexes:
        - IndexName: Date-index
          KeySchema:
            - AttributeName: Date
              KeyType: HASH
          Projection:
            ProjectionType: ALL
      PointInTimeRecoverySpecification:
        PointInTimeRecoveryEnabled: true

Outputs:
  TableName:
    Description: DynamoDB Table Name
    Value: !Ref MyDynamoDBTable
  TableArn:
    Description: DynamoDB Table ARN
    Value: !GetAtt MyDynamoDBTable.Arn
```

**참고**  
AWS SAM 템플릿은 `template.yaml`의 표준 이름 지정 규칙을 사용합니다. 이 예제에는 두 개의 템플릿 파일이 있습니다. 하나는 예제 데이터베이스를 생성하는 데 사용되고, 다른 하나는 앱 자체를 생성하는 데 사용됩니다. 프로젝트 폴더에 있는 별도의 하위 디렉터리에 저장합니다.

AWS SAM 템플릿은 앱을 테스트하기 위해 생성하는 DynamoDB 테이블 리소스를 정의합니다. 이 테이블은 `Order_number`의 프라이머리 키와 `Date`의 정렬 키를 사용합니다. Lambda 함수가 날짜별로 직접 항목을 찾을 수 있도록 `Date-index`라는 [전역 보조 인덱스](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/GSI.html)도 정의합니다.

`AWS::DynamoDB::Table` 리소스를 사용하여 DynamoDB 테이블을 생성하고 구성하는 방법에 대해 자세히 알아보려면 *AWS CloudFormation 사용 설명서*의 [AWS::DynamoDB::Table](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-dynamodb-table.html)을 참조하세요.

### 샘플 데이터베이스 데이터 파일
<a name="scheduled-task-app-csv-file"></a>

다음 코드를 복사하여 새로운 `sample_data.csv` 파일에 붙여 넣습니다.

```
Date,Order_number,CustomerName,ProductID,Quantity,TotalAmount
2023-09-01,ORD001,Alejandro Rosalez,PROD123,2,199.98
2023-09-01,ORD002,Akua Mansa,PROD456,1,49.99
2023-09-02,ORD003,Ana Carolina Silva,PROD789,3,149.97
2023-09-03,ORD004,Arnav Desai,PROD123,1,99.99
2023-10-01,ORD005,Carlos Salazar,PROD456,2,99.98
2023-10-02,ORD006,Diego Ramirez,PROD789,1,49.99
2023-10-03,ORD007,Efua Owusu,PROD123,4,399.96
2023-10-04,ORD008,John Stiles,PROD456,2,99.98
2023-10-05,ORD009,Jorge Souza,PROD789,3,149.97
2023-10-06,ORD010,Kwaku Mensah,PROD123,1,99.99
2023-11-01,ORD011,Li Juan,PROD456,5,249.95
2023-11-02,ORD012,Marcia Oliveria,PROD789,2,99.98
2023-11-03,ORD013,Maria Garcia,PROD123,3,299.97
2023-11-04,ORD014,Martha Rivera,PROD456,1,49.99
2023-11-05,ORD015,Mary Major,PROD789,4,199.96
2023-12-01,ORD016,Mateo Jackson,PROD123,2,199.99
2023-12-02,ORD017,Nikki Wolf,PROD456,3,149.97
2023-12-03,ORD018,Pat Candella,PROD789,1,49.99
2023-12-04,ORD019,Paulo Santos,PROD123,5,499.95
2023-12-05,ORD020,Richard Roe,PROD456,2,99.98
2024-01-01,ORD021,Saanvi Sarkar,PROD789,3,149.97
2024-01-02,ORD022,Shirley Rodriguez,PROD123,1,99.99
2024-01-03,ORD023,Sofia Martinez,PROD456,4,199.96
2024-01-04,ORD024,Terry Whitlock,PROD789,2,99.98
2024-01-05,ORD025,Wang Xiulan,PROD123,3,299.97
```

이 파일에는 DynamoDB 테이블을 표준 쉼표로 구분된 값(CSV) 형식으로 채우기 위한 몇 가지 예제 테스트 데이터가 포함되어 있습니다.

### 샘플 데이터를 로드하기 위한 Python 스크립트
<a name="scheduled-task-app-load-script"></a>

다음 코드를 복사하여 새로운 `load_sample_data.py` 파일에 붙여 넣습니다.

```
import boto3
import csv
from decimal import Decimal

# Initialize the DynamoDB client
dynamodb = boto3.resource('dynamodb')
table = dynamodb.Table('MyOrderTable') 
print("DDB client initialized.")

def load_data_from_csv(filename):
    with open(filename, 'r') as file:
        csv_reader = csv.DictReader(file)
        for row in csv_reader:
            item = {
                'Order_number': row['Order_number'],
                'Date': row['Date'],
                'CustomerName': row['CustomerName'],
                'ProductID': row['ProductID'],
                'Quantity': int(row['Quantity']),
                'TotalAmount': Decimal(str(row['TotalAmount']))
            }
            table.put_item(Item=item)
            print(f"Added item: {item['Order_number']} - {item['Date']}")

if __name__ == "__main__":
    load_data_from_csv('sample_data.csv')
    print("Data loading completed.")
```

이 Python 스크립트는 먼저 AWS SDK for Python (Boto3)을 사용하여 DynamoDB 테이블에 대한 연결을 생성합니다. 그런 다음 예제–데이터 CSV 파일의 각 행을 반복하고, 해당 행에서 항목을 생성하고, boto3 SDK를 사용하여 항목을 DynamoDB 테이블에 씁니다.

### Python 함수 코드
<a name="scheduled-task-app-function-code"></a>

다음 코드를 복사하여 새로운 `lambda_function.py` 파일에 붙여 넣습니다.

```
import boto3
from datetime import datetime, timedelta
from boto3.dynamodb.conditions import Key, Attr
import logging

logger = logging.getLogger()
logger.setLevel("INFO")

def lambda_handler(event, context):
    # Initialize the DynamoDB client
    dynamodb = boto3.resource('dynamodb')
    
    # Specify the table name
    table_name = 'MyOrderTable'
    table = dynamodb.Table(table_name)
    
    # Get today's date
    today = datetime.now()
    
    # Calculate the date one year ago
    one_year_ago = (today - timedelta(days=365)).strftime('%Y-%m-%d')
    
    # Scan the table using a global secondary index
    response = table.scan(
        IndexName='Date-index',
        FilterExpression='#date < :one_year_ago',
        ExpressionAttributeNames={
            '#date': 'Date'
        },
        ExpressionAttributeValues={
            ':one_year_ago': one_year_ago
        }
    )
    
     # Delete old items
    with table.batch_writer() as batch:
        for item in response['Items']:
            Order_number = item['Order_number']
            batch.delete_item(
                Key={
                    'Order_number': Order_number,
                    'Date': item['Date']
                }
            )
            logger.info(f'deleted order number {Order_number}')
    
    # Check if there are more items to scan
    while 'LastEvaluatedKey' in response:
        response = table.scan(
            IndexName='DateIndex',
            FilterExpression='#date < :one_year_ago',
            ExpressionAttributeNames={
                '#date': 'Date'
            },
            ExpressionAttributeValues={
                ':one_year_ago': one_year_ago
            },
            ExclusiveStartKey=response['LastEvaluatedKey']
        )
        
        # Delete old items
        with table.batch_writer() as batch:
            for item in response['Items']:
                batch.delete_item(
                    Key={
                        'Order_number': item['Order_number'],
                        'Date': item['Date']
                    }
                )
    
    return {
        'statusCode': 200,
        'body': 'Cleanup completed successfully'
    }
```

Python 함수 코드에는 함수가 간접 호출될 때 Lambda가 실행하는 [핸들러 함수](python-handler.md)(`lambda_handler`)가 포함되어 있습니다.

EventBridge 스케줄러에서 함수를 간접 호출하면 AWS SDK for Python (Boto3)을 사용하여 예약된 유지 관리 태스크를 수행할 DynamoDB 테이블에 대한 연결을 생성합니다. 그런 다음 Python `datetime` 라이브러리를 사용하여 1년 전 날짜를 계산한 다음 테이블에서 이보다 오래된 항목을 스캔하고 삭제합니다.

DynamoDB 쿼리 및 스캔 작업의 응답은 최대 1MB로 크기가 제한됩니다. 응답이 1MB보다 큰 경우 DynamoDB는 데이터에 페이지를 매기고 응답에서 `LastEvaluatedKey` 요소를 반환합니다. 함수가 테이블의 모든 레코드를 처리할 수 있도록 해당 키가 있는지 확인하고 전체 테이블이 스캔될 때까지 마지막으로 평가된 위치에서 테이블 스캔을 계속 수행합니다.

### `requirements.txt` 매니페스트 파일
<a name="scheduled-task-app-dependencies"></a>

다음 코드를 복사하여 새로운 `requirements.txt` 파일에 붙여 넣습니다.

```
boto3
```

이 예제에서 함수 코드에는 표준 Python 라이브러리에 포함되지 않은 종속성이 하나만 있습니다. 바로 함수가 DynamoDB 테이블에서 항목을 스캔하고 삭제하는 데 사용하는 Python용 SDK(Boto3)입니다.

**참고**  
Python용 SDK(Boto3) 버전이 Lambda 런타임의 일부로 포함되어 있으므로 함수의 배포 패키지에 Boto3를 추가하지 않고도 코드를 실행할 수 있습니다. 그러나 함수의 종속 항목을 완전히 제어하고 버전 불일치와 관련된 문제를 방지하기 위해 Python의 모범 사례는 함수의 배포 패키지에 모든 함수 종속성을 포함합니다. 자세한 내용은 [Python의 런타임 종속 항목](python-package.md#python-package-dependencies) 섹션을 참조하세요.

### AWS SAM 템플릿(예약된 유지 관리 앱)
<a name="scheduled-task-app-table-yaml"></a>

다음 코드를 복사하여 새로운 `template.yaml` 파일에 붙여 넣습니다.

```
AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Description: SAM Template for Lambda function and EventBridge Scheduler rule

Resources:
  MyLambdaFunction:
    Type: AWS::Serverless::Function
    Properties:
      FunctionName: ScheduledDBMaintenance
      CodeUri: ./
      Handler: lambda_function.lambda_handler
      Runtime: python3.11
      Architectures:
        - x86_64
      Events:
        ScheduleEvent:
          Type: ScheduleV2
          Properties:
            ScheduleExpression: cron(0 3 1 * ? *)
            Description: Run on the first day of every month at 03:00 AM
      Policies:
        - CloudWatchLogsFullAccess
        - Statement:
            - Effect: Allow
              Action:
                - dynamodb:Scan
                - dynamodb:BatchWriteItem
              Resource: !Sub 'arn:aws:dynamodb:${AWS::Region}:${AWS::AccountId}:table/MyOrderTable'

  LambdaLogGroup:
    Type: AWS::Logs::LogGroup
    Properties:
      LogGroupName: !Sub /aws/lambda/${MyLambdaFunction}
      RetentionInDays: 30

Outputs:
  LambdaFunctionName:
    Description: Lambda Function Name
    Value: !Ref MyLambdaFunction
  LambdaFunctionArn:
    Description: Lambda Function ARN
    Value: !GetAtt MyLambdaFunction.Arn
```

**참고**  
AWS SAM 템플릿은 `template.yaml`의 표준 이름 지정 규칙을 사용합니다. 이 예제에는 두 개의 템플릿 파일이 있습니다. 하나는 예제 데이터베이스를 생성하는 데 사용되고, 다른 하나는 앱 자체를 생성하는 데 사용됩니다. 프로젝트 폴더에 있는 별도의 하위 디렉터리에 저장합니다.

AWS SAM 템플릿은 앱의 리소스를 정의합니다. `AWS::Serverless::Function` 리소스를 사용하여 Lambda 함수를 정의합니다. EventBridge 스케줄러 일정과 Lambda 함수를 간접 호출하는 트리거는 이 리소스의 `Events` 속성을 `ScheduleV2` 유형으로 사용하여 생성됩니다. AWS SAM 템플릿에서 EventBridge 스케줄러 일정을 정의하는 방법에 대해 자세히 알아보려면 *AWS Serverless Application Model 개발자 가이드*의 [ScheduleV2](https://docs.aws.amazon.com/serverless-application-model/latest/developerguide/sam-property-function-schedulev2.html)를 참조하세요.

Lambda 함수와 EventBridge 스케줄러 일정 외에도 삭제된 항목의 레코드를 전송할 함수에 대한 CloudWatch 로그 그룹도 정의합니다.

### 테스트 스크립트
<a name="scheduled-task-app-test-script"></a>

다음 코드를 복사하여 새로운 `test_app.py` 파일에 붙여 넣습니다.

```
import boto3
from datetime import datetime, timedelta
import json

# Initialize the DynamoDB client
dynamodb = boto3.resource('dynamodb')

# Specify your table name
table_name = 'YourTableName'
table = dynamodb.Table(table_name)

# Get the current date
current_date = datetime.now()

# Calculate the date one year ago
one_year_ago = current_date - timedelta(days=365)

# Convert the date to string format (assuming the date in DynamoDB is stored as a string)
one_year_ago_str = one_year_ago.strftime('%Y-%m-%d')

# Scan the table
response = table.scan(
    FilterExpression='#date < :one_year_ago',
    ExpressionAttributeNames={
        '#date': 'Date'
    },
    ExpressionAttributeValues={
        ':one_year_ago': one_year_ago_str
    }
)

# Process the results
old_records = response['Items']

# Continue scanning if we have more items (pagination)
while 'LastEvaluatedKey' in response:
    response = table.scan(
        FilterExpression='#date < :one_year_ago',
        ExpressionAttributeNames={
            '#date': 'Date'
        },
        ExpressionAttributeValues={
            ':one_year_ago': one_year_ago_str
        },
        ExclusiveStartKey=response['LastEvaluatedKey']
    )
    old_records.extend(response['Items'])

for record in old_records:
    print(json.dumps(record))

# The total number of old records should be zero.
print(f"Total number of old records: {len(old_records)}")
```

이 테스트 스크립트는 AWS SDK for Python (Boto3)을 사용하여 DynamoDB 테이블에 대한 연결을 생성하고 1년이 지난 항목을 스캔합니다. Lambda 함수가 성공적으로 실행되었는지 확인하기 위해 테스트가 끝나면 테이블에 남아 있는 1년이 지난 레코드 수를 인쇄합니다. Lambda 함수가 성공적이었다면 테이블의 이전 레코드 수는 0이어야 합니다.

## 예제 DynamoDB 테이블 생성 및 채우기
<a name="scheduled-task-app-create-table"></a>

예약된 유지 관리 앱을 테스트하려면 먼저 DynamoDB 테이블을 생성하고 이를 몇 가지 샘플 데이터로 채웁니다. AWS Management Console을 사용하여 수동으로 테이블을 생성하거나 AWS SAM을 사용하여 테이블을 생성할 수 있습니다. 몇 가지 AWS CLI 명령을 사용하여 테이블을 빠르게 생성하고 구성하려면 AWS SAM을 사용하는 것이 좋습니다.

------
#### [ Console ]

**DynamoDB 테이블을 생성하려면**

1. [DynamoDB 콘솔의 테이블 페이지](https://console.aws.amazon.com/dynamodbv2/home#tables)를 엽니다.

1. **테이블 생성**을 선택합니다.

1. 다음을 수행하여 테이블을 생성합니다.

   1. **테이블 세부 정보**에서 **테이블 이름**에 **MyOrderTable**을 입력합니다.

   1. **파티션 키**에서 **Order\$1number**를 입력하고 유형을 **문자열**로 둡니다.

   1. **정렬 키**에서 **Date**를 입력하고 유형을 **문자열**로 둡니다.

   1. **테이블 설정**을 **기본 설정**으로 설정된 상태로 두고 **테이블 생성**을 선택합니다.

1. 테이블 생성이 완료되고 **상태**가 **활성**으로 표시되면 다음을 수행하여 글로벌 보조 인덱스(GSI)를 생성합니다. 앱은 GSI를 사용하여 날짜별로 항목을 직접 검색하고 삭제할 항목을 결정합니다.

   1. 테이블 목록에서 **MyOrderTable**을 선택합니다.

   1. **인덱스** 탭을 선택합니다.

   1. **글로벌 보조 인덱스**에서 **인덱스 생성**을 선택합니다.

   1. **인덱스 세부 정보**에서 **파티션 키**에 **Date**를 입력하고 **데이터 유형**을 **문자열**로 설정한 상태로 둡니다.

   1. **인덱스 이름**에 **Date-index**를 입력합니다.

   1. 다른 모든 파라미터를 기본값으로 설정한 상태로 두고 페이지 하단으로 스크롤한 다음 **인덱스 생성**을 선택합니다.

------
#### [ AWS SAM ]

**DynamoDB 테이블을 생성하려면**

1. DynamoDB 테이블의 `template.yaml` 파일을 저장한 폴더로 이동합니다. 이 예제에서는 두 개의 `template.yaml` 파일을 사용합니다. 템플릿이 별도의 하위 폴더에 저장되어 있는지 확인하고 템플릿이 포함된 올바른 폴더에 DynamoDB 테이블을 생성할 수 있는지 확인하세요.

1. 다음 명령을 실행합니다.

   ```
   sam build
   ```

   이 명령은 배포하려는 리소스에 대한 빌드 아티팩트를 수집하여 배포하려는 적절한 형식과 위치에 배치합니다.

1. `template.yaml` 파일에 지정된 DynamoDB 리소스를 생성하려면 다음 명령을 실행합니다.

   ```
   sam deploy --guided
   ```

   `--guided` 플래그를 사용하면 배포 AWS SAM 프로세스를 안내하는 메시지가 표시됩니다. 이러한 배포의 경우 **cron-app-test-db**의 `Stack name`을 입력하고 Enter를 사용하여 다른 모든 옵션의 기본값을 수락합니다.

   AWS SAM이 DynamoDB 리소스 생성을 완료하면 다음 메시지가 표시됩니다.

   ```
   Successfully created/updated stack - cron-app-test-db in us-west-2
   ```

1. DynamoDB 콘솔의 [테이블](https://console.aws.amazon.com/dynamodbv2/home#tables) 페이지를 열어 DynamoDB 테이블이 생성되었는지 확인할 수도 있습니다. 이름이 `MyOrderTable`인 테이블이 표시됩니다.

------

테이블을 생성한 후 다음에는 앱을 테스트하기 위해 몇 가지 샘플 데이터를 추가합니다. 앞서 다운로드한 CSV 파일(`sample_data.csv`)에는 주문 번호, 날짜, 고객 및 주문 정보로 구성된 여러 예제 항목이 포함되어 있습니다. 제공된 Python 스크립트(`load_sample_data.py`)를 사용하여 해당 데이터를 테이블에 추가합니다.

**테이블에 샘플 데이터를 추가하려면**

1. `sample_data.csv` 및 `load_sample_data.py` 파일이 포함된 디렉터리로 이동합니다. 이러한 파일이 다른 디렉터리에 있는 경우 동일한 위치에 저장되도록 파일을 이동합니다.

1. 다음 명령을 실행하여 스크립트를 실행할 Python 가상 환경을 생성합니다. 다음 단계에서는 AWS SDK for Python (Boto3)을 설치해야 하므로 가상 환경을 사용하는 것이 좋습니다.

   ```
   python -m venv venv
   ```

1. 다음 명령을 실행하여 가상 환경을 활성화합니다.

   ```
   source venv/bin/activate
   ```

1. 다음 명령을 실행하여 가상 환경에 SDK for Python(Boto3)을 설치합니다. 스크립트는 이 라이브러리를 사용하여 DynamoDB 테이블에 연결하고 항목을 추가합니다.

   ```
   pip install boto3
   ```

1. 다음 명령을 실행하여 스크립트를 실행하고 테이블을 채웁니다.

   ```
   python load_sample_data.py
   ```

   스크립트가 성공적으로 실행되면 각 항목을 로드할 때 이를 콘솔에 인쇄하고 `Data loading completed`를 보고해야 합니다.

1. 다음 명령을 실행하여 가상 환경을 비활성화합니다.

   ```
   deactivate
   ```

1. 다음을 수행하여 데이터가 DynamoDB 테이블에 로드되었는지 확인할 수 있습니다.

   1. DynamoDB 콘솔의 [항목 탐색](https://console.aws.amazon.com/dynamodbv2/home#item-explorer) 페이지를 열고 테이블(`MyOrderTable`)을 선택합니다.

   1. **반환된 항목** 창에 스크립트가 테이블에 추가한 CSV 파일의 25개 항목이 표시되어야 합니다.

## 예약된 유지 관리 앱 생성
<a name="scheduled-task-app-create-app"></a>

AWS Management Console 또는 AWS SAM을 사용하여 이 예제 앱의 리소스를 단계별로 생성하고 배포할 수 있습니다. 프로덕션 환경에서는 수동 프로세스를 사용하지 않고 서버리스 애플리케이션을 반복적으로 배포할 수 있는 AWS SAM과 같은 코드형 인프라(IaC) 도구를 사용하는 것이 좋습니다.

이 예제에서는 콘솔 지침에 따라 각 AWS 리소스를 개별적으로 구성하는 방법을 학습하거나 AWS SAM 지침에 따라 AWS CLI 명령을 사용하여 앱을 빠르게 배포할 수 있습니다.

------
#### [ Console ]

**AWS Management Console을 사용하여 함수를 생성하려면**

먼저 기본 스타터 코드가 포함된 함수를 생성합니다. 그런 다음 Lambda 코드 편집기에서 직접 코드를 복사하여 붙여넣거나 `.zip` 패키지로 코드를 업로드하여 해당 코드를 고유한 함수 코드로 대체합니다. 이 태스크에서는 코드를 복사하여 붙여 넣는 것이 좋습니다.

1. Lambda 콘솔의 [함수 페이지](https://console.aws.amazon.com/lambda/home#/functions)를 엽니다.

1. **함수 생성**을 선택합니다.

1. **새로 작성**을 선택합니다.

1. **기본 정보**에서 다음과 같이 합니다.

   1. [**함수 이름(Function name)**]에 `ScheduledDBMaintenance`을 입력합니다.

   1. **런타임**의 경우 최신 Python 버전을 선택합니다.

   1. **아키텍처**에서는 **x86\$164**를 선택합니다.

1. **함수 생성**을 선택합니다.

1. 함수가 생성된 후에는 제공된 함수 코드로 함수를 구성할 수 있습니다.

   1. **코드 소스** 창에서 Lambda가 생성한 Hello world 코드를 이전에 저장한 `lambda_function.py` 파일의 Python 함수 코드로 바꿉니다.

   1. **배포** 섹션에서 **배포**를 선택하여 함수의 코드를 업데이트하세요.  
![\[\]](http://docs.aws.amazon.com/ko_kr/lambda/latest/dg/images/getting-started-tutorial/deploy-console.png)

**함수 메모리 및 타임아웃 구성(콘솔)**

1. 함수의 **구성** 탭을 선택합니다.

1. **일반 구성** 창에서 **편집**을 선택합니다.

1. **메모리**를 256MB로 설정하고 **타임아웃**을 15초로 설정합니다. 프로덕션 환경과 같이 레코드가 많은 큰 테이블을 처리하는 경우에는 **제한 시간**을 더 큰 숫자로 설정하는 것이 좋습니다. 이렇게 하면 함수에서 데이터베이스를 스캔하고 정리하는 데 더 많은 시간을 사용할 수 있습니다.

1. **저장**을 선택합니다.

**로그 형식 구성하기(콘솔)**

Lambda 함수를 구성하여 구조화되지 않은 텍스트나 JSON 형식으로 로그를 출력할 수 있습니다. 로그 데이터를 더 간편하게 검색하고 필터링할 수 있도록 로그에 JSON 형식을 사용하는 것이 좋습니다. Lambda 로그 구성 옵션에 대한 자세한 내용은 [Lambda 함수에 대한 고급 로깅 제어 구성](monitoring-logs.md#monitoring-cloudwatchlogs-advanced) 섹션을 참조하세요.

1. 함수의 **구성** 탭을 선택합니다.

1. **모니터링 및 운영 도구**를 선택합니다.

1. **로깅 구성** 창에서 **편집**을 선택합니다.

1. **로깅 구성**의 경우 **JSON**을 선택합니다.

1. **저장**을 선택합니다.

**IAM 권한을 설정하려면**

함수에 DynamoDB 항목을 읽고 삭제하는 데 필요한 권한을 부여하려면 함수의 [실행 역할](lambda-intro-execution-role.md)에 필요한 권한을 정의하는 정책을 추가해야 합니다.

1. **구성** 탭을 연 다음 왼쪽 탐색 모음에서 **권한**을 선택합니다.

1. **실행 역할**에서 역할 이름을 선택합니다.

1. IAM 콘솔에서 **권한 추가**를 선택한 다음 **인라인 정책 추가**를 선택합니다.

1. JSON 편집기를 사용하여 다음 정책을 입력합니다.  
****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Effect": "Allow",
               "Action": [
                   "dynamodb:Scan",
                   "dynamodb:DeleteItem",
                   "dynamodb:BatchWriteItem"
               ],
               "Resource": "arn:aws:dynamodb:*:*:table/MyOrderTable"
           }
       ]
   }
   ```

1. 정책의 이름을 **DynamoDBCleanupPolicy**로 지정한 다음 정책을 생성합니다.

**EventBridge 스케줄러를 트리거로 설정하려면(콘솔)**

1. [EventBridge 콘솔](https://console.aws.amazon.com/events/home)을 엽니다.

1. 왼쪽 탐색 창의 **스케줄러** 섹션에서 **스케줄러**를 선택합니다.

1. **일정 생성**을 선택합니다.

1. 다음을 수행하여 일정을 구성합니다.

   1. **일정 이름**에 일정의 이름을 입력합니다(예: **DynamoDBCleanupSchedule**).

   1. **일정 패턴**에서 **반복 일정**을 선택합니다.

   1. **일정 유형**의 경우 기본값을 **Cron 기반 일정**으로 두고 다음 일정 세부 정보를 입력합니다.
      + **분**: **0**
      + **시간**: **3**
      + **일**: **1**
      + **월**: **\$1**
      + **요일**: **?**
      + **년**: **\$1**

      이 cron 표현식을 평가하면 매월 1일 오전 3시에 실행됩니다.

   1. **유연한 기간**에서 **끄기**를 선택합니다.

1. **다음**을 선택합니다.

1. 다음을 수행하여 Lambda 함수에 대한 트리거를 구성합니다.

   1. **대상 세부 정보** 창에서 **대상 API**를 **템플릿 대상**으로 설정한 상태로 두고 **AWS Lambda 간접 호출**을 선택합니다.

   1. **간접 호출**의 드롭다운 목록에서 Lambda 함수(`ScheduledDBMaintenance`)를 선택합니다.

   1. **페이로드**를 비워 두고 **다음**을 선택합니다.

   1. **권한**으로 스크롤하고 **이 일정에 대한 새 역할 생성**을 선택합니다. 콘솔을 사용하여 새 EventBridge 스케줄러 일정을 생성하면 EventBridge 스케줄러는 일정이 해당 함수를 간접 호출하는 데 필요한 권한으로 새 정책을 생성합니다. 일정 권한 관리에 대한 자세한 내용은 *EventBridge 스케줄러 사용 설명서*의 [Cron 기반 일정](https://docs.aws.amazon.com/scheduler/latest/UserGuide/schedule-types.html#cron-based) 섹션을 참조하세요.

   1. **다음**을 선택합니다.

1. 설정을 검토하고 **일정 생성**을 선택하여 일정 및 Lambda 트리거의 생성을 완료합니다.

------
#### [ AWS SAM ]

**AWS SAM을 사용하여 앱을 배포하려면**

1. 앱의 `template.yaml` 파일을 저장한 폴더로 이동합니다. 이 예제에서는 두 개의 `template.yaml` 파일을 사용합니다. 파일이 별도의 하위 폴더에 저장되어 있고 앱을 생성하기 위한 템플릿이 포함된 올바른 폴더에 있는지 확인합니다.

1. 이전에 다운로드한 `lambda_function.py` 및 `requirements.txt` 파일을 동일한 폴더에 복사합니다. AWS SAM 템플릿에 지정된 코드 위치는 현재 위치를 의미하는 `./`입니다. AWS SAM은 앱을 배포하려고 할 때 해당 폴더에서 Lambda 함수 코드를 검색합니다.

1. 다음 명령을 실행합니다.

   ```
   sam build --use-container
   ```

   이 명령은 배포하려는 리소스에 대한 빌드 아티팩트를 수집하여 배포하려는 적절한 형식과 위치에 배치합니다. `--use-container` 옵션을 지정하면 Lambda와 유사한 Docker 컨테이너 내에 함수를 빌드합니다. 여기서는 이 옵션을 사용하므로, 빌드가 작동하기 위해 로컬 컴퓨터에 Python 3.12가 설치되어 있지 않아도 됩니다.

1. `template.yaml` 파일에 지정된 Lambda 및 EventBridge 스케줄러 리소스를 생성하려면 다음 명령을 실행합니다.

   ```
   sam deploy --guided
   ```

   `--guided` 플래그를 사용하면 배포 AWS SAM 프로세스를 안내하는 메시지가 표시됩니다. 이러한 배포의 경우 **cron-maintenance-app**의 `Stack name`을 입력하고 Enter를 사용하여 다른 모든 옵션의 기본값을 수락합니다.

   AWS SAM이 Lambda 및 EventBridge 스케줄러 리소스 생성을 완료하면 다음 메시지가 표시됩니다.

   ```
   Successfully created/updated stack - cron-maintenance-app in us-west-2
   ```

1. Lambda 콘솔의 [함수](https://console.aws.amazon.com/lambda/home#/functions) 페이지를 열어 Lambda 함수가 생성되었는지 확인할 수도 있습니다. `ScheduledDBMaintenance`라는 함수가 표시됩니다.

------

## 앱 테스트
<a name="scheduled-task-app-test-app"></a>

 일정이 함수를 올바르게 트리거하고 함수가 데이터베이스의 레코드를 올바르게 정리하는지 테스트하려면 일정을 일시적으로 수정하여 특정 시간에 한 번만 실행되도록 할 수 있습니다. 그런 다음 `sam deploy`를 다시 실행하여 한 달에 한 번 실행되도록 반복 일정을 다시 설정할 수 있습니다.

**AWS Management Console을 사용하여 애플리케이션을 실행하려면**

1. EventBridge 스케줄러 콘솔 페이지로 돌아갑니다.

1. 일정을 선택한 다음 **편집**을 선택합니다.

1. **일정 패턴** 섹션의 **반복**에서 **일회성 일정**을 선택합니다.

1.  호출 시간을 지금부터 몇 분 후로 설정하고 설정을 검토한 다음 **저장**을 선택합니다.

 일정이 실행되고 대상을 간접 호출한 후 `test_app.py` 스크립트를 실행하여 함수가 DynamoDB 테이블에서 모든 이전 레코드를 성공적으로 제거했는지 확인합니다.

**Python 스크립트를 사용하여 이전 레코드가 삭제되었는지 확인하려면**

1.  명령줄에서 `test_app.py`를 저장한 폴더로 이동합니다.

1. 스크립트 실행.

   ```
   python test_app.py
   ```

    성공하면 다음과 같은 결과가 출력됩니다.

   ```
   Total number of old records: 0
   ```

## 다음 단계
<a name="scheduled-task-app-next-steps"></a>

 이제 EventBridge 스케줄러 일정을 수정하여 특정 애플리케이션의 요구 사항을 충족할 수 있습니다. EventBridge 스케줄러는 cron, 속도, 일회성 일정이라는 세 가지 유형의 일정을 지원합니다.

 EventBridge 스케줄러 일정 표현식에 대한 자세한 내용은 *EventBridge 스케줄러 사용자 가이드*의 [일정 유형](https://docs.aws.amazon.com/scheduler/latest/UserGuide/schedule-types.html)을 참조하세요. *IAM 사용 설명서*의 [액세스 관리](https://docs.aws.amazon.com/IAM/latest/UserGuide/access.html) 