콘솔에서 Amazon SageMaker Feature Store 사용 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

콘솔에서 Amazon SageMaker Feature Store 사용

중요

Amazon SageMaker Studio 또는 Amazon SageMaker Studio Classic에서 Amazon SageMaker 리소스를 만들도록 허용하는 사용자 지정 IAM 정책은 해당 리소스에 태그를 추가할 수 있는 권한도 부여해야 합니다. Studio와 Studio Classic은 만드는 리소스에 태그를 자동으로 지정하기 때문에 리소스에 태그를 추가할 권한이 필요합니다. IAM 정책이 Studio 및 Studio Classic에서 리소스를 만들도록 허용하지만 태그 지정은 허용하지 않는 경우 리소스 만들기를 시도할 때 'AccessDenied' 오류가 발생할 수 있습니다. 자세한 내용은 SageMaker AI 리소스에 태그를 지정할 수 있는 권한 제공 섹션을 참조하세요.

SageMaker 리소스를 만들 수 있는 권한을 부여하는 AWS Amazon SageMaker AI에 대한 관리형 정책에는 해당 리소스를 만드는 동안 태그를 추가할 수 있는 권한이 이미 포함되어 있습니다.

콘솔에서 Amazon SageMaker Feature Store를 사용하여 특성 그룹을 만들고, 보고, 업데이트하고, 모니터링할 수 있습니다. 이 안내서의 모니터링에는 파이프라인 실행 및 특성 그룹의 계보 보기가 포함됩니다. 이 안내서는 콘솔에서 이러한 작업을 수행하는 방법에 대한 지침을 제공합니다.

Amazon SageMaker APIsAmazon SageMaker 특성 저장소 리소스. AWS SDK for Python (Boto3)

콘솔에서 특성 그룹 만들기

특성 그룹 생성 프로세스에는 4단계가 있습니다.

  1. 특성 그룹 정보를 입력합니다.

  2. 특성 정의를 입력합니다.

  3. 필수 특성을 입력합니다.

  4. 특성 그룹 태그를 입력합니다.

다음 옵션 중 사용 사례에 적합한 옵션을 선택합니다.

  • 온라인 저장소, 오프라인 저장소 또는 둘 다를 생성합니다. 온라인 저장소와 오프라인 저장소 간의 차이에 대한 자세한 내용은 특성 저장소 개념 섹션을 참조하세요.

  • 기본 AWS Key Management Service 키 또는 자체 KMS 키를 사용합니다. 기본 키는 AWS KMS 키(SSE-KMS)입니다. 오프라인 스토어 Amazon S3 버킷에서 Amazon S3 버킷 키 사용을 구성하여 AWS KMS 요청 비용을 줄일 수 있습니다. 특성 그룹에 버킷을 사용하기 전에 Amazon S3 버킷 키를 활성화해야 합니다. S3 버킷 키 사용을 통한 비용 절감에 대한 자세한 내용은 Amazon S3 버킷 키를 사용하여 SSE-KMS 비용 절감을 참조하세요.

    온라인 저장소와 오프라인 저장소 모두에 동일한 키를 사용하거나 각 저장소에 고유한 키를 사용할 수 있습니다. 에 대한 자세한 내용은 섹션을 AWS KMS참조하세요AWS Key Management Service.

  • 오프라인 저장소를 생성하는 경우:

    • Amazon S3 버킷을 만들지 아니면 기존 버킷을 사용할지 결정합니다. 기존 버킷을 사용하는 경우 Amazon S3 버킷 URL 또는 Amazon S3 버킷 이름 및 데이터세트 디렉터리 이름을 알아야 합니다(해당하는 경우).

    • IAM 역할을 지정하기 위해 사용할 Amazon 리소스 이름(ARN)을 선택합니다. 역할 및 연결된 정책을 찾는 방법에 대한 자세한 내용은 IAM 역할에 정책 추가 섹션을 참조하세요.

    • AWS Glue (기본값) 또는 Apache Iceberg 테이블 형식을 사용할지 여부를 결정합니다. 대부분의 경우, Apache Iceberg 테이블 형식을 사용합니다. 테이블 형식에 대한 자세한 내용은 SDK for Python (Boto3)을 이용한 특성 저장소 사용 섹션을 참조하세요.

콘솔을 사용하여 특성 그룹의 계보를 볼 수 있습니다. 콘솔에서 Feature Store 사용에 대한 지침은 기본 환경으로 Amazon SageMaker Studio를 활성화했는지 아니면 Amazon SageMaker Studio Classic을 활성화했는지에 따라 달라집니다.

  1. Amazon SageMaker Studio 출시의 지침에 따라 Studio 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 데이터를 선택하여 드롭다운 목록을 확장합니다.

  3. 드롭다운 목록에서 Feature Store(특성 저장소)를 선택합니다.

  4. Create feature group(특성 그룹 생성)을 선택합니다.

  5. Feature group details(특성 그룹 세부 정보)에서 특성 그룹 이름을 입력합니다.

  6. (선택 사항) 특성 그룹에 대한 설명을 입력합니다.

  7. 특성 그룹 스토리지 구성의 드롭다운 목록에서 스토리지 구성을 선택합니다. 스토리지 구성에 대한 자세한 내용은 특성 저장소 스토리지 구성 섹션을 참조하세요.

  8. 온라인 스토리지를 활성화하도록 선택한 경우:

    1. 온라인 스토리지 활성화하면 드롭다운 목록에서 스토리지 유형을 선택할 수 있습니다. 온라인 저장소 스토리지 유형에 대한 자세한 내용은 온라인 저장소 섹션을 참조하세요.

    2. (선택 사항) 스위치를 켜기로 전환하고 Time to Live 기간 값과 단위를 지정하여 Time to Live(TTL)를 적용합니다. 그러면 특성 그룹이 생성된 후 특성 그룹에 추가된 모든 레코드의 기본 TTL 기간이 업데이트됩니다. TTL에 대한 자세한 내용은 레코드의 TTL (Time to live) 기간 섹션을 참조하세요.

  9. 오프라인 스토리지를 활성화하도록 선택한 경우:

    1. Amazon S3 버킷 이름 아래에 새 버킷 이름을 입력하거나 기존 버킷 URL을 수동으로 입력합니다.

    2. Table format(테이블 형식) 드롭다운 목록에서 테이블 형식을 선택합니다. 대부분의 경우, Apache Iceberg 테이블 형식을 사용해야 합니다. 테이블 형식에 대한 자세한 내용은 SDK for Python (Boto3)을 이용한 특성 저장소 사용 섹션을 참조하세요.

    3. IAM 역할 ARN에서 이 특성 그룹에 연결할 IAM 역할 ARN을 선택합니다. 역할 및 연결된 정책을 찾는 방법에 대한 자세한 내용은 IAM 역할에 정책 추가 섹션을 참조하세요.

    4. 오프라인 스토리지 테이블 형식 및 AWS Glue (기본값) 테이블 형식을 활성화하도록 선택한 경우 데이터 카탈로그에서 다음 두 옵션 중 하나를 선택할 수 있습니다.

      • AWS Glue Data Catalog에 기본값을 사용합니다.

      • 기존 Data Catalog 이름, 테이블 이름 및 데이터베이스 이름을 제공하여 기존 AWS Glue Data Catalog를 확장합니다.

  10. 온라인 저장소 암호화 키 또는 오프라인 저장소 암호화 키 드롭다운 목록에서 다음 옵션 중 하나를 선택합니다.

    • AWS 관리형 사용 AWS KMS key (기본값)

    • AWS KMS key ARN을 입력하고 오프라인 스토어 암호화 AWS KMS 키 ARN 아래에 키 ARN을 입력합니다. 에 대한 자세한 내용은 AWS Key Management Service를 AWS KMS참조하세요.

  11. 해당하는 경우 처리량 모드를 선택할 수 있는 옵션이 있으며, 이는 요금이 청구되는 방식에 영향을 미칩니다. 처리량 모드의 드롭다운 목록에서 모드를 선택하고 사용 가능한 경우 읽기 및 쓰기 용량을 입력합니다. 처리량 모드를 적용할 수 있는 시기 및 용량 단위와 같은 처리량 모드에 대한 자세한 내용은 처리량 모드 섹션을 참조하세요.

  12. 필수 정보를 모두 지정했으면 계속 버튼을 사용할 수 있게 됩니다. Continue(계속)을 선택합니다.

  13. Specify feature definitions(특성 정의 지정)에는 특성에 대한 스키마를 제공하는 두 가지 옵션, 즉 JSON 편집기 또는 테이블 편집기가 있습니다.

    • JSON 편집기: JSON 탭에서 특성 정의를 JSON 형식으로 입력하거나 복사하여 붙여넣습니다.

    • 테이블 편집기: 테이블 탭에서 특성 이름을 입력하고 특성 그룹의 각 특성에 해당하는 데이터 유형을 선택합니다. 더 많은 특성을 포함하려면 + Add feature definitions(특성 정의 추가)를 선택합니다. 특성 그룹에서 특성 정의를 제거할 수 없다는 점에 유의하세요. 그러나 특성 그룹을 만든 후에 특성 정의를 추가하고 업데이트할 수 있습니다.

    특성 그룹에는 최소 레코드 식별자와 이벤트 시간을 나타내는 특성 두 개가 있어야 합니다.

    • 레코드 특성 유형은 문자열, 분수 또는 정수일 수 있습니다.

    • 이벤트 시간 특성 유형은 문자열 또는 분수여야 합니다. 하지만 Iceberg 테이블 형식을 선택한 경우 이벤트 시간은 문자열이어야 합니다.

  14. 특성이 모두 포함되면 계속을 선택합니다.

  15. 필수 특성 선택에서 레코드 식별자 및 이벤트 시간 특성을 지정해야 합니다. 레코드 식별자 특성 이름이벤트 시간 특성 이름 드롭다운 목록에서 각각 특성 이름을 선택하여 이 작업을 수행합니다.

  16. 레코드 식별자 특성과 이벤트 시간 특성을 선택한 후 계속을 선택합니다.

  17. (선택 사항) 특성 그룹에 태그를 추가하려면 새 태그 추가를 선택합니다. 그런 다음 아래에 각각 태그 키와 해당 값을 입력합니다.

  18. Continue(계속)을 선택합니다.

  19. Review feature group(특성 그룹 검토)에서 특성 그룹 정보를 검토합니다. 단계를 편집하려면 해당 단계에 해당하는 편집 버튼을 선택합니다. 그러면 편집을 위한 해당 단계로 이동합니다. 5단계로 돌아가려면 5단계로 돌아갈 때까지 Continue(계속)을 선택합니다.

  20. 특성 그룹 설정을 완료했으면 특성 그룹 만들기를 선택합니다.

    설정 중에 문제가 발생하면 페이지 하단에 문제 해결을 위한 팁과 함께 팝업 알림 메시지가 나타납니다. 충돌이 있는 단계에서 편집을 선택하여 이전 단계로 돌아가 문제를 해결할 수 있습니다.

    특성 그룹을 성공적으로 만든 경우 페이지 하단에 녹색 팝업 메시지가 나타납니다. 새 특성 그룹은 특성 그룹 카탈로그에도 표시됩니다.

콘솔에서 특성 그룹 세부 정보 보기

Feature Store에서 특성 그룹을 성공적으로 만들면 특성 그룹의 세부 정보를 볼 수 있습니다.

콘솔 또는 Amazon SageMaker Feature Store API를 사용하여 특성 그룹 세부 정보를 볼 수 있습니다. 콘솔을 통한 Feature Store 사용에 대한 지침은 기본 환경으로 Amazon SageMaker Studio를 활성화했는지 아니면 Amazon SageMaker Studio Classic을 활성화했는지에 따라 달라집니다.

  1. Amazon SageMaker Studio 출시의 지침에 따라 Studio 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 데이터를 선택하여 드롭다운 목록을 확장합니다.

  3. 드롭다운 목록에서 Feature Store(특성 저장소)를 선택합니다.

  4. (선택 사항) 특성 그룹을 보려면 내 계정을 선택합니다. 공유 특성 그룹을 보려면 교차 계정을 선택합니다.

  5. Feature group catalog(특성 그룹 카탈로그) 탭의 목록에서 특성 그룹 이름을 선택합니다. 그러면 특성 그룹 페이지가 열립니다.

  6. Features(특성) 탭에서 모든 특성 목록을 찾을 수 있습니다. 필터를 사용하여 목록을 구체화합니다. 세부 정보를 볼 특성을 선택합니다.

  7. 세부 정보 탭과 정보 하위 탭에서 특성 그룹 정보를 검토할 수 있습니다. 여기에는 최신 실행, 오프라인 스토리지 설정, 온라인 스토리지 설정 등이 포함됩니다.

  8. 세부 정보 탭과 태그 하위 탭에서 특성 그룹 태그를 검토할 수 있습니다. Add new tag(새 태그 추가)를 선택하여 새 태그를 추가하거나 Remove(제거)를 선택하여 태그를 제거합니다.

  9. 파이프라인 실행 탭에서 특성 그룹에 연결된 파이프라인 또는 파이프라인 실행을 볼 수 있습니다.

  10. 계보 탭에서 특성 그룹의 계보를 볼 수 있습니다.

콘솔에서 특성 그룹 업데이트

Feature Store에서 특성 그룹을 성공적으로 만들면 특성 그룹을 업데이트할 수 있습니다.

콘솔 또는 Amazon SageMaker Feature Store API를 사용하여 특성 그룹을 업데이트할 수 있습니다. 콘솔을 통한 Feature Store 사용에 대한 지침은 기본 환경으로 Amazon SageMaker Studio를 활성화했는지 아니면 Amazon SageMaker Studio Classic을 활성화했는지에 따라 달라집니다.

  1. Amazon SageMaker Studio 출시의 지침에 따라 Studio 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 데이터를 선택하여 드롭다운 목록을 확장합니다.

  3. 드롭다운 목록에서 Feature Store(특성 저장소)를 선택합니다.

  4. (선택 사항) 특성 그룹을 보려면 내 계정을 선택합니다. 공유 특성 그룹을 보려면 교차 계정을 선택합니다.

  5. Feature group catalog(특성 그룹 카탈로그) 탭의 목록에서 특성 그룹 이름을 검색하고 선택합니다. 그러면 특성 그룹 페이지가 열립니다.

  6. Update feature group(특성 그룹 업데이트)를 선택합니다.

  7. (선택 사항) 해당하는 경우 처리량 모드를 변경할 수 있으며, 이는 요금이 청구되는 방식에 영향을 미칩니다. 처리량 모드의 드롭다운 목록에서 모드를 선택하고 사용 가능한 경우 읽기 및 쓰기 용량을 입력합니다. 처리량 모드를 적용할 수 있는 시기 및 용량 단위와 같은 처리량 모드에 대한 자세한 내용은 처리량 모드 섹션을 참조하세요.

  8. (선택 사항) 특성 그룹이 온라인 저장소를 사용하는 경우 기본 Time to Live (TTL)를 업데이트할 수 있습니다. 특성 그룹에 TTL이 활성화되지 않은 경우 Time to Live (TTL) 아래의 전환 버튼을 켜기로 바꿉니다. TTL 값과 단위는 Time to Live duration(유지 시간)에서 지정할 수 있습니다. 그러면 특성 그룹이 업데이트된 후 특성 그룹에 추가된 모든 레코드의 기본 TTL이 업데이트됩니다.

  9. (선택 사항) 특성 그룹에 특성 정의를 추가할 수 있지만 특성 그룹에서 특성 정의를 제거할 수는 없다는 점에 유의하세요. 특성 정의를 추가하려면 + 특성 정의 추가를 선택한 다음 이름 열에서 새 특성 정의 이름을 지정하고 특성 유형 열에서 특성 유형을 선택합니다.

  10. Save changes(변경 사항 저장)를 선택합니다.

  11. 확인을 선택해 변경 사항을 확정합니다.

콘솔에서 파이프라인 실행 보기

파이프라인 실행에서 특성 또는 특성 그룹에 대한 최신 파이프라인 실행 정보를 볼 수 있습니다. 파이프라인, 실행, 코드 및 기타 유용한 실행 정보에 대한 링크를 가져올 수도 있습니다.

콘솔을 사용하여 파이프라인 실행을 볼 수 있습니다. 콘솔을 통한 Feature Store 사용에 대한 지침은 기본 환경으로 Amazon SageMaker Studio를 활성화했는지 아니면 Amazon SageMaker Studio Classic을 활성화했는지에 따라 달라집니다.

  1. Amazon SageMaker Studio 출시의 지침에 따라 Studio 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 데이터를 선택하여 드롭다운 목록을 확장합니다.

  3. 드롭다운 목록에서 Feature Store(특성 저장소)를 선택합니다.

  4. (선택 사항) 특성 그룹을 보려면 내 계정을 선택합니다. 공유 특성 그룹을 보려면 교차 계정을 선택합니다.

  5. 파이프라인 실행을 보려는 특성 그룹 또는 특성을 선택합니다.

  6. Pipeline executions(파이프라인 실행) 탭을 선택합니다.

  7. Select a pipeline(파이프라인 선택) 드롭다운 목록에서 파이프라인을 검색합니다.

  8. 파이프라인, 실행 및 코드 세부 정보에 대한 링크를 볼 수 있습니다. 실행 소유자, 상태, 날짜 및 기간도 볼 수 있습니다.

콘솔에서 계보 보기

특성 그룹의 계보를 볼 수 있습니다. 계보에는 특성 처리 워크플로의 실행 코드, 사용된 데이터 소스, 이러한 데이터 소스가 특성 그룹 또는 특성에 수집되는 방식에 대한 정보가 포함됩니다.

콘솔을 사용하여 특성 그룹의 계보를 볼 수 있습니다. 콘솔을 통한 Feature Store 사용에 대한 지침은 기본 환경으로 Amazon SageMaker Studio를 활성화했는지 아니면 Amazon SageMaker Studio Classic을 활성화했는지에 따라 달라집니다.

  1. Amazon SageMaker Studio 출시의 지침에 따라 Studio 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 데이터를 선택하여 드롭다운 목록을 확장합니다.

  3. 드롭다운 목록에서 Feature Store(특성 저장소)를 선택합니다.

  4. (선택 사항) 특성 그룹을 보려면 내 계정을 선택합니다. 공유 특성 그룹을 보려면 교차 계정을 선택합니다.

  5. 특성 그룹 또는 특성을 선택하여 계보 세부 정보를 봅니다.

  6. Lineage(계보) 탭을 선택합니다.

  7. 특성 그룹 또는 파이프라인 노드를 선택하여 노드를 확장합니다. 여기에는 특성 그룹 또는 파이프라인에 대한 자세한 내용이 포함되어 있습니다.

  8. 화면 왼쪽 아래에 있는 버튼을 사용하여 계보 그래프를 확대, 축소 또는 재배치할 수 있습니다.

  9. 화면을 선택하고 드래그하면 계보 맵을 이동할 수 있습니다. 노드를 초점으로 사용하여 계보 맵을 이동하려면 Tab 또는 Shift+Tab을 눌러 노드 간에 전환할 수 있습니다.

  10. 해당하는 경우 계보 업스트림(왼쪽, 이전) 또는 다운스트림(오른쪽, 최신)을 탐색할 수 있습니다. 노드를 선택한 다음 업스트림 계보 쿼리 또는 다운스트림 계보 쿼리를 선택하여 이 작업을 수행합니다.