쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

데이터 준비

포커스 모드
데이터 준비 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

참고

이전에는 Amazon SageMaker Data Wrangler가 SageMaker Studio Classic 경험에 포함되어 있었습니다. 이제 새 Studio 경험으로 업데이트하는 경우 SageMaker Canvas를 사용하여 Data Wrangler에 액세스하고 최신 기능 업데이트를 받아야 합니다. 지금까지 Studio Classic에서 Data Wrangler를 사용하고 Canvas의 Data Wrangler로 마이그레이션하려는 경우 Canvas 애플리케이션을 만들고 사용할 수 있도록 추가 권한을 부여해야 할 수 있습니다. 자세한 내용은 (선택 사항) Studio Classic의 Data Wrangler에서 SageMaker Canvas로 마이그레이션 섹션을 참조하세요.

Studio Classic의 Data Wrangler에서 데이터 흐름을 마이그레이션하는 방법을 알아보려면 (선택 사항) Studio Classic에서 Studio로 데이터 마이그레이션 섹션을 참조하세요.

Amazon SageMaker Canvas의 Amazon SageMaker Data Wrangler를 사용하여 데이터를 준비, 특성화 및 분석할 수 있습니다. 사용자는 Data Wrangler 데이터 준비 플로우를 기계 학습(ML) 워크플로에 통합하여 코딩을 거의 또는 전혀 사용하지 않고도 데이터 사전 처리 및 특성 추출을 단순화하고 간소화할 수 있습니다. 나만의 Python 스크립트와 변환을 추가하여 워크플로를 사용자 지정할 수도 있습니다.

  • 데이터 플로우 - 데이터 플로우를 생성하여 일련의 ML 데이터 준비 단계를 정의합니다. 사용자는 플로우를 사용하여 다양한 데이터 소스의 데이터세트를 결합하고, 데이터세트에 적용할 변환의 수와 유형을 식별하고, ML 파이프라인에 통합할 수 있는 데이터 준비 워크플로를 정의할 수 있습니다.

  • 변환 - 문자열, 벡터, 숫자 데이터 형식 지정 도구와 같은 표준 변환을 사용하여 데이터세트를 정리하고 변환합니다. 텍스트, 날짜/시간 임베딩, 범주형 인코딩과 같은 변환을 사용하여 데이터를 특징화할 수 있습니다.

  • 데이터 인사이트 생성 - Data Wrangler 데이터 품질 및 인사이트 보고서를 사용하여 데이터 품질을 자동으로 확인하고 데이터의 이상 항목을 감지합니다.

  • 분석 - 플로우의 어느 시점에서든 데이터세트의 특징을 분석할 수 있습니다. Data Wrangler에는 산점 및 히스토그램과 같은 기본 제공 데이터 시각화 도구뿐만 아니라 대상 누 분석 및 특징 상관 관계를 파악하기 위한 빠른 모델링과 같은 데이터 분석 도구가 포함되어 있습니다.

  • 내보내기 - 데이터 준비 워크플로를 다른 위치로 내보냅니다. 다음은 예제 위치입니다.

    • Amazon Simple Storage Service(S3) 버킷

    • Amazon SageMaker Feature Store - 기능과 해당 데이터를 중앙 집중식 스토어에 저장합니다.

  • 데이터 준비 자동화 - 데이터 흐름에서 기계 학습 워크플로를 만듭니다.

    • Amazon SageMaker 파이프라인 - SageMaker AI 데이터 준비, 모델 훈련 및 모델 배포 작업을 관리하는 워크플로를 구축합니다.

    • 직렬 추론 파이프라인 - 데이터 흐름에서 직렬 추론 파이프라인을 만듭니다. 이를 사용하여 새 데이터를 예측합니다.

    • Python 스크립트 - 사용자 지정 워크플로를 위해 데이터와 해당 변환을 Python 스크립트에 저장합니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.