릴리스 정보 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

릴리스 정보

Data Wrangler는 새 기능과 버그 수정으로 정기적으로 업데이트됩니다. Studio Classic에서 사용 중인 Data Wrangler의 버전을 업그레이드하려면 의 지침을 따르세요Studio Classic 앱 종료 및 업데이트.

릴리스 정보

8/31/2023

새로운 기능:

이제 전체 데이터 세트에 대한 데이터 품질 및 인사이트 보고서를 만들 수 있습니다. 자세한 내용은 데이터 및 데이터 품질에 대한 인사이트 확보 단원을 참조하십시오.

5/20/2023

새로운 기능:

이제 Salesforce 데이터 클라우드에서 데이터를 가져올 수 있습니다. 자세한 내용은 Salesforce 데이터 클라우드에서 데이터를 가져옵니다. 단원을 참조하십시오.

4/18/2023

새로운 기능:

이제 Amazon Personalize가 해석할 수 있는 형식으로 데이터를 가져올 수 있습니다. 자세한 내용은 Amazon Personalize용 행 매핑 단원을 참조하십시오.

3/1/2023

새로운 기능:

이제 Hive를 사용하여 Amazon 에서 데이터를 가져올 수 있습니다EMR. 자세한 내용은 Amazon에서 데이터 가져오기 EMR 단원을 참조하십시오.

12/10/2022

새로운 기능:

이제 Data Wrangler 플로우를 추론 엔드포인트로 내보낼 수 있습니다. 자세한 내용은 추론 엔드포인트로 내보내기 단원을 참조하십시오.

새로운 기능:

이제 대화형 노트북 위젯을 사용하여 데이터를 준비할 수 있습니다. 자세한 내용은 Amazon SageMaker Studio Classic 노트북에서 대화형 데이터 준비 위젯을 사용하여 데이터 인사이트 가져오기 단원을 참조하십시오.

새로운 기능:

이제 SaaS 플랫폼에서 데이터를 가져올 수 있습니다. 자세한 내용은 서비스형 소프트웨어(SaaS) 플랫폼에서 데이터 가져오기 단원을 참조하십시오.

10/12/2022

새로운 기능:

이제 다양한 데이터 세트에 대해 데이터 플로우를 재사용할 수 있습니다. 자세한 내용은 다양한 데이터 세트에 데이터 흐름 재사용 단원을 참조하십시오.

10/05/2022

새로운 기능:

이제 보안 주체 구성 요소 분석(PCA)을 변환으로 사용할 수 있습니다. 자세한 내용은 데이터 세트 내 차원 축소 단원을 참조하십시오.

10/05/2022

새로운 기능:

이제 Data Wrangler 플로우에서 파라미터를 재구성할 수 있습니다. 자세한 내용은 내보내기 단원을 참조하십시오.

10/03/2022

새로운 기능:

이제 Data Wrangler 플로우에서 모델을 배포할 수 있습니다. 자세한 내용은 데이터 플로우에서 모델 자동 훈련하기 단원을 참조하십시오.

9/20/2022

새로운 기능:

이제 Athena에서 데이터 보존 기간을 설정할 수 있습니다. 자세한 내용은 Athena에서 데이터 가져오기 단원을 참조하십시오.

6/9/2022

새로운 기능:

이제 Amazon SageMaker Autopilot을 사용하여 Data Wrangler 흐름에서 직접 모델을 훈련할 수 있습니다. 자세한 내용은 데이터 플로우에서 모델 자동 훈련하기 단원을 참조하십시오.

5/6/2022

새로운 기능:

이제 m5 및 r5 인스턴스를 추가로 사용할 수 있습니다. 자세한 내용은 인스턴스 단원을 참조하십시오.

4/27/2022

새로운 기능:

4/1/2022

새로운 기능:

이제 Databricks를 데이터 소스로 사용할 수 있습니다. 자세한 내용은 Databricks에서 데이터 가져오기(JDBC) 단원을 참조하십시오.

2/2/2022

새로운 기능:

  • 이제 대상 노드를 사용하여 내보낼 수 있습니다. 자세한 내용은 내보내기 단원을 참조하세요.

  • ORC 및 JSON 파일을 가져올 수 있습니다. 파일 형식에 대한 추가 정보는 가져오기을 참조하세요.

  • 이제 Data Wrangler는 SMOTE 변환 사용을 지원합니다. 자세한 내용은 데이터 균형화 단원을 참조하십시오.

  • Data Wrangler는 이제 범주형 데이터에 대한 유사성 인코딩을 지원합니다. 자세한 내용은 유사성 인코딩 단원을 참조하십시오.

  • 이제 Data Wrangler는 중첩 해제 JSON 데이터를 지원합니다. 자세한 내용은 중첩 해제 JSON 데이터 단원을 참조하십시오.

  • Data Wrangler는 이제 배열 값을 별도의 열로 확장할 수 있도록 지원합니다. 자세한 내용은 배열 분해 단원을 참조하십시오.

  • Data Wrangler는 이제 문제가 있을 때 서비스 팀에 연락할 수 있도록 지원합니다. 자세한 내용은 문제 해결 단원을 참조하십시오.

  • Data Wrangler는 데이터 플로우의 편집 및 삭제 단계를 지원합니다. 자세한 내용은 데이터 흐름에서 한 단계 삭제Data Wrangler 플로우에서 단계 편집 단원을 참조하세요.

  • 이제 여러 열에서 변형을 수행할 수 있습니다. 자세한 내용은 데이터 변환하기 단원을 참조하십시오.

  • Data Wrangler는 이제 비용 할당 태그를 지원합니다. 자세한 내용은 비용 할당 태그 사용하기를 참조하세요.

10/16/2021

새로운 기능:

Data Wrangler는 이제 Athena 워크그룹을 지원합니다. 자세한 내용은 Athena에서 데이터 가져오기 단원을 참조하십시오.

10/6/2021

새로운 기능:

Data Wrangler는 이제 시계열 데이터 변환을 지원합니다. 자세한 내용은 시계열 변환 단원을 참조하십시오.

7/15/2021

새로운 기능:

  • 이제 Snowflake 및 Data Wrangler을 지원합니다. 사용자는 Data Wrangler에서 Snowflake를 데이터 소스로 사용할 수 있습니다.

  • 에 사용자 지정 필드 구분 기호에 대한 지원이 추가되었습니다CSV. 이제 쉼표, 콜론, 세미콜론, 파이프 (|) 및 탭을 지원합니다.

  • 이제 결과를 Amazon S3로 직접 내보낼 수 있습니다.

  • 분산 인플레이션 요인, 보안 주체 구성 요소 분석, 라쏘 기능 선택과 같은 몇 가지 새로운 다중 공선성 분석기가 추가되었습니다.

개선 사항:

  • 분석 차트는 더 이상 겹치는 레이블로 채워질 수 없습니다.

버그 수정:

  • 원-핫 인코더가 비어 있는 문자열을 정상적으로 처리합니다.

  • 데이터프레임 열 이름에 점이 포함되어 있을 때 발생하는 충돌을 수정했습니다.

4/26/2021

개선 사항:

  • 분산형 처리 작업에 대한 지원이 추가되었습니다. 사용자는 처리 작업을 실행할 때 여러 인스턴스를 사용할 수 있습니다.

  • 이제 Data Wrangler 프로세싱 작업은 예상 결과 크기가 1GB 미만인 경우 작은 출력을 자동으로 병합합니다.

  • 특성 저장소 노트북: 피처 스토어 수집 성능 개선

  • 이제 Data Wrangler 프로세싱 작업은 향후 릴리스에서 1.x를 신뢰할 수 있는 컨테이너 태그로 사용합니다.

버그 수정:

  • 패싯된 히스토그램의 렌더링 문제를 수정했습니다.

  • 처리 작업으로 내보내기가 벡터 유형 열을 지원하도록 수정했습니다.

  • 정규 표현식 또는 정규식에 하나 이상의 그룹이 있는 경우 Extract using regex 연산자가 첫 번째로 캡처된 그룹을 반환하도록 수정했습니다.

2/8/2021

새로운 기능:

  • Data Wrangler 플로우는 여러 인스턴스를 지원합니다.

  • 2.20.0을 사용하도록 SageMaker SDK 데이터 랭글러로 내보내기 작업 노트북을 업데이트했습니다.

  • 2.20.0을 사용하도록 SageMaker SDK 파이프라인 노트북으로 내보내기를 업데이트했습니다.

  • 파이프라인 노트북으로 내보내기를 업데이트하여 선택적 단계로 XGBoost 훈련 예제를 추가했습니다.

개선 사항:

  • 성능을 개선하기 위해 단일 필드에 여러 줄이 포함된 CSV 파일 가져오기는 더 이상 지원되지 않습니다.

버그 수정:

  • 빠른 모델의 유형 추론 문제를 수정했습니다.

  • 편향 보고서의 편향 지표 버그를 수정했습니다.

  • 특성화 텍스트 변환이 누락된 값이 있는 열에서도 작동하도록 수정했습니다.

  • 히스토그램 및 산점도 내장 시각화가 배열과 유사한 열을 포함하는 데이터 세트에서 작동하도록 수정했습니다.

  • 이제 쿼리 실행 ID가 만료된 경우 Athena 쿼리가 다시 실행됩니다.