레코드 일치 변환을 사용하여 기존 데이터 분류 변환을 간접적으로 호출 - AWS Glue

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

레코드 일치 변환을 사용하여 기존 데이터 분류 변환을 간접적으로 호출

이 변환은 기존 레코드 일치 기계 학습 데이터 분류 변환을 간접적으로 호출합니다.

변환은 레이블을 기반으로 훈련된 모델을 기준으로 현재 데이터를 평가합니다. 알고리즘 훈련에 따라 동등한 것으로 간주되는 항목 그룹에 각 행을 할당하기 위해 'match_id' 열이 추가됩니다. 자세한 내용은 Lake Formation FindMatches를 사용하는 레코드 일치를 참조하세요.

참고

시각적 작업에서 사용하는 AWS Glue의 버전은 레코드 일치 변환을 생성하기 위해 AWS Glue에서 사용하는 버전과 일치해야 합니다.

스크린샷에는 변환의 데이터 미리보기가 나와 있습니다.
작업 다이어그램에 레코드 일치 변환 노드를 추가하려면
  1. 리소스 패널을 열고 정규식 일치를 선택하여 작업 다이어그램에 새 변환을 추가합니다. 노드를 추가할 때 선택한 노드가 상위 노드가 됩니다.

  2. 노드 속성 패널에서 작업 다이어그램에 노드 이름을 입력할 수 있습니다. 노드 상위 항목이 아직 선택되지 않은 경우 [노드 상위 항목(Node parents)] 목록에서 변환의 입력 소스로 사용할 노드를 선택합니다.

  3. 변환 탭에서 기계 학습 변환 페이지로부터 가져온 ID를 입력합니다.

    스크린샷에는 기계 학습 변환 페이지의 ID가 나와 있습니다.
  4. (선택 사항) 변환 탭에서 신뢰도 점수를 추가하는 옵션을 확인할 수 있습니다. 추가 컴퓨팅 용량을 소모하여 모델은 각 일치에 대한 신뢰도 점수를 추가 열로 추정합니다.