건너뛴 행 오류 문제 해결 - Amazon QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

건너뛴 행 오류 문제 해결

데이터를 가져올 때 Amazon은 데이터의 일부를 QuickSight 미리 봅니다. 어떤 이유로든 행을 해석할 수 없는 경우 행을 QuickSight 건너뜁니다. 경우에 따라 가져오기가 실패합니다. 이 경우 는 실패를 설명하는 오류 메시지를 QuickSight 반환합니다.

다행히도 잘못될 수 있는 일의 수는 제한되어 있습니다. 다음과 같은 예를 알아두면 일부 문제를 피할 수 있습니다.

  • 필드의 데이터 형식과 필드 데이터 간의 불일치가 없는지 확인합니다(예: 간혹 데이터 형식이 숫자인 필드에 텍스트 데이터가 들어 있는 경우). 다음은 테이블 내용을 스캔할 때 감지하기 어려운 몇 가지 예입니다.

    • '' - 빈 문자열을 사용하여 누락된 값을 표시합니다.

    • 'NULL' - 단어 ‘null’을 사용하여 누락된 값을 표시합니다.

    • $1000 - 통화 값에 달러 기호를 포함하면 해당 값이 문자열로 바뀝니다.

    • 'O'Brien' - 구두점을 사용하여 문자열 자체에 동일한 구두점이 포함된 문자열을 표시합니다.

    하지만 이런 유형의 오류는 항상 찾기가 쉽지 않습니다. 특히 데이터가 많거나 데이터를 직접 입력한 경우에는 더욱 그렇습니다. 예를 들어, 일부 고객 서비스 또는 영업 애플리케이션에서는 고객이 구두로 제공한 정보를 입력해야 합니다. 원래 데이터를 입력한 사람이 데이터를 잘못된 필드에 입력했을 수 있습니다. 문자나 숫자를 추가했거나 추가하는 것을 잊어버렸을 수 있습니다. 예를 들어 날짜를 ‘0/10/12020’으로 입력하거나 연령을 나타내는 필드에 다른 사람의 성별을 입력할 수 있습니다.

  • 가져온 파일이 헤더가 있든 없든 올바르게 처리되었는지 확인합니다. 헤더 행이 있는 경우 헤더 포함 업로드 옵션을 선택했는지 확인합니다.

  • 데이터가 데이터 소스 할당량를 하나 이상 초과하지 않는지 확인합니다.

  • 데이터가 지원되는 데이터 형식 및 값와 호환되는지 확인합니다.

  • 계산된 필드가 계산된 필드에 있는 함수에 의해 호환되지 않거나 제외되지 않도록 계산에 사용할 수 있는 데이터를 포함했는지 확인합니다. 예를 들어 데이터 세트에 를 사용하는 계산된 필드가 있는 경우 해당 필드에 유효한 날짜가 포함되지 않은 행을 parseDate QuickSight 건너뜁니다.

QuickSight 는 에서 발생하는 오류의 세부 목록을 제공합니다.SPICE 엔진이 데이터를 수집하려고 시도합니다. 저장된 데이터 세트에서 건너뛴 행을 보고하면 오류를 확인하여 문제를 해결하기 위한 조치를 취할 수 있습니다.

에서 건너뛴 행에 대한 오류를 보려면 SPICE 수집(데이터 가져오기)
  1. 데이터 세트 페이지에서 문제가 있는 데이터 세트를 선택하여 엽니다.

  2. 열리는 데이터 세트 세부 정보 페이지에서 새로 고침 탭을 선택합니다.

    SPICE 수집 기록은 하단에 표시됩니다.

  3. 오류가 발생한 수집의 경우 오류 요약 보기를 선택합니다. 이 링크는 상태 열 아래에 있습니다.

  4. 열리는 파일 가져오기 로그를 살펴보세요. 다음과 같은 섹션이 표시됩니다.

    • 요약 - 가져오기에서 총 행 수 중 생략된 행 수에 대한 백분율 점수를 제공합니다. 예를 들어 총 1,728개 중 864개 행을 건너뛰면 점수는 50.00% 입니다.

    • 건너뛴 행 - 건너뛴 행과 유사한 각 행 세트에 대한 행 수, 필드 이름 및 오류 메시지를 제공합니다.

    • 문제 해결 - 오류 정보가 포함된 파일을 다운로드할 수 있는 링크를 제공합니다.

  5. 문제 해결에서 오류 행 파일 다운로드를 선택합니다.

    오류 파일에는 각 오류에 대한 행이 있습니다. 파일 이름이 error-report_123_fe8.csv로 지정되며, 여기서 123_fe8은 고유한 식별 문자열로 바뀝니다. 파일에는 다음 열이 포함되어 있습니다.

    • ERROR_TYPE – 이 행을 가져올 때 발생한 오류의 유형 또는 오류 코드입니다. 이 오류는 이 절차 다음에 나오는 SPICE 수집 오류 코드 섹션에서 찾아볼 수 있습니다.

    • COLUMN_NAME - 오류가 발생한 데이터의 열 이름입니다.

    • 가져온 행의 모든 열 - 나머지 열은 전체 데이터 행을 복제합니다. 행에 오류가 두 개 이상 있는 경우 이 파일에 오류가 여러 번 나타날 수 있습니다.

  6. 데이터 세트 편집을 선택하여 데이터 세트를 변경합니다. 데이터 필터링, 필드 생략, 데이터 유형 변경, 기존 계산된 필드 조정, 데이터를 검증하는 계산된 필드 추가를 할 수 있습니다.

  7. 오류 코드로 표시된 내용을 변경한 후에는 데이터를 다시 가져옵니다. 더 많은 경우 SPICE 수집 오류가 로그에 나타납니다. 이 절차를 다시 진행하여 나머지 오류를 모두 수정합니다.

작은 정보

데이터 세트 편집기를 사용하여 적절한 시간 내에 데이터 문제를 해결할 수 없는 경우 데이터를 소유한 관리자 또는 개발자에게 문의하세요. 장기적으로는 분석을 위해 데이터를 준비하는 동안 예외 처리를 추가하는 것보다 원본에 가까운 곳에서 데이터를 정리하는 것이 더 비용 효율적입니다. 데이터를 원본에서 수정하면 여러 사람이 서로 다른 방식으로 오류를 수정하여 나중에 보고 결과가 달라지는 상황을 피할 수 있습니다.

건너뛴 행의 문제 해결을 연습하려면
  1. CSV files for troubleshooting skipped rows.zip를 다운로드합니다.

  2. 샘플을 .csv 파일로 업로드하는 데 사용할 수 있는 폴더로 파일을 추출합니다QuickSight.

    zip 파일에는 다음의 두 텍스트 파일이 포함되어 있습니다.

    • sample dataset - data ingestion error.csv - 행을 건너뛰는 원인이 되는 문제가 포함된 샘플 .csv 파일입니다. 파일을 직접 가져와서 오류 프로세스의 작동 방식을 확인할 수 있습니다.

    • sample data ingestion error file – 에서 생성된 샘플 오류 파일 SPICE 샘플 .csv 파일을 로 가져오는 동안 수집. QuickSight

  3. 다음 단계에 따라 데이터를 가져옵니다.

    1. 데이터 세트, 새 데이터 세트를 선택합니다.

    2. [Upload a file]을 선택합니다.

    3. sample dataset - data ingestion error.csv으로 이름이 지정된 파일을 찾아 선택합니다.

    4. 파일 업로드, 설정 편집 및 데이터 준비를 선택합니다.

    5. 저장을 선택하여 종료합니다.

  4. 정보를 확인할 데이터 세트를 선택한 다음 오류 요약 보기를 선택합니다. 문제 해결에 도움이 되는 오류 및 데이터를 검토하세요.