RegEx 데이터 포맷 - AWS Data Pipeline

AWS Data Pipeline 신규 고객은 더 이상 이용할 수 없습니다. 의 기존 고객 AWS Data Pipeline 정상적으로 서비스를 계속 사용할 수 있습니다. 자세히 알아보기

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

RegEx 데이터 포맷

정규식에 의해 정의된 사용자 지정 데이터 형식입니다.

다음은 이 객체 유형의 예제입니다.

{ "id" : "MyInputDataType", "type" : "RegEx", "inputRegEx" : "([^ ]*) ([^ ]*) ([^ ]*) (-|\\[[^\\]]*\\]) ([^ \"]*|\"[^\"]*\") (-|[0-9]*) (-|[0-9]*)(?: ([^ \"]*|\"[^\"]*\") ([^ \"]*|\"[^\"]*\"))?", "outputFormat" : "%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s", "column" : [ "host STRING", "identity STRING", "user STRING", "time STRING", "request STRING", "status STRING", "size STRING", "referer STRING", "agent STRING" ] }

구문

선택 필드 설명 슬롯 유형
이 데이터 노드가 설명하는 데이터의 필드별로 지정된 데이터 형식이 있는 열 이름입니다. 예: 호스트 이름 STRING 여러 값의 경우 열 이름과 데이터 유형을 공백으로 구분하여 사용하십시오. String
inputRegEx S3 입력 파일을 파싱하기 위한 정규 표현식입니다. inputRegEx 파일에 있는 비교적 구조화되지 않은 데이터에서 열을 검색하는 방법을 제공합니다. String
outputFormat Java 포맷터 구문을 사용하여 %1$s %2$s에서 검색되지만 참조되는 열 필드입니다. inputRegEx String
parent 슬롯을 상속할 현재 객체의 부모입니다. 참조 객체, 예: “부모”: {"ref”:” Id "} myBaseObject

실행 시간 필드 설명 슬롯 유형
@version 객체와 함께 생성된 파이프라인 버전입니다. String

시스템 필드 설명 슬롯 유형
@오류 잘못 형성된 객체를 설명하는 오류 String
@pipelineId 이 객체가 속하는 파이프라인의 ID String
@sphere 객체의 타원 무늬는 수명 주기 내 위치를 나타냅니다. Component Objects는 Attempt Objects를 실행하는 Instance Objects를 야기합니다. String