기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
BDA를 사용하면 블루프린트를 생성할 때 문서에서 추출하려는 특정 데이터 필드를 정의할 수 있습니다. 이는 BDA가 어떤 정보를 찾고 어떻게 해석할지 안내하는 일련의 지침 역할을 합니다.
필드 정의
시작하려면 employee_id 또는 product_name과 같이 추출이 필요한 각 필드에 대한 속성을 생성할 수 있습니다. 각 필드에 대해 설명, 데이터 유형 및 추론 유형을 제공해야 합니다.
추출할 필드를 정의하려면 다음 파라미터를 지정해야 합니다.
-
필드 이름: 필드가 나타내는 내용에 대한 사람이 읽을 수 있는 설명을 제공합니다. 이 설명은 필드의 컨텍스트와 목적을 이해하는 데 도움이 되며 데이터를 정확하게 추출하는 데 도움이 됩니다.
-
지침: 필드가 나타내는 내용에 대한 자연어 설명을 제공합니다. 이 설명은 필드의 컨텍스트와 목적을 이해하는 데 도움이 되며 데이터를 정확하게 추출하는 데 도움이 됩니다.
-
유형: 필드 값의 데이터 유형을 지정합니다. BDA는 다음 데이터 형식을 지원합니다.
-
문자열: 텍스트 기반 값의 경우
-
number: 숫자 값의 경우
-
부울: true/false 값의 경우
-
배열: 동일한 유형의 여러 값을 가질 수 있는 필드의 경우(예: 문자열 배열 또는 숫자 배열)
-
-
추론 유형: 필드 값의 추출을 처리하는 방법을 BDA에 지시합니다. 지원되는 추론 유형은 다음과 같습니다.
-
명시적: BDA는 문서에서 직접 값을 추출해야 합니다.
-
추론: BDA는 문서에 있는 정보를 기반으로 값을 추론해야 합니다.
-
다음은 모든 파라미터가 포함된 필드 정의의 예입니다.

이 예시에서는 다음이 적용됩니다.
-
유형은 문자열로 설정되어 product_name 필드의 값이 텍스트 기반이어야 함을 나타냅니다.
-
inferenceType은 명시적으로 설정되며, 변환 또는 검증 없이 문서에서 직접 값을 추출하도록 BDA에 지시합니다.
-
이 지침은 추가 컨텍스트를 제공하여 필드에 추가 세부 정보 없이 제품의 짧은 이름이 포함되어야 함을 명확히 합니다.
각 필드에 대해 이러한 파라미터를 지정하면 문서에서 원하는 데이터를 정확하게 추출하고 해석하는 데 필요한 정보를 BDA에 제공할 수 있습니다.
필드 | 지침 | 추출 유형 | 유형 |
---|---|---|---|
ApplicantsName |
신청자의 전체 이름 |
명시적 |
문자열 |
DateOfBirth |
직원 생년월일 |
명시적 |
문자열 |
영업 |
총 수신 또는 매출 |
명시적 |
숫자 |
문_시작_균형 |
기간 시작 시 잔액 |
명시적 |
숫자 |
다중 값 필드
필드에 여러 값이 포함될 수 있는 경우 배열 또는 테이블을 정의할 수 있습니다.
필드 목록
값 목록이 포함된 필드의 경우 배열 데이터 유형을 정의할 수 있습니다.
이 예제에서 "OtherExpenses"는 문자열 배열로 정의되어 BDA가 해당 필드에 대한 여러 비용 항목을 추출할 수 있습니다.

표
문서에 테이블 형식 데이터가 포함된 경우 스키마 내에서 테이블 구조를 정의할 수 있습니다.
이 예제에서 "SERVICES_TABLE"은 테이블 유형으로 정의되며, 제품 이름, 설명, 수량, 단가 및 금액과 같은 열 필드가 있습니다.

적절한 필드 설명, 데이터 형식 및 추론 유형을 사용하여 포괄적인 스키마를 정의하면 형식이나 표현의 차이에 관계없이 BDA가 문서에서 원하는 정보를 정확하게 추출할 수 있습니다.