Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
BDA offre funzionalità di normalizzazione che consentono di convertire e standardizzare i dati estratti in base ai requisiti specifici. Queste attività di normalizzazione possono essere classificate in Normalizzazione delle chiavi e Normalizzazione dei valori.
Normalizzazione delle chiavi
In molti casi, i campi del documento possono presentare variazioni nel modo in cui sono rappresentati o etichettati. Ad esempio, il campo «Numero di previdenza sociale» potrebbe apparire come «SSN», «Tax ID», «TIN» o altre varianti simili. Per affrontare questa sfida, BDA offre Key Normalization, che consente di fornire istruzioni sulle variazioni all'interno delle definizioni dei campi.
Sfruttando la normalizzazione delle chiavi, è possibile guidare BDA a riconoscere e mappare diverse rappresentazioni dello stesso campo su una chiave standardizzata. Questa funzionalità garantisce che i dati vengano estratti e organizzati in modo coerente, indipendentemente dalle variazioni presenti nei documenti di origine.
Campo | Istruzioni | Tipo di estrazione | Tipo |
---|---|---|---|
LastName |
Cognome o cognome della persona |
Esplicito |
Stringa |
BirthNum |
Numero del documento o numero del fascicolo del certificato di nascita |
Esplicito |
Stringa |
OtherIncome |
Altre entrate, incluso credito o rimborso d'imposta federale e statale sulla benzina o sul carburante |
Esplicito |
Numero |
BusinessName |
Nome dell'azienda, del contraente o dell'entità che compila il W9 |
Esplicito |
Stringa |
fattore di potenza |
Fattore di potenza o moltiplicatore utilizzato per questa voce di utilizzo |
Esplicito |
Stringa |
BirthPlace |
Nome dell'ospedale o dell'istituto in cui è nato il bambino |
Esplicito |
Stringa |
Causa della lesione |
Causa di infortunio o malattia professionale, anche in relazione al lavoro |
Esplicito |
Stringa |
Per i campi con set di valori o enumerazioni predefiniti, è possibile fornire i valori o gli intervalli previsti all'interno delle istruzioni di campo. Si consiglia di includere le variazioni tra virgolette come illustrato negli esempi.
Campo | Istruzioni | Tipo di estrazione | Tipo |
---|---|---|---|
LICENSE_CLASS |
Il codice della classe a lettera singola, uno tra «A», «B» o «C» |
Esplicito |
Stringa |
sesso |
Il sesso. Uno tra «M» o «F» |
Esplicito |
Stringa |
InformantType |
Il tipo di informazioni. Uno tra «Genitore» o «Altro» |
Esplicito |
Stringa |
CANALE DI RACCOLTA DI INFORMAZIONI |
UNO TRA I SEGUENTI: «INTERVISTA FACCIA A FACCIA», «INTERVISTA TELEFONICA», «FAX O POSTA», «E-MAIL O INTERNET» |
Esplicito |
Stringa |
Normalizzazione del valore
La normalizzazione del valore è un'attività chiave nelle pipeline di elaborazione dei dati, in cui i dati estratti devono essere trasformati in un formato coerente e standardizzato. Questo processo garantisce che i sistemi a valle possano utilizzare ed elaborare i dati senza interruzioni, senza problemi di compatibilità o ambiguità.
Utilizzando le funzionalità di normalizzazione di BDA, è possibile standardizzare i formati, convertire unità di misura e trasmettere valori in tipi di dati specifici.
Per le attività di normalizzazione dei valori, è necessario utilizzare il tipo di estrazione Inferred poiché il valore potrebbe non corrispondere esattamente al testo non elaborato o all'OCR del documento dopo la normalizzazione. Ad esempio, un valore di data come «25/06/2022" che richiede di essere formattato come «YYYY-MM-DD» verrà estratto come «25/06/2022" dopo la normalizzazione, quindi non corrisponde all'output OCR del documento.
Formati standardizzati: puoi convertire i valori in formati predefiniti, come codici abbreviati, schemi di numerazione o formati di data specifici. Ciò consente di garantire la coerenza nella rappresentazione dei dati aderendo agli standard di settore o alle convenzioni organizzative.
Campo | Istruzioni | Tipo di estrazione | Tipo |
---|---|---|---|
ssn |
Il SSN, formattato come XXX-XX-XXX |
Dedotto |
Stringa |
STATE |
Il codice a due lettere dello stato |
Dedotto |
Stringa |
DATA_SCADENZA |
La data di scadenza nel formato YYYY-MM-DD |
Dedotto |
Stringa |
DATA_DI_NASCITA |
La data di nascita del conducente nel formato YYYY-MM-DD |
Dedotto |
Stringa |
DATA_DI CONTROLLO |
La data in cui è stato firmato l'assegno. Riformatta in YYYY-MM-DD |
Dedotto |
Stringa |
PurchaseDate |
Data di acquisto del veicolo nel formato mm/dd/yy |
Dedotto |
Stringa |
Puoi anche convertire i valori in un'unità di misura standard o in un tipo di dati specifico gestendo scenari come Non applicabile.
Campo | Istruzioni | Tipo di estrazione | Tipo |
---|---|---|---|
PESO |
Peso convertito in libbre |
Dedotto |
Numero |
ALTEZZA |
Altezza convertita in pollici |
Dedotto |
Numero |
piani_redditi non qualificati |
Il valore nel campo 11. 0 è N/A. |
Dedotto |
Numero |