Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Mappatura dei campi delle fonti di dati
Amazon Kendra i connettori di origine dati possono mappare i campi del documento o del contenuto dall'origine dati ai campi Amazon Kendra dell'indice. Per impostazione predefinita, ogni connettore è progettato per eseguire la scansione di campi di origine dati specifici. I campi delle sorgenti dati predefiniti e le relative proprietà non possono essere modificati o personalizzati. Sulla Amazon Kendra console, i campi e le proprietà dei campi predefiniti che non possono essere modificati sono visualizzati in grigio.
Amazon Kendra i connettori consentono inoltre di mappare campi di documento o contenuto personalizzati dalla fonte di dati ai campi personalizzati dell'indice. Ad esempio, se nella fonte dati è presente un campo chiamato «reparto» che contiene informazioni sul reparto per un documento, è possibile mapparlo a un campo indice chiamato «Dipartimento». In questo modo, puoi utilizzare il campo per interrogare i documenti.
Puoi anche mappare campi Amazon Kendra riservati o comuni come_created_at
. Se la tua fonte di dati ha un campo chiamato «creation_date», puoi mapparlo al campo Amazon Kendra riservato equivalente chiamato. _created_at
Per ulteriori informazioni sui campi Amazon Kendra riservati, consulta Attributi o campi del documento.
Puoi mappare i campi per la maggior parte delle fonti di dati. È possibile creare mappature dei campi per le seguenti fonti di dati:
-
Adobe Experience Manager
-
Alfresco
-
Aurora (MySQL)
-
Aurora (PostgreSQL)
-
Amazon FSx (Windows)
-
Amazon FSx (NetApp SU TAP)
-
Amazon RDS/Aurora
-
Amazon RDS (Microsoft SQL Server)
-
Amazon RDS (MySQL)
-
Amazon RDS (Oracle)
-
Amazon RDS (PostgreSQL)
-
Amazon Kendra Web crawler
-
Amazon WorkDocs
-
Box (Cubo)
-
Confluence
-
Dropbox
-
Drupal
-
GitHub
-
Unità Google Workspace
-
Gmail
-
IBM DB2
-
Jira
-
Microsoft Exchange
-
Microsoft OneDrive
-
Microsoft SharePoint
-
Microsoft Teams
-
Microsoft SQL Server
-
Microsoft Yammer
-
MySQL
-
Oracle Database
-
PostgreSQL
-
battuta
-
Salesforce
-
ServiceNow
-
Slack
-
Zendesk
Se memorizzi i tuoi documenti in un bucket S3 o in una fonte di dati S3, specifichi i campi utilizzando un file di metadati JSON. Per ulteriori informazioni, consulta S3 Data Source Connector.
La mappatura dei campi della sorgente dati su un campo indice è un processo in tre fasi:
-
Creare un indice. Per ulteriori informazioni, vedere Creazione di un indice.
-
Aggiorna l'indice per aggiungere campi.
-
Crea una fonte di dati e includi le mappature dei campi per mappare i campi riservati e qualsiasi campo personalizzato per Amazon Kendra indicizzare i campi.
Per aggiornare l'indice e aggiungere campi personalizzati, utilizza la console per modificare le mappature dei campi dell'origine dati e aggiungere un campo personalizzato o utilizzare l'API. UpdateIndex Puoi aggiungere un totale di 500 campi personalizzati al tuo indice.
Per le origini dati del database, se il nome della colonna del database corrisponde al nome di un campo riservato, il campo e la colonna vengono mappati automaticamente.
Con l'UpdateIndexAPI, aggiungi campi riservati e personalizzati utilizzandoDocumentMetadataConfigurationUpdates
.
Il seguente esempio JSON utilizza DocumentMetadataConfigurationUpdates
l'aggiunta di un campo chiamato «Dipartimento» all'indice.
"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]
Quando crei il campo, hai la possibilità di impostare il modo in cui il campo viene utilizzato per la ricerca. È possibile scegliere tra le seguenti opzioni:
-
Visualizzabile: determina se il campo viene restituito nella risposta alla query. Il valore predefinito è
true
. -
Facetable: indica che il campo può essere utilizzato per creare sfaccettature. Il valore predefinito è
false
. -
Ricercabile: determina se il campo viene utilizzato nella ricerca. L'impostazione predefinita è
true
per i campi stringa efalse
per i campi numero e data. -
Ordinabile: indica che il campo può essere utilizzato per ordinare la risposta di una query. Può essere impostato solo per i campi di data, numero e stringa. Non può essere impostato per i campi dell'elenco di stringhe.
Il seguente esempio JSON utilizza l'aggiunta DocumentMetadataConfigurationUpdates
di un campo chiamato «Department» all'indice e lo contrassegna come facetable.
"DocumentMetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE", "Search": { "Facetable": true } } ]
Utilizzo di campi di Amazon Kendra documento riservati o comuni
Con l'UpdateIndex API, è possibile creare campi riservati o comuni utilizzando DocumentMetadataConfigurationUpdates
e specificando il nome del campo indice Amazon Kendra
riservato da mappare all'attributo/nome di campo equivalente del documento. Puoi anche creare campi personalizzati. Se utilizzi un connettore di origine dati, la maggior parte include mappature di campi che mappano i campi del documento di origine dati ai campi Amazon Kendra indice. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati.
Puoi configurare l'Search
oggetto per impostare un campo come visualizzabile, personalizzabile, ricercabile e ordinabile. È possibile configurare l'Relevance
oggetto in modo da impostare l'ordine di classificazione, la durata dell'incremento o il periodo di tempo di un campo da applicare al valore di potenziamento, freschezza, importanza e ai valori di importanza mappati a valori di campo specifici. Se utilizzi la console, puoi configurare le impostazioni di ricerca per un campo selezionando l'opzione facet nel menu di navigazione. Per impostare l'ottimizzazione della pertinenza, seleziona l'opzione di ricerca nell'indice nel menu di navigazione, inserisci una query e utilizza le opzioni del pannello laterale per ottimizzare la pertinenza della ricerca. Non è possibile modificare il tipo di campo dopo averlo creato.
Amazon Kendra contiene i seguenti campi di documento riservati o comuni che è possibile utilizzare:
-
_authors
—Un elenco di uno o più autori responsabili del contenuto del documento. -
_category
—Una categoria che colloca un documento in un gruppo specifico. -
_created_at
—La data e l'ora in formato ISO 8601 in cui è stato creato il documento. Ad esempio, 2012-03-25T12:30:10+01:00 è il formato data/ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nel fuso orario dell'Europa centrale (CET). -
_data_source_id
—L'identificatore della fonte di dati che contiene il documento. -
_document_body
—Il contenuto del documento. -
_document_id
—Un identificatore univoco per il documento. -
_document_title
—Il titolo del documento. -
_excerpt_page_number
—Il numero di pagina in un file PDF in cui viene visualizzato l'estratto del documento. Se l'indice è stato creato prima dell'8 settembre 2020, è necessario reindicizzare i documenti prima di poter utilizzare questo attributo. -
_faq_id
—Se si tratta di un documento di tipo domanda-risposta (FAQ), un identificatore univoco per le domande frequenti. -
_file_type
—Il tipo di file del documento, ad esempio pdf o doc. -
_last_updated_at
—La data e l'ora in formato ISO 8601 dell'ultimo aggiornamento del documento. Ad esempio, 2012-03-25T12:30:10+01:00 è il formato data/ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nel fuso orario dell'Europa centrale (CET). -
_source_uri
—L'URI in cui è disponibile il documento. Ad esempio, l'URI del documento sul sito Web di un'azienda. -
_version
—Un identificatore per la versione specifica di un documento. -
_view_count
—Il numero di volte in cui il documento è stato visualizzato. -
_language_code
(String) —Il codice per una lingua che si applica al documento. Il valore predefinito è l'inglese se non si specifica una lingua. Per ulteriori informazioni sulle lingue supportate, compresi i relativi codici, consulta Aggiungere documenti in lingue diverse dall'inglese.
Per i campi personalizzati, puoi creare questi campi utilizzando DocumentMetadataConfigurationUpdates
l'UpdateIndex
API, proprio come quando crei un campo riservato o comune. È necessario impostare il tipo di dati appropriato per il campo personalizzato. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati. Alcune fonti di dati non supportano l'aggiunta di nuovi campi o campi personalizzati. Non è possibile modificare il tipo di campo dopo averlo creato.
Di seguito sono riportati i tipi che è possibile impostare per i campi personalizzati:
-
Data
-
Numero
-
Stringa
-
Elenco stringhe
Se hai aggiunto documenti all'indice utilizzando l'BatchPutDocumentAPI, Attributes
elenca i campi/gli attributi dei tuoi documenti e crei campi utilizzando l'oggetto. DocumentAttribute
Per i documenti indicizzati da un'origine Amazon S3 dati, crei campi utilizzando un file di metadati JSON che include le informazioni sui campi.