Utilizzo di campi di Amazon Kendra documento riservati o comuni

Mappatura dei campi dell’origine dati

Amazon Kendra i connettori di origine dati possono mappare i campi del documento o del contenuto dall'origine dati ai campi Amazon Kendra dell'indice. Per impostazione predefinita, ogni connettore è progettato per eseguire la scansione di campi di origine dati specifici. I campi delle sorgenti dati predefiniti e le relative proprietà non possono essere modificati o personalizzati. Sulla Amazon Kendra console, i campi e le proprietà dei campi predefiniti che non possono essere modificati sono visualizzati in grigio.

Amazon Kendra i connettori consentono inoltre di mappare campi di documento o contenuto personalizzati dalla fonte di dati ai campi personalizzati dell'indice. Ad esempio, se nella fonte dati è presente un campo chiamato «reparto» che contiene informazioni sul reparto per un documento, è possibile mapparlo a un campo indice chiamato «Dipartimento». In questo modo, puoi utilizzare il campo per interrogare i documenti.

Puoi anche mappare campi Amazon Kendra riservati o comuni come_created_at. Se la tua fonte di dati ha un campo chiamato «creation_date», puoi mapparlo al campo Amazon Kendra riservato equivalente chiamato. _created_at Per ulteriori informazioni sui campi Amazon Kendra riservati, consulta Attributi o campi del documento.

Puoi mappare i campi per la maggior parte delle fonti di dati. È possibile creare mappature dei campi per le seguenti fonti di dati:

Adobe Experience Manager
Alfresco
Aurora (MySQL)
Aurora (PostgreSQL)
Amazon FSx (Windows)
Amazon FSx (NetApp SU TAP)
Amazon RDS/Aurora
Amazon RDS (Microsoft SQL Server)
Amazon RDS (MySQL)
Amazon RDS (Oracle)
Amazon RDS (PostgreSQL)
Amazon Kendra Web crawler
WorkDocs
Box
Confluenza
Dropbox
Drupal
GitHub
Unità Google Workspace
Gmail
IBM DB2
Jira
Microsoft Exchange
Microsoft OneDrive
Microsoft SharePoint
Microsoft Teams
Microsoft SQL Server
Microsoft Yammer
MySQL
Banca dati Oracle
PostgreSQL
Quip
Salesforce
ServiceNow
Slack
Zendesk

Se memorizzi i tuoi documenti in un bucket S3 o in una fonte di dati S3, specifichi i campi utilizzando un file di metadati JSON. Per ulteriori informazioni, consulta S3 Data Source Connector.

La mappatura dei campi della sorgente dati su un campo indice è un processo in tre fasi:

Creare un indice. Per ulteriori informazioni, vedere Creazione di un indice.
Aggiorna l'indice per aggiungere campi.
Crea una fonte di dati e includi le mappature dei campi per mappare i campi riservati e qualsiasi campo personalizzato per Amazon Kendra indicizzare i campi.

Per aggiornare l'indice e aggiungere campi personalizzati, utilizza la console per modificare le mappature dei campi dell'origine dati e aggiungere un campo personalizzato o utilizzare l'API. UpdateIndex Puoi aggiungere un totale di 500 campi personalizzati al tuo indice.

Per le origini dati del database, se il nome della colonna del database corrisponde al nome di un campo riservato, il campo e la colonna vengono mappati automaticamente.

Con l'UpdateIndexAPI, aggiungi campi riservati e personalizzati utilizzandoDocumentMetadataConfigurationUpdates.

Il seguente esempio JSON utilizza DocumentMetadataConfigurationUpdates per aggiungere un campo denominato “Department” all’indice.


"DocumentmetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE"
   }
]

Quando crei il campo, hai la possibilità di impostare il modo in cui il campo viene utilizzato per la ricerca. È possibile scegliere tra le seguenti opzioni:

Visualizzabile: determina se il campo viene restituito nella risposta alla query. Il valore predefinito è true.
Facetable: indica che il campo può essere utilizzato per creare sfaccettature. Il valore predefinito è false.
Ricercabile: determina se il campo viene utilizzato nella ricerca. L'impostazione predefinita è true per i campi stringa e false per i campi numero e data.
Ordinabile: indica che il campo può essere utilizzato per ordinare la risposta di una query. Può essere impostato solo per i campi di data, numero e stringa. Non può essere impostato per i campi dell'elenco di stringhe.

Il seguente esempio JSON utilizza l'aggiunta DocumentMetadataConfigurationUpdates di un campo chiamato «Department» all'indice e lo contrassegna come facetable.


"DocumentMetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE",
       "Search": {
           "Facetable": true
       }
   }
]

Utilizzo di campi di Amazon Kendra documento riservati o comuni

Con l'UpdateIndex API, puoi creare campi riservati o comuni utilizzando DocumentMetadataConfigurationUpdates e specificando il nome del campo indice Amazon Kendra riservato da mappare al attribute/field nome del documento equivalente. Puoi anche creare campi personalizzati. Se utilizzi un connettore di origine dati, la maggior parte include mappature di campi che mappano i campi del documento di origine dati ai campi Amazon Kendra indice. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati.

Puoi configurare l'Searchoggetto per impostare un campo come visualizzabile, personalizzabile, ricercabile e ordinabile. È possibile configurare l'Relevanceoggetto in modo da impostare l'ordine di classificazione, la durata dell'incremento o il periodo di tempo di un campo da applicare al valore di potenziamento, freschezza, importanza e ai valori di importanza mappati a valori di campo specifici. Se utilizzi la console, puoi configurare le impostazioni di ricerca per un campo selezionando l'opzione facet nel menu di navigazione. Per impostare l'ottimizzazione della pertinenza, seleziona l'opzione di ricerca nell'indice nel menu di navigazione, inserisci una query e utilizza le opzioni del pannello laterale per ottimizzare la pertinenza della ricerca. Non è possibile modificare il tipo di campo dopo averlo creato.

Amazon Kendra contiene i seguenti campi di documento riservati o comuni che è possibile utilizzare:

_authors—Un elenco di uno o più autori responsabili del contenuto del documento.
_category—Una categoria che colloca un documento in un gruppo specifico.
_created_at—La data e l'ora in formato ISO 8601 in cui è stato creato il documento. Ad esempio, 2012-03-25T12:30:10+01:00 è il formato data/ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nel fuso orario dell'Europa centrale (CET).
_data_source_id—L'identificatore della fonte di dati che contiene il documento.
_document_body—Il contenuto del documento.
_document_id—Un identificatore univoco per il documento.
_document_title—Il titolo del documento.
_excerpt_page_number—Il numero di pagina in un file PDF in cui viene visualizzato l'estratto del documento. Se l'indice è stato creato prima dell'8 settembre 2020, è necessario reindicizzare i documenti prima di poter utilizzare questo attributo.
_faq_id—Se si tratta di un documento di tipo domanda-risposta (FAQ), un identificatore univoco per le domande frequenti.
_file_type—Il tipo di file del documento, ad esempio pdf o doc.
_last_updated_at—La data e l'ora in formato ISO 8601 dell'ultimo aggiornamento del documento. Ad esempio, 2012-03-25T12:30:10+01:00 è il formato data/ora ISO 8601 per il 25 marzo 2012 alle 12:30 (più 10 secondi) nel fuso orario dell'Europa centrale (CET).
_source_uri—L'URI in cui è disponibile il documento. Ad esempio, l’URI del documento su un sito web aziendale.
_version—Un identificatore per la versione specifica di un documento.
_view_count—Il numero di volte in cui il documento è stato visualizzato.
_language_code(String) —Il codice per una lingua che si applica al documento. Il valore predefinito è l'inglese se non si specifica una lingua. Per ulteriori informazioni sulle lingue supportate, compresi i relativi codici, consulta Aggiungere documenti in lingue diverse dall'inglese.

Per i campi personalizzati, puoi creare questi campi utilizzando DocumentMetadataConfigurationUpdates l'UpdateIndexAPI, proprio come quando crei un campo riservato o comune. È necessario impostare il tipo di dati appropriato per il campo personalizzato. Se utilizzi la console, aggiorni i campi selezionando l'origine dati, selezionando l'azione di modifica e quindi procedendo accanto alla sezione delle mappature dei campi per configurare l'origine dati. Alcune fonti di dati non supportano l'aggiunta di nuovi campi o campi personalizzati. Non è possibile modificare il tipo di campo dopo averlo creato.

Di seguito sono riportati i tipi che è possibile impostare per i campi personalizzati:

Data
Numero
Stringa
Elenco stringhe

Se hai aggiunto documenti all'indice utilizzando l'BatchPutDocumentAPI, Attributes elenca fields/attributes i tuoi documenti e crei campi utilizzando l'DocumentAttributeoggetto.

Per i documenti indicizzati da un'origine Amazon S3 dati, crei i campi utilizzando un file di metadati JSON che include le informazioni sui campi.

Se utilizzi un database supportato come fonte di dati, puoi configurare i campi utilizzando l'opzione di mappatura dei campi.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Zendesk

Aggiungere documenti in lingue diverse dall'inglese