Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un connettore di origine dati
Puoi creare un connettore di origine dati per Amazon Kendra connetterti e indicizzare i tuoi documenti. Amazon Kendra può connettersi a Microsoft SharePoint, Google Drive e molti altri provider. Quando crei un connettore di origine dati, fornisci Amazon Kendra le informazioni di configurazione necessarie per connetterti al tuo repository di origine. A differenza dell'aggiunta di documenti direttamente a un indice, puoi scansionare periodicamente la fonte di dati per aggiornare l'indice.
Ad esempio, supponiamo di avere un archivio di documenti fiscali archiviati in un Amazon S3 bucket. Di tanto in tanto, i documenti esistenti vengono modificati e nuovi documenti vengono aggiunti all'archivio. Se aggiungi il repository Amazon Kendra come origine dati, puoi mantenere aggiornato l'indice impostando sincronizzazioni periodiche tra l'origine dati e l'indice.
Puoi scegliere di aggiornare un indice manualmente utilizzando la console o l'API. StartDataSourceSyncJob Altrimenti, imposti una pianificazione per aggiornare un indice e sincronizzarlo con la tua fonte di dati.
Un indice può avere più di un'origine dati. Ogni fonte di dati può avere una propria pianificazione degli aggiornamenti. Ad esempio, è possibile aggiornare l'indice dei documenti di lavoro quotidianamente o anche ogni ora, aggiornando manualmente i documenti archiviati ogni volta che l'archivio cambia.
Nota
Ogni ID del documento deve essere unico per indice. Non puoi creare una fonte di dati per indicizzare i tuoi documenti in modo univoco IDs e quindi utilizzare l'BatchPutDocument
API per indicizzare gli stessi documenti o viceversa. Puoi eliminare un'origine dati e quindi utilizzare l'BatchPutDocument
API per indicizzare gli stessi documenti o viceversa. L'utilizzo BatchPutDocument
e BatchDeleteDocument
APIs in combinazione con un connettore di origine Amazon Kendra dati per lo stesso set di documenti potrebbe causare incongruenze con i dati. Consigliamo invece di utilizzare il connettore di origine dati Amazon Kendra personalizzato.
Nota
I file aggiunti all'indice devono essere in un flusso di byte con codifica UTF-8. Per ulteriori informazioni sui documenti in, consultate Documenti. Amazon Kendra
Impostazione di una pianificazione degli aggiornamenti
Configura l'origine dati in modo che si aggiorni periodicamente con la console o utilizzando il Schedule
parametro quando crei o aggiorni un'origine dati. Il contenuto del parametro è una stringa che contiene una stringa di pianificazione in cron
formato o una stringa vuota per indicare che l'indice viene aggiornato su richiesta. Per il formato di un'espressione cron, consulta Schedule Expressions for Rules nella Guida per l'Amazon CloudWatch Events utente. Amazon Kendra supporta solo espressioni cron. Non supporta le espressioni di frequenza.
Impostazione di una lingua
Puoi indicizzare tutti i tuoi documenti in una fonte di dati in una lingua supportata. Quando chiami, specifichi il codice della lingua per tutti i tuoi documenti nella tua fonte di dati CreateDataSource. Se un documento non ha un codice di lingua specificato in un campo di metadati, il documento viene indicizzato utilizzando il codice della lingua specificato per tutti i documenti a livello di origine dati. Se non specifichi una lingua, Amazon Kendra indicizza i documenti in una fonte di dati in inglese per impostazione predefinita. Per ulteriori informazioni sulle lingue supportate, compresi i relativi codici, consulta Aggiungere documenti in lingue diverse dall'inglese.
Puoi indicizzare tutti i tuoi documenti in una fonte di dati in una lingua supportata utilizzando la console. Vai a Fonti dati e modifica la tua fonte di dati o Aggiungi origine dati se stai aggiungendo una nuova fonte di dati. Nella pagina Specificare i dettagli dell'origine dati, scegli una lingua dal menu a discesa Lingua. Seleziona Aggiorna o continua a inserire le informazioni di configurazione per connetterti alla tua fonte di dati.