Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon Kendra Web crawler
È possibile utilizzare Amazon Kendra Web Crawler per eseguire la scansione e indicizzare le pagine Web.
È possibile eseguire la scansione solo di siti Web pubblici o siti Web interni all'azienda che utilizzano il protocollo di comunicazione sicuro Hypertext Transfer Protocol Secure (HTTPS). Se ricevi un errore durante la ricerca per indicizzazione di un sito Web, è possibile che il sito Web non sia in grado di eseguire la ricerca per indicizzazione. Per eseguire la scansione dei siti Web interni, è possibile configurare un proxy Web. Il proxy web deve essere rivolto al pubblico. Puoi anche utilizzare l'autenticazione per accedere e scansionare i siti Web.
Quando selezioni i siti Web da indicizzare, devi rispettare la Policy di uso accettabile di Amazon
Nota
L'uso improprio di Amazon Kendra Web Crawler per eseguire una scansione aggressiva di siti Web o pagine Web di cui non sei proprietario non è considerato un uso accettabile.
Amazon Kendra dispone di due versioni di web crawler connettore. Le funzionalità supportate di ogni versione includono:
Amazon Kendra Connettore Web Crawler v1.0/WebCrawlerConfigurationAPI
-
Proxy Web
-
Filtri di inclusione/esclusione
Amazon Kendra Connettore Web Crawler v2.0/TemplateConfigurationAPI
-
Mappature dei campi
-
Filtri di inclusione/esclusione
-
Sincronizzazione completa e incrementale dei contenuti
-
Proxy Web
-
Autenticazione di base, NTLM/Kerberos, SAML e basata su moduli per i tuoi siti Web
-
Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)
Importante
La creazione di connettori Web Crawler v2.0 non è supportata da. AWS CloudFormation Usa il connettore Web Crawler v1.0 se hai bisogno di assistenza. AWS CloudFormation
Per la risoluzione dei problemi relativi al connettore di origine dati del crawler Amazon Kendra Web, consulta. Risoluzione dei problemi relativi alle origini dati