

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Bases de connaissances
<a name="knowledge-base-integrations"></a>

Une base de connaissances est une collection organisée et indexée de documents ou de contenus provenant de sources de données optimisées pour la récupération et la réponse aux questions basées sur l'IA générative. Que votre équipe stocke de la documentation dans Confluence, collabore via SharePoint ou gère des fichiers dans le cloud, vous pouvez regrouper toutes ces informations dans une expérience de recherche unifiée en créant des bases de connaissances.

 Les intégrations intégrées peuvent être configurées en quelques clics pour synchroniser vos données dans Quick et vous permettre d'exploiter facilement les connaissances de votre organisation via Google Drive, Confluence OneDrive SharePoint, S3 et Web Crawler. Que votre équipe stocke de la documentation dans Confluence, collabore via SharePoint ou gère des fichiers dans le cloud, vous pouvez regrouper toutes ces informations dans une expérience de recherche unifiée à l'aide de bases de connaissances. 

## Fonctionnement des bases de connaissances
<a name="how-knowledge-bases-work"></a>

La base de connaissances est une collection indexée de documents ou de contenus provenant de sources de données telles que Google Drive, optimisée pour la récupération générative basée sur l'IA et la réponse aux questions. Plusieurs bases de connaissances peuvent être créées à partir de la même source, et elles peuvent toutes résider dans un index rapide partagé. Par exemple, si vous synchronisez deux dossiers depuis Google Drive et que vous créez deux bases de connaissances, l'une pour les « Documents de politique » pour répondre à des questions telles que *« Quelle est notre politique de remboursement »* et l'autre pour les « Commentaires des clients » pour répondre à des questions telles que *« Quelles sont les plaintes courantes des clients »*, les deux peuvent faire partie du même index. Quick les distingue à l'aide de l'identifiant de la base de connaissances, de sorte que les requêtes peuvent être filtrées pour récupérer uniquement les documents pertinents de la base de connaissances souhaitée. Cela permet aux utilisateurs d'organiser, de sécuriser et de récupérer des informations pertinentes pour différents domaines ou cas d'utilisation, même si les données sous-jacentes sont indexées ensemble.

Vos bases de connaissances peuvent être utilisées individuellement ou partagées avec les membres de l'équipe via Amazon Quick Spaces. Notre contrôle d'accès détaillé assure la sécurité au niveau de la base de connaissances, en veillant à ce que les utilisateurs reçoivent uniquement les informations des bases de connaissances auxquelles ils sont autorisés à accéder.

### Processus de création
<a name="knowledge-base-creation-process"></a>

Vous pouvez créer des bases de connaissances lors de la configuration d'une nouvelle intégration d'accès aux données et utiliser les intégrations existantes pour créer des bases de connaissances supplémentaires :

1. **Configuration de l'intégration de l'accès aux données** - Connectez-vous à votre source de données externe

1. **Sélection du contenu** : choisissez le contenu à inclure via les filtres et les paramètres de portée

1. **Indexation** : Amazon Quick traite et indexe le contenu sélectionné

1. **Disponibilité** - La base de connaissances devient disponible pour être utilisée dans les espaces et par les agents de l'IA

### Fonctionnalités
<a name="knowledge-base-capabilities"></a>

Chaque base de connaissances fournit les fonctionnalités suivantes :
+ **Indexation du contenu** : traite le texte, les documents et les données structurées provenant de sources externes
+ **Recherche sémantique : permet une recherche** basée sur l'IA dans le contenu indexé
+ **Synchronisation automatique** : conserve le contenu up-to-date grâce à des calendriers de synchronisation configurables
+ **Contrôle d'accès détaillé : garantit** que les utilisateurs reçoivent uniquement les informations des bases de connaissances auxquelles ils sont autorisés à accéder.
+ **Utilisation de plusieurs espaces** - Peut être utilisé dans plusieurs espaces et par différents agents d'IA

## Flux de travail général
<a name="general-workflow"></a>

Le flux de travail typique pour travailler avec les bases de connaissances suit les étapes suivantes :

1. **Configurez l'intégration des sources de données** : connectez-vous à votre application externe (telle que SharePoint Google Drive ou Confluence) avec l'authentification appropriée. Pour de plus amples informations, veuillez consulter [Guides spécifiques à l'intégration](integration-guides.md).

1. **Création d'une base de connaissances** : vous pouvez créer une base de connaissances lors de la configuration de votre nouvelle intégration. Configurez vos filtres de contenu en configurant des filtres d'inclusion, des restrictions de type de fichier et des sélections de dossiers afin de vous concentrer sur le contenu pertinent.

1. **Définir le calendrier de synchronisation** - La fréquence d'actualisation des données est définie sur une fréquence quotidienne par défaut. Vous pouvez modifier la fréquence de synchronisation pour configurer la fréquence à laquelle la base de connaissances doit être mise à jour avec le nouveau contenu provenant de la source.

1. **Surveiller et gérer** : vérifiez l'état de synchronisation, gérez les autorisations d'accès.

## Paramètres de configuration courants
<a name="common-configuration-settings"></a>

Les bases de connaissances partagent des modèles de configuration communs aux différentes intégrations de sources de données. La compréhension de ces paramètres vous permet d'optimiser l'indexation du contenu et de gérer efficacement le comportement de synchronisation.

**Note**  
Bien que ces options de configuration soient disponibles dans la plupart des intégrations, les paramètres spécifiques et les options disponibles peuvent varier en fonction de l'intégration de source de données que vous avez choisie.

### Limites de taille et de contenu des fichiers
<a name="file-size-and-content-limits"></a>

Configurez les limites de taille des fichiers pour optimiser les performances de traitement et gérer les coûts de stockage. Les limites spécifiques varient selon le type de contenu et sont affichées dans la console lorsque vous configurez votre base de connaissances.

**Documents texte standard**  
S'applique aux documents tels que PDFs les fichiers Word et les fichiers texte. La limite de taille de fichier est de 500 Mo.

**Fichiers vidéo**  
Disponible lorsque le traitement vidéo est activé. Les formats pris en charge incluent`.mp4`,`.mov`,`.m4v`. La limite de taille de fichier est de 10 Go (10240 Mo). Quick Index prend en charge jusqu'à **10 fichiers vidéo par Go de stockage**. Si votre cas d'utilisation nécessite des volumes vidéo plus importants, veuillez ouvrir un ticket auprès de l' AWS assistance pour étendre cette limite.

**Fichiers audio**  
Disponible lorsque le traitement audio est activé. Les formats pris en charge incluent `.mp3` ` .wav`` .m4a`,`.flac`, et` .ogg`. La limite est de 2 Go (2 048 Mo) pour les fichiers audio.  
Les fichiers dont le texte extrait dépasse la limite système de 30 Mo ne sont pas indexés, quelle que soit la taille du fichier d'origine. La quantité maximale de texte pouvant être extraite d'un seul document est de 30 Mo.

**Images**  
Quick Index applique les limites suivantes aux images :  
+ **Limite par document** : 500 images par document
+ **Limite par Go** : 10 000 images par Go de stockage d'index
+ **Limite par index** : 2 millions d'images par index
Si votre cas d'utilisation nécessite des volumes d'images plus importants, veuillez ouvrir un ticket auprès de l' AWS assistance pour étendre ces limites.

### Calendrier de synchronisation et mesures de protection
<a name="sync-schedule-and-safeguards"></a>

Configurez la fréquence de mise à jour de votre base de connaissances et protégez-vous contre la suppression involontaire de contenu :

#### Fréquence de synchronisation
<a name="sync-frequency"></a>

La fréquence d'actualisation des données est définie sur quotidienne par défaut. Vous pouvez modifier la fréquence de synchronisation pour configurer la fréquence à laquelle la base de connaissances doit être mise à jour avec le nouveau contenu provenant de la source

#### Protection contre la suppression de documents
<a name="document-deletion-safeguard"></a>

Protégez votre contenu indexé contre les suppressions massives accidentelles en définissant un seuil de pourcentage de suppression maximal. Si une tâche de synchronisation supprime plus de documents que votre seuil ne le permet, la phase de suppression est ignorée, préservant ainsi votre contenu indexé existant.

Cette protection protège contre les problèmes réseau temporaires, les modifications d'autorisation ou les problèmes du système source susceptibles de rendre le contenu temporairement indisponible.

# Bonnes pratiques de gestion ACLs dans les bases de connaissances
<a name="acl-best-practices-kb"></a>

Lorsque vous utilisez des bases de connaissances avec des listes de contrôle d'accès (ACLs), vous êtes responsable de l'exactitude des identités et des autorisations des utilisateurs. Cela garantit que les bonnes personnes peuvent accéder aux bons documents. Quick synchronise automatiquement les modifications d'identité et d'ACL au niveau du document toutes les 24 heures par défaut. Toute mise à jour des utilisateurs ou des autorisations prendra jusqu'à un jour pour apparaître dans le système, sauf si vous avez configuré un calendrier d'actualisation différent pour vos bases de connaissances.

Pour plus d'informations sur la configuration ACLs d'une source de données spécifique, consultez[Intégration Amazon S3](s3-integration.md).

**Note**  
Quick traite toutes les adresses e-mail sans distinction majuscules/majuscules. `JohnDoe@example.com``johndoe@example.com`, et `JOHNDOE@example.com` sont tous considérés comme le même utilisateur.

## Scénarios de gestion des utilisateurs importants
<a name="acl-user-management-scenarios"></a>

**Comprendre la liaison par e-mail**

Les adresses e-mail sont liées dynamiquement aux utilisateurs de Quick lorsque les utilisateurs initient des interactions par chat. Cette reliure suit une first-come-first-serve approche. Le premier utilisateur à discuter avec une adresse e-mail donnée établit le lien pour cette identité dans l'espace de noms.

**Lorsqu'un employé quitte votre organisation**

Lorsqu'un employé part, nettoyez rapidement son accès :

1. Mettez à jour les fichiers de configuration des ACL pour supprimer les références à leur adresse e-mail. Par exemple, dans Amazon S3, mettez à jour le fichier ACL global ou les fichiers de métadonnées.

1. Actualisez les bases de connaissances pour appliquer les modifications.

Cela permet d'éviter les problèmes de sécurité potentiels si l'e-mail est ultérieurement réattribué à quelqu'un d'autre.

**Lorsqu'une adresse e-mail est réattribuée à un nouvel employé**
+ L'accès à la base de connaissances compatible ACL est automatiquement verrouillé pour l'adresse e-mail réattribuée afin de protéger la sécurité des données.
+ Contactez l'assistance rapide pour nettoyer l'accès de l'utilisateur précédent avant que le nouvel employé puisse accéder aux documents associés à cet e-mail.

## Limitations
<a name="acl-limitations"></a>

Lorsque vous configurez au niveau du document ACLs pour vos bases de connaissances, tenez compte des limites suivantes :
+ **La configuration des ACL au niveau du document est permanente** : vous ne pouvez pas l'activer ACLs sur les bases de connaissances créées sans le support des ACL. Vous ne pouvez pas non plus le désactiver ACLs une fois activé. Pour modifier la configuration de l'ACL, créez une nouvelle base de connaissances avec les paramètres souhaités dès le départ.
+ **Adresses e-mail partagées au sein d'un espace de noms** : si plusieurs utilisateurs de Quick partagent la même adresse e-mail au sein d'un espace de noms, le système refuse l'accès à toutes les personnes utilisant cet e-mail partagé. Cette protection empêche d'accorder accidentellement l'accès au document à la mauvaise personne.
+ **Champ de résolution des ACL** : tous ACLs sont résolus dans l'espace de noms Quick du créateur de la base de connaissances. Cela s'applique qu'ils ACLs soient spécifiés par adresse e-mail ou par nom de groupe. Quick recherche les identités dans le contexte organisationnel du créateur afin de garantir une résolution cohérente des identités.
+ **Délai de recyclage des adresses e-mail** — Si votre organisation réattribue une adresse e-mail d'un employé à un autre, il est important de prendre en compte le calendrier. Si l'ancien employé n'a jamais utilisé Quick pour le chat ou les interactions avec l'IA, et que l'e-mail est réattribué avant la prochaine actualisation de l'ACL, le nouvel employé peut accéder temporairement aux documents destinés à l'ancien employé.

  Pour éviter cela, procédez comme suit dans l'ordre :

  1. Mettez à jour votre ACLs (le cas échéant, comme dans Amazon S3) pour supprimer l'ancien utilisateur et ajouter le nouvel utilisateur.

  1. Actualisez manuellement votre base de connaissances ou attendez l'actualisation quotidienne automatique.

  1. Attribuez l'adresse e-mail au nouvel employé.

  Cela garantit que les autorisations d'accès sont correctement synchronisées avant que le nouvel utilisateur ne commence à utiliser Quick.
+ **Compatibilité avec la recherche** — Les bases de connaissances dans lesquelles le niveau du document ACLs est activé ne sont actuellement pas compatibles avec Quick Research. Si vous devez utiliser des documents issus d'une base de connaissances compatible ACL à des fins de recherche, créez une base de connaissances distincte sans ACLs ces documents.

# Bases de connaissances sur le dépannage
<a name="troubleshooting-knowledge-bases"></a>

Lorsque vous rencontrez des problèmes avec votre base de connaissances Quick, vous pouvez utiliser ce guide de dépannage pour identifier et résoudre les problèmes courants. Les problèmes liés à la base de connaissances concernent généralement la synchronisation de documents, des échecs de tâches d'actualisation ou des autorisations d'accès.

## Les documents n'apparaissent pas dans votre base de connaissances
<a name="documents-not-appearing"></a>

Lorsque les documents que vous vous attendez à voir n'apparaissent pas dans votre base de connaissances, plusieurs facteurs peuvent être à l'origine de ce problème.

**Causes courantes :**
+ **Synchronisation en cours** — Les documents sont peut-être encore en cours de traitement. Vérifiez l'état de l'actualisation pour confirmer que l'actualisation est terminée.
+ **Format de fichier non pris en charge** — Vérifiez que vos documents sont dans des formats compatibles : Word, Excel PowerPoint, PDF, CSV, TXT, RTF, JSON, XML, HTML
+ **Taille de fichier trop importante** — Chaque fichier doit être inférieur à 50 Mo.
+ **Autorisations d'accès insuffisantes** : vérifiez que la base de connaissances dispose des autorisations appropriées pour accéder à la source du document.
+ **Filtrage des documents** — Vérifiez si les filtres ou les règles d'exclusion empêchent l'indexation de certains documents.

**Pour résoudre les problèmes, procédez comme suit :**

1. Consultez l'historique d'actualisation pour détecter les messages d'erreur liés à des documents spécifiques qui n'ont pas pu être synchronisés.

1. Vérifiez que les formats de documents et les tailles de fichiers répondent aux exigences.

1. Vérifiez vos autorisations d'accès et vos paramètres de connexion.

## Échec de la tâche d'actualisation
<a name="refresh-job-fails"></a>

Une tâche d'actualisation échoue généralement en cas d'erreur de configuration dans la base de connaissances ou dans la connexion à la source de données.

**Causes courantes :**
+ **Problèmes d'autorisation** : l'intégration ne dispose pas d'autorisations suffisantes pour accéder à la source de données.
+ **Erreurs de configuration** : paramètres de connexion incorrects URLs ou à la source de données.
+ **Limitations de ressources** — Limitation du débit depuis le système source.

**Pour résoudre le problème :**

1. Vérifiez les détails de l'historique d'actualisation pour détecter des messages d'erreur spécifiques.

1. Vérifiez que tous les paramètres de connexion et toutes les autorisations sont correctement configurés.

1. Effectuez l'action recommandée en fonction du message d'erreur.

## La tâche d'actualisation se termine avec des problèmes
<a name="refresh-job-completes-with-issues"></a>

Lorsqu'une tâche d'actualisation se termine avec des problèmes, elle a été traitée avec succès, mais certains documents ont rencontré des problèmes.

**Ce que cela signifie :**
+ **Succès partiel** : certains documents ont été synchronisés avec succès, tandis que d'autres ont échoué.
+ **Erreurs au niveau du document** : certains fichiers peuvent présenter des problèmes de formatage, de corruption ou d'accès.
+ **Problèmes liés aux métadonnées** : problèmes liés aux métadonnées des documents ou aux informations associées.
+ **Violations de taille ou de format** : certains fichiers peuvent dépasser les limites de taille ou être dans des formats non pris en charge.

**Pour résoudre le problème :**

1. Consultez les rapports d'actualisation détaillés pour identifier les documents qui ont rencontré des problèmes.

1. Résolvez les problèmes liés aux documents individuels.

1. Exécutez une autre actualisation après avoir résolu les problèmes.

## La tâche d'actualisation réussit mais aucun document n'apparaît
<a name="refresh-job-succeeds-no-documents"></a>

Si une tâche d'actualisation s'avère réussie mais qu'aucun document n'apparaît dans votre base de connaissances, vérifiez ces causes potentielles.

**Causes courantes :**
+ **Source vide** : l'emplacement de la source de données configuré ne contient aucun document.
+ **Configuration de chemin incorrecte** : le chemin source ou les paramètres de connexion ne pointent pas vers le bon emplacement.
+ **Filtres de documents : les** critères d'inclusion ou d'exclusion peuvent filtrer tous les documents.
+ **Autorisations de lecture manquantes** : la tâche s'est connectée correctement, mais les autorisations nécessaires à la lecture des documents étaient insuffisantes.

**Pour résoudre le problème :**

1. Vérifiez que la configuration de votre source de données pointe vers le bon emplacement.

1. Vérifiez que les documents sont présents à l'emplacement indiqué.

1. Vérifiez que les autorisations d'accès appropriées sont configurées.

1. Passez en revue tous les filtres de document susceptibles d'exclure du contenu.

## Problèmes de format de fichier lors de l'actualisation
<a name="file-format-issues"></a>

Les bases de connaissances rapides prennent en charge des formats de fichiers spécifiques. Les fichiers doivent respecter les exigences relatives au format, à la taille et à la limite de caractères.

**Prérequis:**
+ **Formats pris en charge :** Word, Excel PowerPoint, PDF, CSV, TXT, RTF, JSON, XML, HTML
+ **Limite de taille de fichier :** 50 Mo par fichier
+ **État du fichier :** Non endommagé ou protégé par mot de passe

**Pour résoudre les problèmes de format, procédez comme suit :**

1. Vérifiez que vos fichiers répondent aux exigences de format et de taille.

1. Convertissez les formats non pris en charge en formats compatibles.

1. Supprimez la protection par mot de passe des fichiers.

1. Vérifiez que les fichiers ne sont pas corrompus.

## Erreurs d’accès refusé
<a name="access-denied-errors"></a>

Les erreurs de refus d'accès sont généralement dues à des problèmes d'authentification ou d'autorisation.

**Causes courantes :**
+ **Informations d'identification non valides** : les jetons d'authentification ou les mots de passe ont peut-être expiré.
+ **Autorisations insuffisantes** : le compte utilisé dans le cadre de l'intégration ne dispose pas d'un accès en lecture à la source de données.
+ **Restrictions réseau** : les politiques de pare-feu ou de sécurité bloquent l'accès.
+ Problèmes **SSL/TLS — Problèmes** de certificat liés aux connexions sécurisées.

**Pour résoudre le problème :**

1. **Vérifier les informations d'authentification** : vérifiez que les informations d'authentification sont à jour et valides. Modifiez l'intégration pour vous authentifier à nouveau et générer un nouveau jeton.

1. **Pour les sources de données des robots d'exploration Web** : vérifiez que les connexions sécurisées sont correctement configurées et que les certificats SSL sont correctement configurés et fiables.

1. **Contactez votre administrateur système** : si vous rencontrez toujours des problèmes d'accès, contactez votre administrateur système. Ils devront peut-être ajuster les autorisations ou les paramètres de sécurité.