Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Création de plans pour l'extraction

Mode de mise au point
Création de plans pour l'extraction - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

BDA vous permet de définir les champs de données spécifiques que vous souhaitez extraire de vos documents lors de la création d'un plan. Il s'agit d'un ensemble d'instructions qui guident le BDA sur les informations à rechercher et sur la manière de les interpréter.

Définition des champs

Pour commencer, vous pouvez créer une propriété pour chaque champ nécessitant une extraction, telle que employee_id ou product_name. Pour chaque champ, vous devez fournir une description, un type de données et un type d'inférence.

Pour définir un champ à extraire, vous devez définir les paramètres suivants :

  • Nom du champ : fournit une explication lisible par l'homme de ce que représente le champ. Cette description aide à comprendre le contexte et l'objectif du domaine, en facilitant l'extraction précise des données.

  • Instruction : fournit une explication en langage naturel de ce que représente le champ. Cette description aide à comprendre le contexte et l'objectif du domaine, en facilitant l'extraction précise des données.

  • Type : Spécifie le type de données de la valeur du champ. BDA prend en charge les types de données suivants :

    • string : pour les valeurs basées sur du texte

    • nombre : Pour les valeurs numériques

    • booléen : pour les valeurs vrai/faux

    • tableau : pour les champs qui peuvent avoir plusieurs valeurs du même type (par exemple, un tableau de chaînes ou un tableau de nombres)

  • Type d'inférence : indique à BDA comment gérer l'extraction de la valeur du champ. Les types d'inférence pris en charge sont les suivants :

    • Explicite : BDA doit extraire la valeur directement du document.

    • Déduit : BDA doit déduire la valeur sur la base des informations présentes dans le document.

Voici un exemple de définition de champ avec tous les paramètres :

Console
API
"product_name":{ "type":"string", "inferenceType":"Explicit", "description":"The short name of the product without any extra details" }

Dans cet exemple :

  • Le type est défini sur une chaîne, ce qui indique que la valeur du champ product_name doit être basée sur du texte.

  • Le type d'inférence est défini sur Explicit, ce qui indique à BDA d'extraire la valeur directement du document sans aucune transformation ni validation.

  • L'instruction fournit un contexte supplémentaire, en précisant que le champ doit contenir le nom abrégé du produit sans aucun détail supplémentaire.

En spécifiant ces paramètres pour chaque champ, vous fournissez à BDA les informations nécessaires pour extraire et interpréter avec précision les données souhaitées de vos documents.

Champ Instructions Type d'extraction Type

ApplicantsName

Nom complet du demandeur

Explicite

chaîne

DateOfBirth

Date de naissance de l'employé

Explicite

chaîne

Ventes

Recettes ou ventes brutes

Explicite

nombre

Statement_Starting_Balance

Solde au début de la période

Explicite

nombre

Champs à valeurs multiples

Dans les cas où un champ peut contenir plusieurs valeurs, vous pouvez définir des tableaux ou des tables.

Liste des champs

Pour les champs contenant une liste de valeurs, vous pouvez définir un type de données matriciel.

Dans cet exemple, « OtherExpenses » est défini comme un tableau de chaînes, permettant à BDA d'extraire plusieurs postes de dépenses pour ce champ.

Console
API
"OtherExpenses":{ "type":"array", "inferenceType":"Explicit", "description":"Other business expenses not included in fields 8-26 or field 30", "items":{ "type":"string" } }
Tables

Si votre document contient des données tabulaires, vous pouvez définir une structure de table dans le schéma.

Dans cet exemple, « SERVICES_TABLE » est défini comme un type de table, avec des champs de colonne tels que le nom du produit, la description, la quantité, le prix unitaire et le montant.

Console
API
"definitions":{ "LINEITEM":{ "properties":{ "quantity":{ "type":"number", "inferenceType":"Explicit" }, "unit price":{ "type":"number", "inferenceType":"Explicit" }, "amount":{ "type":"number", "inferenceType":"Explicit", "description":"Unit Price * Quantity" }, "product name":{ "type":"string", "inferenceType":"Explicit", "description":"The short name of the product without any extra details" }, "product description":{ "type":"string", "inferenceType":"Explicit", "description":"The full item list description text" } } } }, "properties":{ "SERVICES_TABLE":{ "type":"array", "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.", "items":{ "$ref":"#/definitions/LINEITEM" } }, "... ..." ]

En définissant des schémas complets avec des descriptions de champs, des types de données et des types d'inférence appropriés, vous pouvez vous assurer que BDA extrait avec précision les informations souhaitées de vos documents, quelles que soient les variations de mise en forme ou de représentation.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.