Types de collections - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Types de collections

Les types de collecte permettent d'organiser et de structurer les données pour une récupération et une analyse efficaces. Ils sont utilisés dans les bases de données ML pour définir le schéma d'un jeu de données et ses éléments. Dans Amazon SageMaker Feature Store, les types de collection pris en charge sont les suivants : liste, ensemble et vecteur.

Les collections sont un groupement d'éléments dans lequel chaque élément de la collection doit avoir le même type de fonctionnalité (String, Integral ou Fractional). Par exemple, une collection peut contenir des éléments avec tous les types de fonctionnalités d'élément comme Fractional, mais une collection ne peut pas contenir d'éléments avec certains types de fonctionnalités comme Fractional et d'autres types de fonctionnalités comme String.

Seuls les groupes de fonctionnalités d'un magasin en ligne InMemory prennent actuellement en charge les types de collections. La liste suivante décrit les options en matière de types de collections.

Liste : collection ordonnée d'éléments.

  • La longueur de la liste est déterminée par le nombre d'éléments contenus dans la collection.

  • Exemple : vous pouvez avoir une liste telle que ['a', 'b', 'a'], car la liste préserve l'ordre et peut contenir des éléments répétés.

Ensemble : collection désordonnée d'éléments uniques.

  • La longueur de l'ensemble est déterminée par le nombre d'éléments uniques contenus dans la collection.

  • Exemple : vous ne pouvez pas avoir un ensemble tel que ['a', 'b', 'a'], car il contient un élément répété. L'ensemble contiendra à la place les éléments ['a', 'b'], car l'ensemble ne contient que des éléments uniques.

Vecteur : liste spécialisée qui représente un tableau de taille fixe d'éléments. L'ordre des éléments est significatif, de sorte que les positions des éléments représentent certaines propriétés des données.

  • Les éléments du type de collection vectoriel doivent avoir le type de fonctionnalité Fractional.

  • Vous ne pouvez disposer que d'un seul type de collection vectoriel par groupe de fonctionnalités de niveau InMemory d'un magasin en ligne.

  • La dimension (nombre d'éléments dans le vecteur) du vecteur est prédéterminée par vous et spécifiée à l'aide de VectorDimension. La limite de dimension maximale est de 8 192.

  • Exemple : vous pouvez avoir un vecteur tel que [4,2, -6,3, 4,2], où les premier, deuxième et troisième éléments peuvent représenter les positions x, y et z dans l'espace physique.

Il n'y a aucune limite quant à la longueur des collections, tant qu'elles ne dépassent pas la taille maximale d'un enregistrement. Pour la taille maximale d'un enregistrement, consultez Quotas, règles de dénomination et types de données.