Configuration et utilisation de Mountpoint - Amazon Simple Storage Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration et utilisation de Mountpoint

Pour utiliser Mountpoint pour Amazon S3, votre hôte a besoin AWS d'informations d'identification valides lui permettant d'accéder au ou aux compartiments que vous souhaitez monter. Pour connaître les différentes méthodes d'authentification, consultez AWS Mountpoint Credentials sur GitHub.

Par exemple, vous pouvez créer un nouvel utilisateur AWS Identity and Access Management (IAM) et un nouveau rôle à cette fin. Assurez-vous que ce rôle a accès au ou aux compartiments que vous souhaitez monter. Vous pouvez transmettre le IAM rôle à votre EC2 instance Amazon à l'aide d'un profil d'instance.

Utilisation de Mountpoint pour Amazon S3

Utilisez Mountpoint pour Amazon S3 pour effectuer les opérations suivantes :

  1. Montez les compartiments avec la commande mount-s3.

    Dans l'exemple suivant, remplacez amzn-s3-demo-bucket par le nom de votre compartiment S3 et remplacez ~/mnt par le répertoire situé sur votre hôte, où vous souhaitez que votre compartiment S3 soit monté.

    mkdir ~/mnt mount-s3 amzn-s3-demo-bucket ~/mnt

    Comme le client Mountpoint s'exécute en arrière-plan par défaut, le répertoire ~/mnt vous donne désormais accès aux objets de votre compartiment S3.

  2. Accédez aux objets dans votre compartiment via Mountpoint.

    Après avoir monté votre bucket localement, vous pouvez utiliser common Linux des commandes, telles que cat ouls, pour fonctionner avec vos objets S3. Mountpoint pour Amazon S3 interprète les clés de votre compartiment S3 comme des chemins de système de fichiers en les divisant au niveau du caractère de barre oblique (/). Par exemple, si vous avez la clé d'objet Data/2023-01-01.csv dans votre compartiment, vous aurez un répertoire nommé Datadans votre système de fichiers Mountpoint, avec un fichier nommé 2023-01-01.csv à l'intérieur.

    Mountpoint for Amazon S3 n'implémente pas intentionnellement l'intégralité des spécifications POSIXstandard pour les systèmes de fichiers. Mountpoint est optimisé pour les charges de travail qui nécessitent un accès haut débit en lecture et en écriture aux données stockées dans Amazon S3 via une interface de système de fichiers, mais qui ne dépendent pas des fonctionnalités du système de fichiers. Pour plus d'informations, consultez Mountpoint pour le comportement du système de fichiers Amazon S3 sur GitHub. Les clients qui ont besoin d'une sémantique de système de fichiers plus riche devraient envisager d'autres services de AWS fichiers, tels qu'Amazon Elastic File System EFS (Amazon) ou Amazon. FSx

  3. Démontez votre compartiment à l'aide de la commande umount. Cette commande démonte votre compartiment S3 et quitte Mountpoint.

    Pour utiliser l'exemple de commande suivant, remplacez ~/mnt par le répertoire situé sur votre hôte, où votre compartiment S3 est monté.

    umount ~/mnt
    Note

    Pour obtenir la liste des options pour cette commande, exécutez umount --help.

Pour plus de détails sur la configuration de Mountpoint, voir Configuration du compartiment S3 et configuration du système de fichiers sur GitHub.

Configuration de la mise en cache dans Mountpoint

Mountpoint pour Amazon S3 prend en charge différents types de mise en cache des données. Pour accélérer les demandes de lecture répétées, vous pouvez opter pour les options suivantes :

  • Cache local : vous pouvez utiliser un cache local dans le stockage de votre EC2 instance Amazon ou dans un volume Amazon Elastic Block Store. Si vous lisez à plusieurs reprises les mêmes données à partir de la même instance de calcul et si vous disposez d'un espace inutilisé dans le stockage de votre instance locale pour le jeu de données lu à plusieurs reprises, vous devez opter pour un cache local.

  • Cache partagé — Vous pouvez utiliser un cache partagé sur S3 Express One Zone. Si vous lisez de petits objets à plusieurs reprises à partir de plusieurs instances de calcul ou si vous ne connaissez pas la taille de votre jeu de données lu régulièrement et souhaitez bénéficier de l'élasticité de la taille du cache, vous devez opter pour le cache partagé. Une fois que vous êtes inscrit, Mountpoint conserve les objets d'une taille maximale d'un mégaoctet dans un compartiment de répertoire qui utilise S3 Express One Zone.

  • Cache local et cache partagé combiné : si vous avez de l'espace inutilisé dans votre cache local mais que vous souhaitez également un cache partagé entre plusieurs instances, vous pouvez opter à la fois pour un cache local et un cache partagé.

La mise en cache dans Mountpoint est idéale pour les cas d’utilisation où vous lisez à plusieurs reprises les mêmes données qui ne changent pas au cours des multiples lectures. Par exemple, vous pouvez utiliser la mise en cache avec des tâches d’entraînement de machine learning qui nécessitent de lire plusieurs fois un jeu de données d’entraînement pour améliorer la précision du modèle.

Pour plus d'informations sur la configuration de la mise en cache dans Mountpoint, consultez les exemples suivants.

Cache local

Vous pouvez opter pour un cache local à l'aide de l'--cache CACHE_PATHindicateur. Dans l'exemple suivant, remplacez CACHE_PATH avec le chemin du fichier vers le répertoire dans lequel vous souhaitez mettre vos données en cache. Remplacez amzn-s3-demo-bucket avec le nom de votre compartiment S3, et remplacez ~/minute avec le répertoire de votre hôte dans lequel vous souhaitez que votre compartiment S3 soit monté.

mkdir ~/mnt mount-s3 --cache CACHE_PATH amzn-s3-demo-bucket ~/mnt

Lorsque vous optez pour la mise en cache locale lors du montage d'un compartiment S3, Mountpoint crée un sous-répertoire vide à l'emplacement de cache configuré, si ce sous-répertoire n'existe pas déjà. Lorsque vous montez un bucket pour la première fois et que vous le démontez, Mountpoint supprime le contenu du cache local.

Important

Si vous activez la mise en cache locale, Mountpoint conservera le contenu de l'objet non chiffré de votre compartiment S3 monté à l'emplacement du cache local indiqué lors du montage. Afin de protéger vos données, vous devez restreindre l'accès à l'emplacement du cache de données en utilisant des mécanismes de contrôle d'accès au système de fichiers.

Cache partagé

Si vous lisez à plusieurs reprises de petits objets (jusqu'à 1 Mo) à partir de plusieurs instances de calcul ou si la taille du jeu de données que vous lisez à plusieurs reprises dépasse souvent la taille de votre cache local, vous devez utiliser un cache partagé dans S3 Express One Zone. Lorsque vous lisez les mêmes données à plusieurs reprises à partir de plusieurs instances, cela améliore la latence en évitant les demandes redondantes adressées à votre compartiment S3 monté.

Une fois que vous avez opté pour le cache partagé, vous payez pour les données mises en cache dans votre compartiment d'annuaire dans S3 Express One Zone. Vous payez également pour les demandes effectuées sur vos données dans le compartiment d'annuaire de S3 Express One Zone. Pour plus d’informations, consultez Tarification Amazon S3. Mountpoint ne supprime jamais les objets mis en cache des compartiments de répertoire. Pour gérer vos coûts de stockage, vous devez définir une politique de cycle de vie pour votre compartiment d'annuaire afin qu'Amazon S3 fasse expirer les données mises en cache dans S3 Express One Zone après une période que vous spécifiez. Pour plus d'informations, consultez la section Configuration de la mise en cache de Mountpoint pour Amazon S3 sur GitHub.

Pour activer la mise en cache dans S3 Express One Zone lorsque vous montez un compartiment à usage général sur votre instance de calcul, utilisez l'--cache-xzindicateur et spécifiez un compartiment de répertoire comme emplacement de cache. Dans l'exemple suivant, remplacez user input placeholders.

mount-s3 amzn-s3-demo-bucket ~/mnt --cache-xz amzn-s3-demo-bucket--usw2-az1--x-s3

Cache local et cache partagé combinés

Si vous avez de l'espace inutilisé sur votre instance mais que vous souhaitez également utiliser un cache partagé entre plusieurs instances, vous pouvez opter pour un cache local et un cache partagé. Avec cette configuration de mise en cache, vous pouvez éviter les demandes de lecture redondantes provenant de la même instance vers le cache partagé dans le bucket de répertoire lorsque les données requises sont mises en cache dans le stockage local. Cela permet de réduire les coûts liés aux demandes et d'améliorer les performances.

Pour activer à la fois un cache local et un cache partagé lorsque vous montez un compartiment S3, vous devez spécifier les deux emplacements de cache à l'aide --cache-xz des indicateurs --cache et. Pour utiliser l'exemple suivant pour activer à la fois un cache local et un cache partagé, remplacez user input placeholders.

mount -s3 amzn-s3-demo-bucket ~/mnt --cache /path/to/mountpoint/cache --cache -xz amzn-s3-demo-bucket--usw2-az1--x-s3

Pour plus d'informations, consultez la configuration de mise en cache de Mountpoint pour Amazon S3 sur GitHub.

Important

Si vous activez la mise en cache partagée, Mountpoint copiera le contenu de l'objet de votre compartiment S3 monté dans le compartiment de répertoire S3 que vous fournissez comme emplacement de cache partagé, le rendant ainsi accessible à tout appelant ayant accès au compartiment de répertoire S3. Pour protéger vos données mises en cache, vous devez suivre les règles afin Bonnes pratiques de sécurité pour Amazon S3 de vous assurer que vos compartiments utilisent les bonnes politiques et ne sont pas accessibles au public. Vous devez utiliser un bucket de répertoire dédié à la mise en cache partagée de Mountpoint et n'accorder l'accès qu'aux clients Mountpoint.