Konfiguration und Verwendung von Mountpoint - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konfiguration und Verwendung von Mountpoint

Um Mountpoint für Amazon S3 verwenden zu können, benötigt Ihr Host gültige AWS Anmeldeinformationen mit Zugriff auf den Bucket oder die Buckets, die Sie mounten möchten. Informationen zu verschiedenen Authentifizierungsmethoden finden Sie unter Mountpoint Credentials auf AWS GitHub.

Sie können zu diesem Zweck beispielsweise einen neuen Benutzer und eine neue Rolle AWS Identity and Access Management (IAM) erstellen. Stellen Sie sicher, dass diese Rolle Zugriff auf den Bucket oder die Buckets hat, die Sie mounten möchten. Sie können die IAM Rolle mit einem EC2 Instance-Profil an Ihre Amazon-Instance übergeben.

Verwenden von Mountpoint für Amazon S3

Verwenden Sie Mountpoint für Amazon S3, um Folgendes zu tun:

  1. Mounten Sie Buckets mit dem mount-s3-Befehl.

    Ersetzen Sie im folgenden Beispiel amzn-s3-demo-bucket durch den Namen Ihres S3-Buckets und ersetzen Sie ~/mnt durch das Verzeichnis auf Ihrem Host, in dem Ihr S3-Bucket gemountet werden soll.

    mkdir ~/mnt mount-s3 amzn-s3-demo-bucket ~/mnt

    Da der Mountpoint-Client standardmäßig im Hintergrund ausgeführt wird, bietet Ihnen das ~/mnt-Verzeichnis jetzt Zugriff auf die Objekte in Ihrem S3-Bucket.

  2. Greifen Sie über Mountpoint auf die Objekte in Ihrem Bucket zu.

    Nachdem Sie Ihren Bucket lokal bereitgestellt haben, können Sie Common verwenden Linux Befehle wie cat oderls, um mit Ihren S3-Objekten zu arbeiten. Mountpoint für Amazon S3 interpretiert Schlüssel in Ihrem S3-Bucket als Dateisystempfade. Dazu werden sie anhand des Schrägstrichs (/) getrennt. Wenn Sie zum Beispiel den Objektschlüssel Data/2023-01-01.csv in Ihrem Bucket haben, finden Sie ein Verzeichnis mit dem Namen Data in Ihrem Mountpoint-Dateisystem mit einer Datei namens 2023-01-01.csv darin.

    Mountpoint for Amazon S3 implementiert bewusst nicht die vollständige POSIXStandardspezifikation für Dateisysteme. Mountpoint ist für Workloads optimiert, die über eine Dateisystemschnittstelle Lese- und Schreibzugriff mit hohem Durchsatz auf Daten benötigen, die in Amazon S3 gespeichert aber ansonsten nicht auf Dateisystemfunktionen angewiesen sind. Weitere Informationen finden Sie unter Dateisystemverhalten von Mountpoint for Amazon S3 auf GitHub. Kunden, die eine umfassendere Dateisystemsemantik benötigen, sollten andere AWS Dateidienste wie Amazon Elastic File System (AmazonEFS) oder Amazon in Betracht ziehen. FSx

  3. Heben Sie das Mounting Ihres Bucket mit dem umount-Befehl auf. Mit diesem Befehl wird Mounting Ihres S3-Bucket aufgehoben und Mountpoint wird beendet.

    Um den folgenden Beispielbefehl zu verwenden, ersetzen Sie ~/mnt durch das Verzeichnis auf Ihrem Host, in dem Ihr S3-Bucket gemountet ist.

    umount ~/mnt
    Anmerkung

    Wenn Sie eine Liste der Optionen für diesen Befehl erhalten möchten, führen Sie umount --help aus.

Weitere Informationen zur Mountpoint-Konfiguration finden Sie unter S3-Bucket-Konfiguration und Dateisystemkonfiguration auf GitHub.

Konfigurieren von Caching in Mountpoint

Mountpoint für Amazon S3 unterstützt verschiedene Arten von Daten-Caching. Um wiederholte Leseanfragen zu beschleunigen, können Sie sich für Folgendes entscheiden:

  • Lokaler Cache — Sie können einen lokalen Cache in Ihrem EC2 Amazon-Instance-Speicher oder einem Amazon Elastic Block Store-Volume verwenden. Wenn Sie wiederholt dieselben Daten aus derselben Compute-Instance lesen und Sie in Ihrem lokalen Instance-Speicher ungenutzten Speicherplatz für den wiederholt gelesenen Datensatz haben, sollten Sie sich für einen lokalen Cache entscheiden.

  • Gemeinsamer Cache — Sie können einen gemeinsam genutzten Cache auf S3 Express One Zone verwenden. Wenn Sie wiederholt kleine Objekte aus mehreren Recheninstanzen lesen oder wenn Sie die Größe Ihres wiederholt gelesenen Datensatzes nicht kennen und von der Elastizität der Cachegröße profitieren möchten, sollten Sie sich für den Shared Cache entscheiden. Sobald Sie sich dafür entschieden haben, speichert Mountpoint Objekte mit einer Größe von bis zu einem Megabyte in einem Verzeichnis-Bucket, der S3 Express One Zone verwendet.

  • Kombinierter lokaler und gemeinsam genutzter Cache — Wenn Sie ungenutzten Speicherplatz in Ihrem lokalen Cache haben, aber auch einen gemeinsamen Cache für mehrere Instanzen haben möchten, können Sie sich sowohl für einen lokalen Cache als auch für einen gemeinsamen Cache entscheiden.

Das Caching in Mountpoint ist ideal für Anwendungsfälle, in denen Sie wiederholt dieselben Daten lesen, die sich während der mehrfachen Lesevorgänge nicht ändern. Sie können das Caching beispielsweise bei Machine-Learning-Trainingsaufgaben verwenden, bei denen ein Trainingsdatensatz mehrmals gelesen werden muss, um die Modellgenauigkeit zu verbessern.

Weitere Informationen zur Konfiguration von Caching in Mountpoint finden Sie in den folgenden Beispielen.

Lokaler Cache

Mit dem Flag können Sie sich für einen lokalen Cache entscheiden. --cache CACHE_PATH Ersetzen Sie im folgenden Beispiel CACHE_PATH durch den Dateipfad zu dem Verzeichnis, in dem Sie Ihre Daten zwischenspeichern möchten. Ersetzen amzn-s3-demo-bucket mit dem Namen Ihres S3-Buckets und ersetzen ~/mnt mit dem Verzeichnis auf Ihrem Host, in dem Ihr S3-Bucket gemountet werden soll.

mkdir ~/mnt mount-s3 --cache CACHE_PATH amzn-s3-demo-bucket ~/mnt

Wenn Sie sich beim Mounten eines S3-Buckets für lokales Caching entscheiden, erstellt Mountpoint ein leeres Unterverzeichnis am konfigurierten Cache-Speicherort, falls dieses Unterverzeichnis noch nicht existiert. Wenn Sie einen Bucket zum ersten Mal mounten und wenn Sie ihn unmounten, löscht Mountpoint den Inhalt des lokalen Caches.

Wichtig

Wenn Sie das lokale Caching aktivieren, speichert Mountpoint unverschlüsselten Objektinhalt aus Ihrem gemounteten S3-Bucket an dem beim Mount angegebenen lokalen Cache-Speicherort. Um Ihre Daten zu schützen, sollten Sie den Zugriff auf den Datencache-Speicherort mithilfe von Zugriffskontrollmechanismen für das Dateisystem einschränken.

Gemeinsamer Cache

Wenn Sie wiederholt kleine Objekte (bis zu 1 MB) aus mehreren Compute-Instances lesen oder die Größe des Datensatzes, den Sie wiederholt lesen, häufig die Größe Ihres lokalen Caches überschreitet, sollten Sie einen gemeinsamen Cache in S3 Express One Zone verwenden. Wenn Sie dieselben Daten wiederholt aus mehreren Instanzen lesen, verbessert dies die Latenz, da redundante Anfragen an Ihren bereitgestellten S3-Bucket vermieden werden.

Sobald Sie sich für den Shared Cache entschieden haben, zahlen Sie für die Daten, die in Ihrem Directory-Bucket in S3 Express One Zone zwischengespeichert sind. Sie zahlen auch für Anfragen, die sich auf Ihre Daten im Verzeichnis-Bucket in S3 Express One Zone beziehen. Weitere Informationen finden Sie unter Amazon S3 – Preise. Mountpoint löscht niemals zwischengespeicherte Objekte aus Verzeichnis-Buckets. Um Ihre Speicherkosten zu verwalten, sollten Sie eine Lifecycle-Richtlinie für Ihren Verzeichnis-Bucket einrichten, sodass Amazon S3 die zwischengespeicherten Daten in S3 Express One Zone nach einem von Ihnen angegebenen Zeitraum abläuft. Weitere Informationen finden Sie unter Mountpoint für Amazon S3 S3-Caching-Konfiguration unter GitHub.

Wenn Sie beim Mounten eines Allzweck-Buckets in Ihrer Compute-Instance das Caching in S3 Express One Zone aktivieren möchten, verwenden Sie das --cache-xz Flag und geben Sie einen Verzeichnis-Bucket als Cache-Speicherort an. Ersetzen Sie im folgenden Beispiel den user input placeholders.

mount-s3 amzn-s3-demo-bucket ~/mnt --cache-xz amzn-s3-demo-bucket--usw2-az1--x-s3

Kombinierter lokaler und gemeinsam genutzter Cache

Wenn Sie über ungenutzten Speicherplatz auf Ihrer Instance verfügen, aber auch einen gemeinsamen Cache für mehrere Instances verwenden möchten, können Sie sich sowohl für einen lokalen Cache als auch für einen gemeinsamen Cache entscheiden. Mit dieser Caching-Konfiguration können Sie redundante Leseanforderungen von derselben Instanz an den gemeinsam genutzten Cache im Verzeichnis-Bucket vermeiden, wenn die erforderlichen Daten im lokalen Speicher zwischengespeichert werden. Dadurch können die Anforderungskosten gesenkt und die Leistung verbessert werden.

Um sich beim Mounten eines S3-Buckets sowohl für einen lokalen Cache als auch für einen gemeinsam genutzten Cache zu entscheiden, geben Sie beide Cache-Speicherorte mithilfe der --cache-xz Flags --cache und an. Um das folgende Beispiel zu verwenden, um sich sowohl für einen lokalen als auch für einen gemeinsamen Cache zu entscheiden, ersetzen Sie das user input placeholders.

mount -s3 amzn-s3-demo-bucket ~/mnt --cache /path/to/mountpoint/cache --cache -xz amzn-s3-demo-bucket--usw2-az1--x-s3

Weitere Informationen finden Sie unter Mountpoint für Amazon S3 S3-Caching-Konfiguration unter GitHub.

Wichtig

Wenn Sie Shared Caching aktivieren, kopiert Mountpoint den Objektinhalt aus Ihrem bereitgestellten S3-Bucket in den S3-Verzeichnis-Bucket, den Sie als gemeinsamen Cache-Speicherort angeben, sodass er für jeden Anrufer mit Zugriff auf den S3-Verzeichnis-Bucket zugänglich ist. Um Ihre zwischengespeicherten Daten zu schützen, sollten Sie die folgenden Regeln beachten, Bewährte Methoden für die Sicherheit in Amazon S3 um sicherzustellen, dass Ihre Buckets die richtigen Richtlinien verwenden und nicht öffentlich zugänglich sind. Sie sollten einen Verzeichnis-Bucket verwenden, der dem gemeinsamen Caching von Mountpoint gewidmet ist, und nur Mountpoint-Clients Zugriff gewähren.