Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration desAWS DataSync transferts avec Azure Blob Storage
Cette fonction est disponible en version prévisualisation pour AWS DataSync et susceptible d'être modifiée. |
Pour transférer des blobs (également appelés objets) depuis Azure Blob Storage, vous devez créer un emplacementAWS DataSync de transfert. Vous pouvez ensuite déplacer vos blobs vers n'importe quel service deAWS stockageDataSync compatible.
Accès à Azure Blob Storage
Pour transférer vos objets, vousDataSync devez être autorisé à lire votre Azure Blob Storage. Vos objets doivent également se trouver dans un niveau d'DataSyncaccès compatible avec.
Rubriques
Jetons SAS
Un jeton de signature d'accès partagé (SAS) spécifie les autorisations d'accès pour votre stockage blob. (Pour plus d'informations sur SAS, consultez la documentation Azure Blob Storage
Vous pouvez générer des jetons SAS à différents niveaux d'accès. DataSyncprend en charge les jetons avec les niveaux d'accès suivants :
-
Compte
-
Conteneur
-
Dossier
Pour fournirDataSync l'accès dont il a besoin pour votre transfert, votre jeton SAS doit au minimum disposer d'autorisations de lecture et de liste. Vous devrez peut-être également configurer le jeton avec d'autres autorisations en fonction du niveau d'accès. Par exemple, un jeton avec accès au niveau du compte nécessite plus d'autorisations qu'un jeton avec accès au niveau du dossier.
Rubriques
Autorisations relatives aux jetons SAS pour l'accès au niveau du compte
DataSyncnécessite que vous configuriez un jeton d'accès au niveau du compte avec les autorisations suivantes :
-
Services autorisés — Blob
-
Types de ressources autorisés : conteneur, objet (si vous n'incluez pas ces autorisations, vous neDataSync pouvez pas transférer les métadonnées de vos objets)
-
Autorisations autorisées : lecture, liste
-
Autorisations d'index blob autorisées : lecture/écriture (si vousDataSync souhaitez copier des balises d'objets)
Autorisations relatives aux jetons SAS pour l'accès au niveau du conteneur
DataSyncnécessite que vous configuriez un jeton d'accès au niveau du conteneur avec les autorisations suivantes :
-
Lire
-
Liste
-
Balise (si vousDataSync souhaitez copier des balises d'objets)
Note
Vous ne pouvez pas ajouter l'autorisation de balise facultative lors de la génération d'un jeton SAS dans le portail Azure. Pour ajouter l'autorisation, générez plutôt le jeton à l'aide de l'application Azure Storage Explorer
ou générez un jeton SAS qui fournit un accès au niveau du compte.
Autorisations relatives aux jetons SAS pour l'accès au niveau des dossiers
Si vous utilisez Azure Data Lake Storage Gen2 avec votre stockage blob, vous pouvez fournirDataSync un jeton SAS qui autorise uniquement l'accès à un dossier spécifique de votre conteneur.
DataSyncnécessite que vous configuriez un jeton d'accès au niveau du dossier avec les autorisations suivantes :
-
Lire
-
Liste
Pour plus d'informations sur la configuration de ce type de jeton, consultez la documentation Azure Blob Storage
Lorsque vous créez votre emplacement Azure Blob Storage pourDataSync, vous devez spécifier le chemin complet vers ce même dossier.
Politiques d'expiration de SAS
Assurez-vous que votre SAS n'expire pas avant de terminer votre transfert. Pour plus d'informations sur la configuration d'une politique d'expiration SAS, consultez la documentation Azure Blob Storage
Si le SAS expire pendant le transfert, il neDataSync pourra plus accéder à votre emplacement Azure Blob Storage (le message d'erreur « Impossible d'ouvrir le répertoire
» peut s'afficher). Dans ce cas, vous devez mettre à jour votre position avec un nouveau jeton SAS et recommencer votreDataSync tâche.
Niveau d'accès
DataSyncpeut transférer des objets Azure Blob Storage dans les niveaux chaud ou froid. Il ignore le transfert d'objets dans le niveau d'accès aux archives. Vous devez réhydrater les objets du niveau archive vers le niveau chaud ou froid avant de pouvoir les transférer.
Types de blobs
DataSyncpeut transférer n'importe quel type de blob, y compris les blobs de blocs, de pages et d'ajout. Pour plus d'informations, consultez la documentation Azure Blob Storage
Configuration
Actuellement, vous ne pouvez utiliser cette fonctionnalité qu'avec laDataSync consoleAWS Command Line Interface, ouAWS SDK for Java 2.x.
Note
Aucune configuration n'est requise si vous utilisez laDataSync console.
Configuration avecAWS CLI
Les instructions suivantes décrivent comment configurer la version 2 deAWS Command Line Interface (AWS CLI) pour utiliser cette fonctionnalité.
Pour configurer l AWS CLI
-
Téléchargez le modèleDataSync d'API et décompressez le fichier JSON.
-
Exécutez la commande suivante pour ajouter le modèle de service à votreAWS CLI configuration.
Cet exemple crée un nom
datasync-azure-blob
de service. Vous pouvez spécifier un autre nom.aws configure add-model \ --service-model file://
datasync-service-model
.json \ --service-namedatasync-azure-blob
Une fois le modèle ajouté, vous pouvez utiliser cette fonctionnalité avec leAWS CLI.
Configuration avecAWS SDK for Java 2.x
Les instructions suivantes expliquent comment configurerAWS SDK for Java 2.x pour utiliser cette fonctionnalité.
Pour configurer le kit SDK for Java 2.x
-
Vérifier qu'un
AwsJavaSdk-DataSync-2.0.jar
fichier est disponible. Si ce n'est pas le cas, contactez votreDataSync point de contact. -
Dans votre projet Maven, recherchez dans le
pom.xml
fichier une dépendance explicite du SDKDataSync Java. S'il n'y en a pas, créez la dépendance à l'aide de l'exemple suivant :<dependency> <groupId>software.amazon.awssdk</groupId> <artifactId>datasync</artifactId> <version>2.17.290</version> </dependency>
-
Exécutez la commande suivante :
mvn org.apache.maven.plugins:maven-install-plugin:3.0.0-M1:install-file \ --batch-mode -Dfile=/AwsJavaSdk-DataSync-2.0.jar \ -DgroupId=software.amazon.awssdk \ -DartifactId=datasync \ -Dversion=
2.17.290
\ -Dpackaging=jarGardez à l'esprit :
-
Assurez-vous d'utiliser le bon chemin pour le
AwsJavaSdk-DataSync-2.0.jar
fichier. -
La
version est un exemple.2.17.290
-
Création de votreDataSync agent
Vous avez besoin d'unDataSync agent capable de se connecter à votre conteneur Azure Blob Storage. L'agent lit votre conteneur et facilite le déplacement de vos objetsAWS.
Pour créer un agent
-
Téléchargez et déployez un agent Amazon EC2 dans un cloud privé virtuel (VPC) de votreAWS environnement.
-
Spécifiez le point de terminaison du service VPC avec lequel l'agent communiqueAWS.
-
Configurez votre réseau pour qu'il fonctionne avec les points de terminaison VPC.
Création de votre emplacement de transfert Azure Blob Storage
Vous pouvez configurerDataSync pour utiliser un conteneur Azure Blob Storage existant comme emplacement source pour votre transfert.
Avant de commencer : Assurez-vous de savoir commentDataSync accéder à votre Azure Blob Storage et comment fonctionne avec les niveaux d'accès au stockage Blob.
Ouvrez laAWS DataSync console à l'adresse https://console.aws.amazon.com/datasync/
. Dans le volet de navigation de gauche, développez Transfert de données, puis choisissez Locations et Créer un emplacement.
-
Pour Type d'emplacement, choisissez Microsoft Azure Blob Storage.
-
Pour Agents, choisissez l'DataSyncagent qui peut se connecter à votre conteneur Azure Blob Storage.
Vous pouvez choisir plusieurs agents. Pour plus d'informations, veuillez consulter Utiliser plusieurs AWS DataSync agents pour votre transfert.
-
Dans le champ URL du conteneur, entrez l'URL du conteneur concerné par votre transfert.
-
Dans Dossier, entrez des segments de chemin si vous souhaitez limiter votre transfert à un répertoire virtuel de votre conteneur (par exemple,
/my/images
).DataSynccopie uniquement les objets comportant ces segments de chemin.
Important
Si votre jeton SAS ne permet d'accéder qu'à un dossier, vous devez spécifier le chemin complet de ce dossier ici pour que le transfert fonctionne.
-
Pour le jeton SAS, entrez le jeton SAS qui permetDataSync d'accéder à votre stockage blob.
Le jeton fait partie de la chaîne d'URI SAS qui se trouve après l'URI de la ressource de stockage et un point d'interrogation. Un jeton ressemble à ceci :
sp=r&st=2023-12-20T14:54:52Z&se=2023-12-20T22:54:52Z&spr=https&sv=2021-06-08&sr=c&sig=aBBKDWQvyuVcTPH9EBp%2FXTI9E%2F%2Fmq171%2BZU178wcwqU%3D
-
(Facultatif) Entrez des valeurs pour les champs Clé et Valeur afin de baliser l'emplacement.
Les balises vous aident à gérer, filtrer et rechercher vosAWS ressources. Nous vous recommandons de créer au moins une balise de nom pour votre emplacement.
-
Choisissez Créer un lieu.
Note
Les instructions suivantes utilisent ladatasync-azure-blob
commande, mais vous pouvez donner à cette commande un autre nom. Pour plus d'informations, veuillez consulter Configuration avecAWS CLI.
-
Copiez la
create-location-azure-blob
commande suivante :aws datasync-azure-blob create-location-azure-blob \ --container-url "https://
path/to/container
" \ --authentication-type "SAS" \ --sas-configuration '{ "Token": "your-sas-token
" }' \ --agent-arnsmy-datasync-agent-arn
\ --subdirectory "/path/to/my/data
" \ --tags [{"Key": "key1
","Value": "value1
"}] -
Pour le
--container-url
paramètre, spécifiez l'URL du conteneur Azure Blob Storage impliqué dans votre transfert. -
Pour le
--authentication-type
paramètre, spécifiezSAS
. -
Pour l'
Token
option du--sas-configuration
paramètre, spécifiez le jeton SAS qui permetDataSync d'accéder à votre stockage blob.Le jeton fait partie de la chaîne d'URI SAS qui se trouve après l'URI de la ressource de stockage et un point d'interrogation. Un jeton ressemble à ceci :
sp=r&st=2023-12-20T14:54:52Z&se=2023-12-20T22:54:52Z&spr=https&sv=2021-06-08&sr=c&sig=aBBKDWQvyuVcTPH9EBp%2FXTI9E%2F%2Fmq171%2BZU178wcwqU%3D
-
Pour le
--agent-arns
paramètre, spécifiez l'Amazon Resource Name (ARN) de l'DataSyncagent qui peut se connecter à votre conteneur.Voici un exemple d'ARN :
arn:aws:datasync:
us-east-1
:123456789012
:agent/agent-01234567890deadfb
Vous pouvez spécifier plusieurs agents. Pour plus d'informations, veuillez consulter Utiliser plusieurs AWS DataSync agents pour votre transfert.
-
Pour le
--subdirectory
paramètre, spécifiez des segments de chemin si vous souhaitez limiter votre transfert à un répertoire virtuel de votre conteneur (par exemple,/my/images
).DataSynccopie uniquement les objets comportant ces segments de chemin.
Important
Si votre jeton SAS ne permet d'accéder qu'à un sous-répertoire (ou dossier), vous devez spécifier le chemin complet vers ce sous-répertoire ici pour que le transfert fonctionne.
-
(Facultatif) Pour le
--tags
paramètre, spécifiez des paires clé-valeur qui vous aident à gérer, filtrer et rechercher votre position.Nous vous recommandons de créer une balise de nom pour votre emplacement.
-
Exécutez la commande
create-location-azure-blob
.Vous obtenez une réponse qui vous indique l'ARN de l'emplacement que vous avez créé. Par exemple :
{ "LocationArn": "arn:aws:datasync:us-east-1:123456789012:location/loc-12345678abcdefgh" }
Affichage de votre emplacement de transfert Azure Blob Storage
Vous pouvez obtenir des informations sur votre emplacement Azure Blob Storage existant.
Ouvrez laAWS DataSync console à l'adresse https://console.aws.amazon.com/datasync/
. -
Dans le panneau de navigation de gauche, choisissez Emplacements.
-
Choisissez votre emplacement de stockage Azure Blob.
Vous pouvez consulter les détails de votre position, y compris lesDataSync tâches qui l'utilisent.
Note
Les instructions suivantes utilisent ladatasync-azure-blob
commande, mais vous pouvez donner à cette commande un autre nom. Pour plus d'informations, veuillez consulter Configuration avecAWS CLI.
-
Copiez la
describe-location-azure-blob
commande suivante :aws datasync-azure-blob describe-location-azure-blob \ --location-arn "
your-azure-blob-location-arn
" -
Pour le
--location-arn
paramètre, spécifiez l'ARN de l'emplacement Azure Blob Storage que vous avez créé. -
Exécutez la commande
describe-location-azure-blob
.Vous recevez une réponse qui vous donne des informations sur votre position. Par exemple :
{ "LocationArn": "arn:aws:datasync:us-east-1:123456789012:location/loc-12345678abcdefgh", "LocationUri": "azure-blob://my-user.blob.core.windows.net/container-1", "AuthenticationType": "SAS", "Subdirectory": "/my/images", "AgentArns": ["arn:aws:datasync:us-east-1:123456789012:agent/agent-01234567890deadfb"], }
Mettre à jour votre emplacement de transfert Azure Blob Storage
Si nécessaire, vous pouvez modifier la configuration de votre emplacement.
Note
Vous ne pouvez pas faire cela avec laDataSync console.
Note
Les instructions suivantes utilisent ladatasync-azure-blob
commande, mais vous pouvez donner à cette commande un autre nom. Pour plus d'informations, veuillez consulter Configuration avecAWS CLI.
-
Copiez la
update-location-azure-blob
commande suivante :aws datasync-azure-blob update-location-azure-blob \ --location-arn "
your-azure-blob-location-arn
" \ --authentication-type "SAS" \ --sas-configuration '{ "Token": "your-sas-token
" }' \ --agent-arnsmy-datasync-agent-arn
\ --subdirectory "/path/to/my/data
" -
Pour le
--location-arn
paramètre, spécifiez l'ARN de l'emplacement Azure Blob Storage que vous mettez à jour. -
Pour le
--authentication-type
paramètre, spécifiezSAS
. -
Pour l'
Token
option du--sas-configuration
paramètre, spécifiez le jeton SAS qui permetDataSync d'accéder à votre stockage blob.Le jeton fait partie de la chaîne d'URI SAS qui se trouve après l'URI de la ressource de stockage et un point d'interrogation. Un jeton ressemble à ceci :
sp=r&st=2022-12-20T14:54:52Z&se=2022-12-20T22:54:52Z&spr=https&sv=2021-06-08&sr=c&sig=qCBKDWQvyuVcTPH9EBp%2FXTI9E%2F%2Fmq171%2BZU178wcwqU%3D
-
Pour le
--agent-arns
paramètre, spécifiez l'Amazon Resource Name (ARN) de l'DataSyncagent que vous voulez connecter à votre conteneur.Voici un exemple d'ARN :
arn:aws:datasync:
us-east-1
:123456789012
:agent/agent-01234567890deadfb
Vous pouvez spécifier plusieurs agents. Pour plus d'informations, veuillez consulter Utiliser plusieurs AWS DataSync agents pour votre transfert.
-
Pour le
--subdirectory
paramètre, spécifiez des segments de chemin si vous souhaitez limiter votre transfert à un répertoire virtuel de votre conteneur (par exemple,/my/images
).DataSynccopie uniquement les objets comportant ces segments de chemin.
Important
Si votre jeton SAS ne permet d'accéder qu'à un sous-répertoire (ou dossier), vous devez spécifier le chemin complet vers ce sous-répertoire ici pour que le transfert fonctionne.
Gestion des métadonnées
La manièreDataSync dont les métadonnées sont gérées lors du transfert depuis Azure Blob Storage dépend de votre emplacement de destination.
Lorsque votre destination est | DataSyncpeut |
---|---|
|
Copiez les métadonnées suivantes vers la destination :
|
|
Appliquez les métadonnées POSIX par défaut aux fichiers et dossiers de destination. Cette approche inclut l'utilisation des valeurs d'ID utilisateur et d'ID de groupe POSIX par défaut. |
|
Appliquez les métadonnées suivantes à la destination :
|
Limites
Les limitations suivantes sont actuellement présentes lors du déplacement de données depuis Azure Blob Storage avecDataSync :
-
Vous pouvez créer un emplacement Azure Blob Storage dans toutes les régions Région AWSprises en charge, à l'DataSyncexception des régionsAWS GovCloud (US) et de la Chine.
-
Vous ne pouvez utiliser Azure Blob Storage que comme emplacement source.
-
Lors du transfert vers Amazon S3, aucun objet Azure Blob Storage d'une taille supérieure à 5 ToDataSync ne sera transféré.
-
Lors du transfert vers Amazon S3, les objets Azure Blob Storage dont les métadonnées dépassent 2 KoDataSync ne seront pas transférés.