Seção [fsx] - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Seção [fsx]

Define as definições de configuração para um sistema de arquivos do FSx para Lustre. Para obter mais informações, consulte CreateFileSystem do Amazon FSx na Referência da API do Amazon FSx.

Se base_os for alinux2, centos7, ubuntu1804, ou ubuntu2004, o FSx para Lustre é suportado.

Ao usar o Amazon Linux, o kernel deve ser 4.14.104-78.84.amzn1.x86_64 ou uma versão posterior. Para obter instruções de instalação para outras distribuições Linux, consulte Instalação do cliente Lustre no Guia de usuário do Amazon FSx para Lustre.

nota

No momento, não há suporte para o Lustre ao usar awsbatch como programador.

nota

O suporte para FSx para Lustre do centos8 foi removido do AWS ParallelCluster versão 2.10.4. O suporte para FSx para Lustre do ubuntu2004 foi adicionado ao AWS ParallelCluster versão 2.11.0. O suporte para FSx para Lustre do centos8 foi adicionado ao AWS ParallelCluster versão 2.10.0. O suporte para FSx para Lustre do alinux2, do ubuntu1604, e do ubuntu1804 foi adicionado ao AWS ParallelCluster versão 2.6.0. O suporte para FSx para Lustre do centos7 foi adicionado ao AWS ParallelCluster versão 2.4.0.

Se estiver usando um sistema de arquivos existente, ele deve ser associado a um grupo de segurança que permita o tráfego de entrada do TCP à porta 988. Definir a origem como 0.0.0.0/0 em uma regra de grupo de segurança fornece acesso ao cliente de todos os intervalos de IP no grupo de segurança da VPC para o protocolo e o intervalo de portas dessa regra. Para limitar ainda mais o acesso aos seus sistemas de arquivos, recomendamos o uso de fontes mais restritivas para suas regras de grupo de segurança. Por exemplo, você pode usar intervalos CIDR, endereços IP ou IDs de grupos de segurança mais específicos. Isso será feito automaticamente quando não estiver usando vpc_security_group_id.

Para usar um sistema de arquivos existente do Amazon FSx para armazenamento permanente de longo prazo que seja independente do ciclo de vida do cluster, especifique fsx_fs_id.

Se você não especificar fsx_fs_id, o AWS ParallelCluster cria o sistema de arquivos do FSx para Lustre a partir das configurações [fsx] ao criar o cluster e exclui o sistema de arquivos e os dados quando o cluster é excluído.

Para obter mais informações, consulte Melhores práticas: migrar um cluster para um novo AWS ParallelCluster versão secundária ou patch.

O formato é [fsx fsx-name]. nome-fsx deve começar com uma letra, conter no máximo 30 caracteres e conter apenas letras, números, hifens (-) e sublinhados (_).

[fsx fs] shared_dir = /fsx fsx_fs_id = fs-073c3803dca3e28a6

Para criar e configurar um novo sistema de arquivos, use os seguintes parâmetros:

[fsx fs] shared_dir = /fsx storage_capacity = 3600 imported_file_chunk_size = 1024 export_path = s3://bucket/folder import_path = s3://bucket weekly_maintenance_start_time = 1:00:00

auto_import_policy

(Opcional) Especifica a política de importação automática para refletir as alterações no bucket do S3 usado para criar o sistema de arquivos FSx para Lustre. Os valores possíveis são os seguintes:

NEW

O FSx para Lustre importa automaticamente listagens de diretórios de quaisquer novos objetos adicionados ao bucket do S3 vinculado que não existam atualmente no sistema de arquivos FSx para Lustre.

NEW_CHANGED

O FSx para Lustre importa automaticamente listagens de arquivos e diretórios de quaisquer novos objetos adicionados ao bucket do S3 e quaisquer objetos existentes que sejam alterados no bucket do S3.

Isso corresponde à propriedade AutoImportPolicy. Para obter mais informações, consulte Importar atualizações do bucket do S3 automaticamente no Guia do usuário do Amazon FSx para Lustre. Quando o parâmetro auto_import_policy é especificado, os parâmetros automatic_backup_retention_days, copy_tags_to_backups, daily_automatic_backup_start_time, e fsx_backup_id não devem ser especificados.

Se a configuração auto_import_policy não for especificada, as importações automáticas serão desabilitadas. O FSx para Lustre atualiza somente as listagens de arquivos e diretórios do bucket do S3 vinculado quando o sistema de arquivos é criado.

auto_import_policy = NEW_CHANGED
nota

O suporte para auto_import_policy foi adicionado ao AWS ParallelCluster versão 2.10.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

automatic_backup_retention_days

(Opcional) Especifica o número de dias em que os backups automáticos serão retidos. Válido somente para uso com tipos de implantação PERSISTENT_1. Quando o parâmetro automatic_backup_retention_days é especificado, os parâmetros auto_import_policy, export_path, import_path, e imported_file_chunk_size não devem ser especificados. Isso corresponde à propriedade AutomaticBackupRetentionDays.

O valor padrão é 0. Esta opção desabilita os backups automáticos. Os valores possíveis são números inteiros entre 0 e 35, inclusive.

automatic_backup_retention_days = 35
nota

O suporte para automatic_backup_retention_days foi adicionado ao AWS ParallelCluster versão 2.8.0.

Política de atualização: essa configuração pode ser alterada durante uma atualização.

copy_tags_to_backups

(Opcional) Especifica se as tags do sistema de arquivos são copiadas para os backups. Válido somente para uso com tipos de implantação PERSISTENT_1. Quando o parâmetro copy_tags_to_backups é especificado, o automatic_backup_retention_days deve ser especificado com um valor maior que 0 e os parâmetros auto_import_policy, export_path, import_path e imported_file_chunk_size não devem ser especificados. Isso corresponde à propriedade CopyTagsToBackups.

O valor padrão é false.

copy_tags_to_backups = true
nota

O suporte para copy_tags_to_backups foi adicionado ao AWS ParallelCluster versão 2.8.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

daily_automatic_backup_start_time

(Opcional) Especifica a hora do dia (UTC) para iniciar os backups automáticos. Válido somente para uso com tipos de implantação PERSISTENT_1. Quando o parâmetro daily_automatic_backup_start_time é especificado, o automatic_backup_retention_days deve ser especificado com um valor maior que 0 e os parâmetros auto_import_policy, export_path, import_path e imported_file_chunk_size não devem ser especificados. Isso corresponde à propriedade DailyAutomaticBackupStartTime.

O formato é HH:MM, onde HH é a hora do dia preenchida com zeros (0-23) e MM é o minuto da hora preenchido com zeros. Por exemplo, 1:03 da manhã UTC é o seguinte.

daily_automatic_backup_start_time = 01:03

O valor padrão é um tempo randomizado entre 00:00 e 23:59.

nota

O suporte para daily_automatic_backup_start_time foi adicionado ao AWS ParallelCluster versão 2.8.0.

Política de atualização: essa configuração pode ser alterada durante uma atualização.

data_compression_type

(Opcional) Especifica o tipo de compactação de dados FSx para Lustre. Isso corresponde à propriedade dataCompressionType. Para obter mais informações, consulte Compactação de dados do FSx para Lustre no Guia do usuário do Amazon FSx para Lustre.

O único valor válido é LZ4. Para desabilitar a compactação de dados, remova o parâmetro data_compression_type.

data_compression_type = LZ4
nota

O suporte para data_compression_type foi adicionado ao AWS ParallelCluster versão 2.11.0.

Política de atualização: essa configuração pode ser alterada durante uma atualização.

deployment_type

(Opcional) Especifica o tipo de implantação do FSx para Lustre. Isso corresponde à propriedade DeploymentType. Para obter mais informações, consulte Opções de implantação do FSx para Lustre no Guia do usuário do Amazon FSx para Lustre. Escolha um tipo de implantação temporária para armazenamento temporário e processamento de dados em curto prazo. O SCRATCH_2 é a última geração de sistemas de arquivos transitórios. Ele oferece uma taxa de transferência de intermitência mais alta que o throughput basal e criptografia de dados em trânsito.

Os valores válidos são SCRATCH_1, SCRATCH_2 e PERSISTENT_1.

SCRATCH_1

O tipo de implantação padrão para FSx para Lustre. Com esse tipo de implantação, a configuração storage_capacity tem valores possíveis de 1200, 2400 e qualquer múltiplo de 3600. O suporte para SCRATCH_1 foi adicionado ao AWS ParallelCluster versão 2.4.0.

SCRATCH_2

A última geração de sistemas de arquivos transitórios. Suporta até seis vezes o throughput basal para workloads com picos. Ele também oferece suporte à criptografia de dados em trânsito para tipos de instância compatíveis em Regiões da AWS suportadas. Para obter mais informações, consulte Criptografia de dados em trânsito no Guia do usuário do Amazon FSx para Lustre. Com esse tipo de implantação, a configuração storage_capacity tem valores possíveis de 1200 e qualquer múltiplo de 2400. O suporte para SCRATCH_2 foi adicionado ao AWS ParallelCluster versão 2.6.0.

PERSISTENT_1

Projetada para armazenamento de longo prazo. Os servidores de arquivos são altamente disponíveis e os dados são replicados automaticamente dentro da zona de disponibilidade da AWS do sistema de arquivos. Oferece suporte à criptografia de dados em trânsito para tipos de instância suportadas. Com esse tipo de implantação, a configuração storage_capacity tem valores possíveis de 1200 e qualquer múltiplo de 2400. O suporte para PERSISTENT_1 foi adicionado ao AWS ParallelCluster versão 2.6.0.

O valor padrão é SCRATCH_1.

deployment_type = SCRATCH_2
nota

O suporte para deployment_type foi adicionado ao AWS ParallelCluster versão 2.6.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

drive_cache_type

(Opcional) Especifica que o sistema de arquivos tem um cache de unidade SSD. Se isso estiver definido, a configuração storage_type deverá ser definida como HDD. Isso corresponde à propriedade DriveCachetype. Para obter mais informações, consulte Opções de implantação do FSx para Lustre no Guia do usuário do Amazon FSx para Lustre.

O único valor válido é READ. Para desabilitar o cache da unidade SSD, não especifique a configuração drive_cache_type.

drive_cache_type = READ
nota

O suporte para drive_cache_type foi adicionado ao AWS ParallelCluster versão 2.10.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

export_path

(Opcional) Especifica o caminho do Amazon S3 para onde a raiz do sistema de arquivos é exportada. Quando o parâmetro export_path é especificado, os parâmetros automatic_backup_retention_days, copy_tags_to_backups, daily_automatic_backup_start_time, e fsx_backup_id não devem ser especificados. Isso corresponde à propriedade exportPath. Os dados e metadados dos arquivos não são exportados automaticamente para o export_path. Para obter informações sobre a exportação de dados e metadados, consulte Exportação de alterações para repositório de dados no Guia do usuário do Amazon FSx para Lustre.

O valor padrão é s3://import-bucket/FSxLustre[creation-timestamp], em que import-bucket é o bucket fornecido no parâmetro import_path.

export_path = s3://bucket/folder

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

fsx_backup_id

(Opcional) Especifica o ID do backup a ser usado para restaurar o sistema de arquivos a partir de um backup existente. Quando o parâmetro fsx_backup_id é especificado, os parâmetros auto_import_policy, deployment_type, export_path, fsx_kms_key_id, import_path, imported_file_chunk_size, storage_capacity e per_unit_storage_throughput não devem ser especificados. Esses parâmetros são lidos do backup. Além disso os parâmetros auto_import_policy, export_path, import_path e imported_file_chunk_size não devem ser especificados.

Isso corresponde à propriedade BackupId.

fsx_backup_id = backup-fedcba98
nota

O suporte para fsx_backup_id foi adicionado ao AWS ParallelCluster versão 2.8.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

fsx_fs_id

(Opcional) Anexa um sistema de arquivos do FSx para Lustre existente.

Se essa opção for especificada, somente as configurações shared_dir e fsx_fs_id da seção [fsx] serão usadas e todas as outras configurações da seção [fsx] serão ignoradas.

fsx_fs_id = fs-073c3803dca3e28a6

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

fsx_kms_key_id

(Opcional) Especifica o ID de chave da sua chave gerenciada pelo cliente do AWS Key Management Service (AWS KMS).

Essa chave é usada para criptografar os dados no sistema de arquivos em repouso.

Isso deve ser usado com uma ec2_iam_role personalizada. Para obter mais informações, consulte Criptografia de disco com uma chave do KMS personalizada. Isso corresponde ao parâmetro KmsKeyId na Referência de API do Amazon FSx.

fsx_kms_key_id = xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
nota

O suporte para fsx_kms_key_id foi adicionado ao AWS ParallelCluster versão 2.6.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

import_path

(Opcional) Especifica o bucket do S3 do qual serão carregados os dados no sistema de arquivos e que servirá como bucket de exportação. Para obter mais informações, consulte export_path. Se você especificar o parâmetro import_path, os parâmetros automatic_backup_retention_days, copy_tags_to_backups, daily_automatic_backup_start_time, e fsx_backup_id não devem ser especificados. Isso corresponde ao parâmetro ImportPath na Referência de API do Amazon FSx.

A importação ocorre na criação do cluster. Para obter mais informações, consulte Importar dados do repositório de dados no Guia do usuário do Amazon FSx para Lustre. Na importação, somente os metadados do arquivo (nome, propriedade, registro de data e hora e permissões) são importados. Os dados do arquivo não são importados do bucket do S3 até que o arquivo seja acessado pela primeira vez. Para obter informações sobre o pré-carregamento do conteúdo do arquivo, consulte Pré-carregamento de arquivos em seu sistema de arquivos no Guia do usuário do Amazon FSx para Lustre.

Se um valor não for fornecido, o sistema de arquivos ficará vazio.

import_path = s3://bucket

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

imported_file_chunk_size

(Opcional) Determina a contagem de stripe e a quantidade máxima de dados para cada arquivo (em MiB) armazenados em um único disco físico, para arquivos que são importados de um repositório de dados (usando import_path). O número máximo de discos nos quais um único arquivo pode ser distribuído é limitado pelo número total de discos que compõem o sistema de arquivos. Quando o parâmetro imported_file_chunk_size é especificado, os parâmetros automatic_backup_retention_days, copy_tags_to_backups, daily_automatic_backup_start_time, e fsx_backup_id não devem ser especificados. Isso corresponde à propriedade ImportedFileChunkSize.

O tamanho de bloco padrão é 1024 (1 GiB) e pode chegar a 512.000 MiB (500 GiB). Os objetos do Amazon S3 têm um tamanho máximo de 5 TB.

imported_file_chunk_size = 1024

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

per_unit_storage_throughput

(Necessário para tipos de implantação PERSISTENT_1) Para o tipo de implantação deployment_type = PERSISTENT_1, descreve a quantidade de taxa de transferência de leitura e gravação para cada 1 tebibyte (TiB) de armazenamento, em MB/s/TiB. A capacidade de throughput do sistema de arquivos é calculada multiplicando-se a capacidade de armazenamento do sistema de arquivos (TiB) pela per_unit_storage_throughput (MB/s/TiB). Para um sistema de arquivos de 2,4 TiB, o provisionamento de 50 MB/s/TiB per_unit_storage_throughput gera 120 MB/s de taxa de transferência do sistema de arquivos. Você paga pela quantidade de throughput que provisiona. Isso corresponde à propriedade PerUnitStorageThroughput.

Os valores possíveis dependem do valor da configuração storage_type.

storage_type = SSD

Os valores possíveis são 50, 100, 200.

storage_type = HDD

Os valores possíveis são 12, 40.

per_unit_storage_throughput = 200
nota

O suporte para per_unit_storage_throughput foi adicionado ao AWS ParallelCluster versão 2.6.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

shared_dir

(Obrigatório) Define o ponto de montagem para o sistema de arquivos do FSx para Lustre nos nós principal e de computação.

Não use NONE ou /NONE como o diretório compartilhado.

O exemplo a seguir monta o sistema de arquivos em /fsx.

shared_dir = /fsx

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

storage_capacity

(Obrigatório) Especifica a capacidade de armazenamento do sistema de arquivos, em GiB. Isso corresponde à propriedade StorageCapacity.

Os valores possíveis da capacidade de armazenamento variam de acordo com a configuração deployment_type.

SCRATCH_1

Os valores possíveis são 1200, 2400 e qualquer múltiplo de 3600.

SCRATCH_2

Os valores possíveis são 1200 e qualquer múltiplo de 2400.

PERSISTENT_1

Os valores possíveis variam de acordo com os valores de outras configurações.

storage_type = SSD

Os valores possíveis são 1200 e qualquer múltiplo de 2400.

storage_type = HDD

Os valores possíveis variam de acordo com definição da configuração per_unit_storage_throughput.

per_unit_storage_throughput = 12

Os valores possíveis são qualquer múltiplo de 6000.

per_unit_storage_throughput = 40

Os valores possíveis são qualquer múltiplo de 1800.

storage_capacity = 7200
nota

Para as versões 2.5.0 e 2.5.1 do AWS ParallelCluster, a storage_capacity tem os valores possíveis de 1200, 2400 e qualquer múltiplo de 3600. Para versões anteriores à 2.5.0 do AWS ParallelCluster, a storage_capacity tinha um tamanho mínimo de 3600.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

storage_type

(Opcional) Especifica o tipo de armazenamento do sistema de arquivos. Isso corresponde à propriedade StorageType. Os valores possíveis são SSD e HDD. O padrão é SSD.

O tipo de armazenamento altera os valores possíveis de outras configurações.

storage_type = SSD

Especifica o tipo de armazenamento em unidade de estado sólido (SSD).

storage_type = SSD altera os valores possíveis de várias outras configurações.

drive_cache_type

Essa configuração pode ser especificada.

deployment_type

Essa configuração pode ser definida como SCRATCH_1, SCRATCH_2, ouPERSISTENT_1.

per_unit_storage_throughput

Essa configuração deve ser especificada se deployment_type for definida como PERSISTENT_1. Os valores possíveis são 50, 100, ou 200.

storage_capacity

Essa configuração deve ser especificada. Os valores possíveis variam de acordo com deployment_type.

deployment_type = SCRATCH_1

storage_capacity pode ser 1200, 2400 ou qualquer múltiplo de 3600.

deployment_type = SCRATCH_2 ou deployment_type = PERSISTENT_1

storage_capacity pode ser 1200 ou qualquer múltiplo de 2400.

storage_type = HDD

Especifica o tipo de armazenamento em unidade de disco rígido (HDD).

storage_type = HDD altera os valores possíveis de várias outras configurações.

drive_cache_type

Essa configuração pode ser especificada.

deployment_type

Essa configuração deve ser definida como PERSISTENT_1.

per_unit_storage_throughput

Essa configuração deve ser especificada. Os valores possíveis são 12, ou 40.

storage_capacity

Essa configuração deve ser especificada. Os valores possíveis variam de acordo com a configuração per_unit_storage_throughput.

storage_capacity = 12

storage_capacity pode ser qualquer múltiplo de 6000.

storage_capacity = 40

storage_capacity pode ser qualquer múltiplo de 1800.

storage_type = SSD
nota

O suporte para a configuração storage_type foi adicionado no AWS ParallelCluster versão 2.10.0.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

weekly_maintenance_start_time

(Opcional) Especifica um tempo preferencial para executar a manutenção semanal, no fuso horário UTC. Isso corresponde à propriedade WeeklyMaintenanceStartTime.

O formato é [dia da semana]:[hora do dia]:[minuto da hora]. Por exemplo, segunda-feira à meia-noite é o seguinte.

weekly_maintenance_start_time = 1:00:00

Política de atualização: essa configuração pode ser alterada durante uma atualização.