AWS Data Pipeline não está mais disponível para novos clientes. Clientes existentes da AWS Data Pipeline pode continuar usando o serviço normalmente. Saiba mais
As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ec2Resource
Uma EC2 instância da Amazon que executa o trabalho definido por uma atividade de pipeline.
AWS Data Pipeline agora é compatível com a EC2 instância Amazon, que usa um método orientado IMDSv2 por sessão para lidar melhor com a autenticação ao recuperar informações de metadados das instâncias. Uma sessão inicia e encerra uma série de solicitações que o software executado em uma EC2 instância da Amazon usa para acessar os metadados e as credenciais da instância EC2 Amazon armazenados localmente. O software inicia uma sessão com uma simples HTTP PUT solicitação paraIMDSv2. IMDSv2retorna um token secreto para o software executado na EC2 instância da Amazon, que usará o token como senha para fazer solicitações de metadados e credenciais. IMDSv2
nota
IMDSv2Para usar em sua EC2 instância Amazon, você precisará modificar as configurações, pois o padrão não AMI é compatível comIMDSv2. Você pode especificar uma nova AMI versão que pode ser recuperada por meio do seguinte SSM parâmetro:/aws/service/ami-amazon-linux-latest/amzn-ami-hvm-x86_64-ebs
.
Para obter informações sobre EC2 instâncias padrão da Amazon que são AWS Data Pipeline criadas se você não especificar uma instância, consulte Instâncias do Amazon EC2 padrão por região da AWS.
Exemplos
EC2-Clássico
Importante
Somente AWS contas criadas antes de 4 de dezembro de 2013 oferecem suporte à plataforma EC2 -Classic. Se você tiver uma dessas contas, poderá ter a opção de criar EC2Resource objetos para um pipeline em uma rede EC2 -Classic em vez de umaVPC. É altamente recomendável que você crie recursos para todos os seus pipelines emVPCs. Além disso, se você tiver recursos existentes no EC2 -Classic, recomendamos que você os migre para um. VPC
O objeto de exemplo a seguir inicia uma EC2 instância em EC2 -Classic, com alguns campos opcionais definidos.
{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroups" : [ "test-group", "default" ], "keyPair" : "
my-key-pair
" }
EC2-VPC
O objeto de exemplo a seguir inicia uma EC2 instância em uma instância não padrãoVPC, com alguns campos opcionais definidos.
{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroupIds" : [ "sg-
12345678
", "sg-12345678
" ], "subnetId": "subnet-12345678
", "associatePublicIpAddress": "true", "keyPair" : "my-key-pair
" }
Sintaxe
Campos obrigatórios | Descrição | Tipo de slot |
---|---|---|
resourceRole | A IAM função que controla os recursos que a EC2 instância da Amazon pode acessar. | String |
role (perfil) | A IAM função AWS Data Pipeline usada para criar a EC2 instância. | String |
Campos de invocação de objetos | Descrição | Tipo de slot |
---|---|---|
schedule |
Esse objeto é invocado durante a execução de um intervalo de programação. Para definir a ordem de execução de dependência desse objeto, especifique uma referência de programação para outro objeto. Você pode fazer isso por meio de uma das seguintes maneiras:
|
Objeto de referência. Por exemplo
|
Campos opcionais | Descrição | Tipo de slot |
---|---|---|
actionOnResourceFalha | A ação executada após uma falha de recurso para este recurso. Os valores válidos são "retryall" e "retrynone" . |
String |
actionOnTaskFalha | A ação executada após uma falha de tarefa para este recurso. Os valores válidos são "continue" ou "terminate" . |
String |
associatePublicIpEndereço | Indica se um endereço IP público deve ou não ser atribuído à instância. Se a instância estiver na Amazon EC2 ou na AmazonVPC, o valor padrão serátrue . Caso contrário, o valor padrão será false . |
Booleano |
attemptStatus | Status mais recente da atividade remota. | String |
attemptTimeout | O tempo limite para a conclusão do trabalho remoto. Se definido, uma atividade remota não concluída dentro do prazo definido poderá ser executada novamente. | Período |
availabilityZone | A zona de disponibilidade na qual iniciar a EC2 instância da Amazon. | String |
disableIMDSv1 | O valor padrão é falso e ativa tanto IMDSv1 IMDSv2 e. Se você defini-lo como verdadeiro, ele desativará IMDSv1 e fornecerá apenas IMDSv2s | Booleano |
failureAndRerunModo | Descreve o comportamento do nó do consumidor quando as dependências apresentam falhas ou são executadas novamente. | Enumeração |
httpProxy | O host proxy que os clientes usam para se conectar aos AWS serviços. | Objeto de referência. Por exemplo: "httpProxy":{"ref":"myHttpProxyId"} |
imageId | O ID do AMI a ser usado para a instância. Por padrão, AWS Data Pipeline usa o tipo de HVM AMI virtualização. Os específicos AMI IDs usados são baseados em uma região. Você pode substituir o padrão AMI especificando o HVM AMI de sua escolha. Para obter mais informações sobre AMI tipos, consulte Tipos de AMI virtualização Linux e Como encontrar um Linux AMI no Guia do EC2 usuário da Amazon. |
String |
initTimeout | A quantidade de tempo de espera antes da inicialização do recurso. | Período |
instanceCount | Suspenso. | Inteiro |
instanceType | O tipo de EC2 instância da Amazon a ser iniciada. | String |
keyPair | O nome do par de chaves. Se você iniciar uma EC2 instância da Amazon sem especificar um par de chaves, não poderá fazer login nela. | String |
lateAfterTimeout | O tempo decorrido após o início do pipeline no qual o objeto deve ser concluído. Ele é acionado somente quando o tipo de programação não está definido como ondemand . |
Período |
maxActiveInstances | O número máximo de instâncias ativas simultâneas de um componente. Novas execuções não contam para o número de instâncias ativas. | Inteiro |
maximumRetries | A quantidade máxima de novas tentativas após uma falha. | Inteiro |
minInstanceCount | Suspenso. | Inteiro |
onFail | Uma ação a ser executada quando há falha no objeto atual. | Objeto de referência. Por exemplo "onFail":{"ref":"myActionId"} |
onLateAction | Ações que devem ser acionadas se um objeto ainda não foi programado ou ainda está em execução. | Objeto de referência. Por exemplo "onLateAction":{"ref":"myActionId"} |
onSuccess | Uma ação a ser executada quando o objeto atual é executado com êxito. | Objeto de referência. Por exemplo: "onSuccess":{"ref":"myActionId"} |
parent | O pai do objeto atual a partir do qual os slots são herdados. | Objeto de referência. Por exemplo: "parent":{"ref":"myBaseObjectId"} |
pipelineLogUri | O Amazon S3 URI (como's3://BucketName/Key/' ) para fazer o upload de registros para o pipeline. |
String |
região | O código da região na qual a EC2 instância da Amazon deve ser executada. Por padrão, a instância é executada na mesma região que o pipeline. Você pode executar a instância na mesma região como um conjunto de dados dependente. | Enumeração |
reportProgressTimeout | O tempo limite para as chamadas sucessivas de trabalho remoto para reportProgress . Se definidas, as atividades remotas sem progresso para o período especificado podem ser consideradas como interrompidas e serão executadas novamente. |
Período |
retryDelay | A duração do tempo limite entre duas novas tentativas. | Período |
runAsUser | O usuário que executará TaskRunner o. | String |
runsOn | Esse campo não é permitido neste objeto. | Objeto de referência. Por exemplo: "runsOn":{"ref":"myResourceId"} |
scheduleType |
O tipo de programação permite que você especifique se os objetos na sua definição de pipeline devem ser programados no início do intervalo, no final do intervalo ou sob demanda. Os valores são:
|
Enumeração |
securityGroupIds | O IDs de um ou mais grupos de EC2 segurança da Amazon a serem usados para as instâncias no pool de recursos. | String |
securityGroups | Um ou mais grupos EC2 de segurança da Amazon para usar nas instâncias no pool de recursos. | String |
spotBidPrice | O valor máximo por hora para sua instância spot em dólares, que é um valor decimal entre 0 e 20,00, exclusivos. | String |
subnetId | O ID da EC2 sub-rede da Amazon na qual iniciar a instância. | String |
terminateAfter | O número de horas após o qual encerrar o recurso. | Período |
useOnDemandOnLastAttempt | Na última tentativa de solicitar uma instância spot, faça um pedido para instâncias sob demanda em vez de uma instância spot. Isso garante que, se todas as tentativas anteriores falharam, a última tentativa não será interrompida. | Booleano |
workerGroup | Esse campo não é permitido neste objeto. | String |
Campos de tempo de execução | Descrição | Tipo de slot |
---|---|---|
@activeInstances | Lista dos objetos da instância ativa agendados no momento. | Objeto de referência. Por exemplo: "activeInstances":{"ref":"myRunnableObjectId"} |
@actualEndTime | Hora em que a execução deste objeto foi concluída. | DateTime |
@actualStartTime | Hora em que a execução deste objeto foi iniciada. | DateTime |
cancellationReason | O cancellationReason se esse objeto foi cancelado. |
String |
@cascadeFailedOn | Descrição da cadeia de dependências na qual o objeto apresentou falha. | Objeto de referência. Por exemplo: "cascadeFailedOn":{"ref":"myRunnableObjectId"} |
emrStepLog | Os registros de etapas estão disponíveis somente nas tentativas de EMR atividade da Amazon. | String |
errorId | O ID do erro se esse objeto apresentou falha. | String |
errorMessage | A mensagem de erro se esse objeto apresentou falha. | String |
errorStackTrace | O rastreamento de pilha com erro se esse objeto apresentou falha. | String |
@failureReason | O motivo da falha de recurso. | String |
@finishedTime | A hora em que esse objeto terminou a execução. | DateTime |
hadoopJobLog | Registros de tarefas do Hadoop disponíveis sobre tentativas de atividades na AmazonEMR. | String |
@healthStatus | O status de integridade do objeto que indica se houve sucesso ou falha na última instância concluída do objeto. | String |
@healthStatusFromInstanceId | ID do último objeto da instância concluído. | String |
@ healthStatusUpdated Hora | Hora em que o status de integridade foi atualizado pela última vez. | DateTime |
hostname | O nome do host do cliente que capturou a tentativa da tarefa. | String |
@lastDeactivatedTime | A hora em que esse objeto foi desativado pela última vez. | DateTime |
@ latestCompletedRun Hora | Hora da última execução concluída. | DateTime |
@latestRunTime | Hora da última execução programada. | DateTime |
@nextRunTime | Hora da próxima execução a ser programada. | DateTime |
reportProgressTime | A última vez em que a atividade remota relatou progresso. | DateTime |
@scheduledEndTime | O horário de término programado para o objeto. | DateTime |
@scheduledStartTime | O horário de início programado para o objeto. | DateTime |
@status | O status deste objeto. | String |
@version | A versão do pipeline com que o objeto foi criado. | String |
@waitingOn | Descrição da lista de dependências em que este objeto está aguardando. | Objeto de referência. Por exemplo: "waitingOn":{"ref":"myRunnableObjectId"} |
Campos do sistema | Descrição | Tipo de slot |
---|---|---|
@error | Erro ao descrever o objeto malformado. | String |
@pipelineId | ID do pipeline ao qual este objeto pertence. | String |
@sphere | O local de um objeto no ciclo de vida. Objetos de componentes dão origem a objetos de instância, que executam objetos de tentativa. | String |