Lavorare con Task Runner - AWS Data Pipeline

AWS Data Pipeline non è più disponibile per i nuovi clienti. I clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Lavorare con Task Runner

Task Runner è un'applicazione task agent che analizza AWS Data Pipeline le attività pianificate e le esegue su EC2 istanze Amazon, cluster EMR Amazon o altre risorse di calcolo, segnalando lo stato mentre lo fa. A seconda dell'applicazione, è possibile scegliere di:

  • Consenti di AWS Data Pipeline installare e gestire una o più applicazioni Task Runner per te. Quando viene attivata una pipeline, viene creato automaticamente l'EmrClusteroggetto predefinito Ec2Instance o a cui fa riferimento un runsOn campo di attività. AWS Data Pipeline si occupa dell'installazione di Task Runner su un'EC2istanza o sul nodo principale di un cluster. EMR In questo modello, AWS Data Pipeline può occuparsi della maggior parte della gestione dell'istanza o del cluster al posto tuo.

  • Eseguire tutta o parte di una pipeline su risorse gestite dall'utente. Le risorse potenziali includono un'EC2istanza Amazon a esecuzione prolungata, un EMR cluster Amazon o un server fisico. È possibile installare un task runner (che può essere Task Runner o un task agent personalizzato del proprio dispositivo) quasi ovunque, a condizione che possa comunicare con il servizio Web. AWS Data Pipeline In questo modello, si assume il controllo quasi completo su quali risorse vengono utilizzate e su come vengono gestite, ed è necessario installare e configurare manualmente Task Runner. Per eseguire questa operazione, utilizzare le procedure di questa sezione, come descritto in Esecuzione di lavori su risorse esistenti utilizzando Task Runner.