Task Runnerの操作 - AWS Data Pipeline

AWS Data Pipeline は、新規顧客には利用できなくなりました。の既存のお客様は、通常どおりサービスを AWS Data Pipeline 引き続き使用できます。詳細はこちら

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Task Runnerの操作

Task Runner は、スケジュールされたタスク AWS Data Pipeline をポーリングして Amazon EC2インスタンス、Amazon EMRクラスター、またはその他の計算リソースで実行し、ステータスを報告するタスクエージェントアプリケーションです。アプリケーションによっては、以下を行うことができます。

  • AWS Data Pipeline に 1 つ以上の Task Runner アプリケーションのインストールと管理を許可します。パイプラインがアクティブ化されると、アクティビティ runsOn フィールドによって参照されるデフォルトの Ec2Instanceまたは EmrCluster オブジェクトが自動的に作成されます。 は、EC2インスタンスまたは EMRクラスターのマスターノードに Task Runner AWS Data Pipeline をインストールします。このパターンでは、 AWS Data Pipeline はほとんどのインスタンスまたはクラスター管理を実行できます。

  • パイプラインの全体または一部を、お客様が管理するリソースで実行する。潜在的なリソースには、長時間実行される Amazon EC2インスタンス、Amazon EMRクラスター、または物理サーバーが含まれます。タスクランナー (Task Runner または独自のデバイスのカスタムタスクエージェントのいずれか) は、 AWS Data Pipeline ウェブサービスと通信できる限り、ほぼどこでもインストールできます。このパターンでは、どのリソースが使用されどのように管理されるかをお客様がほぼ完全に制御できますが、Task Runnerは手動でインストールおよび設定する必要があります。これを行うには、「Task Runnerを使用した既存のリソースでの作業の実行」に記載されている手順を使用します。