Amazon EMR 用の VPC でネットワークを設定する
ほとんどのクラスターは、Amazon Virtual Private Cloud (Amazon VPC) を使用して仮想ネットワークで起動します。VPC は、AWS アカウント内で論理的に分離されている、AWS 内の分離された仮想ネットワークです。プライベート IP アドレス範囲、サブネット、ルーティングテーブル、ネットワークゲートウェイなどの側面を設定できます。詳細については、Amazon VPC ユーザーガイドを参照してください。
VPCは、次の機能を提供します。
-
機密データを処理する
VPC 内でクラスターを起動することは、ルーティングテーブルや、ネットワークにアクセスできるユーザーを定義するネットワーク ACL などの追加的なツールを備えたプライベートネットワーク内でクラスターを起動することに似ています。クラスターで機密データを処理する場合は、VPC 内でクラスターを起動することで得られる追加のアクセスコントロールが必要になる可能性があります。さらに、これらのリソースのいずれにも直接的なインターネット接続を持たないプライベートサブネット内でリソースを起動することもできます。
-
内部ネットワーク上のリソースにアクセスする
データソースがプライベートネットワーク内に存在する場合、そのデータを Amazon EMR にインポートするために AWS にアップロードすることは、転送するデータの量またはデータの機密性の理由で、実用的でない、または望ましくないことがあります。代わりにクラスターを VPC 内で起動し、VPN 接続によってデータセンターと VPC を接続すると、クラスターは内部ネットワーク上のリソースにアクセスすることができます。たとえば、データセンターに Oracle データベースがある場合、クラスターを VPN でネットワークに接続した VPC 内で起動すると、クラスターはその Oracle データベースにアクセスできます。
パブリックサブネットおよびプライベートサブネット
パブリックおよびプライベート VPC サブネットの両方で Amazon EMR クラスターを起動できます。これは、Amazon EMR クラスターを実行するために、インターネット接続が不要であることを意味します。ただし、例えば企業イントラネット内、または AWS Key Management Service などのパブリック AWS サービスエンドポイントなど、VPC の外側にあるサービスまたはリソースにアクセスするために、サービスネットワークアドレス変換 (NAT) および VPN ゲートウェイを設定しなければならない場合があります。
重要
プライベートサブネットでのクラスターの起動をサポートするのは、Amazon EMR リリースバージョン 4.2 以降のみです。
Amazon VPC の詳細については、「Amazon VPC ユーザーガイド」を参照してください。
トピック
VPC に関するその他のリソース
以下のトピックでは、VPC およびサブネットの詳細について説明します。
-
VPC のプライベートサブネット
-
VPC のパブリックサブネット
-
一般的な VPC 情報