Amazon EMR 用の VPC でネットワークを設定する - Amazon EMR

Amazon EMR 用の VPC でネットワークを設定する

ほとんどのクラスターは、Amazon Virtual Private Cloud (Amazon VPC) を使用して仮想ネットワークで起動します。VPC は、AWS アカウント内で論理的に分離されている、AWS 内の分離された仮想ネットワークです。プライベート IP アドレス範囲、サブネット、ルーティングテーブル、ネットワークゲートウェイなどの側面を設定できます。詳細については、Amazon VPC ユーザーガイドを参照してください。

VPCは、次の機能を提供します。

  • 機密データを処理する

    VPC 内でクラスターを起動することは、ルーティングテーブルや、ネットワークにアクセスできるユーザーを定義するネットワーク ACL などの追加的なツールを備えたプライベートネットワーク内でクラスターを起動することに似ています。クラスターで機密データを処理する場合は、VPC 内でクラスターを起動することで得られる追加のアクセスコントロールが必要になる可能性があります。さらに、これらのリソースのいずれにも直接的なインターネット接続を持たないプライベートサブネット内でリソースを起動することもできます。

  • 内部ネットワーク上のリソースにアクセスする

    データソースがプライベートネットワーク内に存在する場合、そのデータを Amazon EMR にインポートするために AWS にアップロードすることは、転送するデータの量またはデータの機密性の理由で、実用的でない、または望ましくないことがあります。代わりにクラスターを VPC 内で起動し、VPN 接続によってデータセンターと VPC を接続すると、クラスターは内部ネットワーク上のリソースにアクセスすることができます。たとえば、データセンターに Oracle データベースがある場合、クラスターを VPN でネットワークに接続した VPC 内で起動すると、クラスターはその Oracle データベースにアクセスできます。

パブリックサブネットおよびプライベートサブネット

パブリックおよびプライベート VPC サブネットの両方で Amazon EMR クラスターを起動できます。これは、Amazon EMR クラスターを実行するために、インターネット接続が不要であることを意味します。ただし、例えば企業イントラネット内、または AWS Key Management Service などのパブリック AWS サービスエンドポイントなど、VPC の外側にあるサービスまたはリソースにアクセスするために、サービスネットワークアドレス変換 (NAT) および VPN ゲートウェイを設定しなければならない場合があります。

重要

プライベートサブネットでのクラスターの起動をサポートするのは、Amazon EMR リリースバージョン 4.2 以降のみです。

Amazon VPC の詳細については、「Amazon VPC ユーザーガイド」を参照してください。

VPC に関するその他のリソース

以下のトピックでは、VPC およびサブネットの詳細について説明します。