翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ステップ 1: Amazon Keyspaces と Apache Cassandra Spark コネクタとの統合を設定する
このステップでは、アカウントのパーティショナーが Apache Spark Connector と互換性があることを確認し、必要なIAMアクセス許可を設定します。以下のベストプラクティスは、テーブルに十分な読み取り/書き込みキャパシティをプロビジョニングするときに利用できます。
-
Murmur3Partitioner
パーティショナーがアカウントのデフォルトパーティショナーであることを確認してください。このパーティショナーには Spark Cassandra コネクタと互換性があります。パーティショナーとその変更方法の詳細については、「Amazon Keyspaces でのパーティショナーの操作」を参照してください。 -
Apache Spark でインターフェイスVPCエンドポイントを使用して Amazon Keyspaces のIAMアクセス許可を設定します。
-
以下に示すIAMポリシーの例に示すように、ユーザーテーブルへの読み取り/書き込みアクセスとシステムテーブルへの読み取りアクセスを割り当てます。
-
VPC エンドポイント を介して Spark で Amazon Keyspaces にアクセスするクライアントには、使用可能なインターフェイスVPCエンドポイントを system.peers テーブルに入力する必要があります。
{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Action":[ "cassandra:Select", "cassandra:Modify" ], "Resource":[ "arn:aws:cassandra:us-east-1:111122223333:/keyspace/mykeyspace/table/mytable", "arn:aws:cassandra:us-east-1:111122223333:/keyspace/system*" ] }, { "Sid":"ListVPCEndpoints", "Effect":"Allow", "Action":[ "ec2:DescribeNetworkInterfaces", "ec2:DescribeVpcEndpoints" ], "Resource":"*" } ] }
-
-
Amazon Keyspaces テーブルで Spark Cassandra コネクタからのトラフィックをサポートできる十分な読み取り/書き込みスループットキャパシティを設定する場合、以下のベストプラクティスを検討してください。
-
最初は、シナリオのテストに役立つオンデマンドキャパシティから始めす。
-
コネクタからのトラフィックにレートリミッターを使用し、自動スケーリングでプロビジョニングされたキャパシティを使用するようにテーブルを設定して本番環境のテーブルスループットのコストを最適化します。詳細については、「Amazon Keyspaces Auto Scaling でスループットキャパシティを自動的に管理する」を参照してください。
-
Cassandra ドライバーに付属の固定レートリミッターを使用できます。には、Amazon Keyspaces に合わせたレートリミッター
がいくつかあります。 AWS サンプル リポジトリ。 -
キャパシティイベントの詳細については、「Amazon Keyspaces で読み取り/書き込みキャパシティモードを設定する」を参照してください。
-