

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 步驟 1：設定 Amazon Keyspaces 以與 Apache Cassandra Spark Connector 整合
<a name="spark-tutorial-step1"></a>

在此步驟中，您確認帳戶的分割區器與 Apache Spark Connector 相容，並設定所需的 IAM 許可。下列最佳實務可協助您為資料表佈建足夠的讀取/寫入容量。

1. 確認`Murmur3Partitioner`分割器是您帳戶的預設分割器。此分割區器與 Spark Cassandra 連接器相容。如需分割器以及如何變更分割器的詳細資訊，請參閱 [在 Amazon Keyspaces 中使用分割區](working-with-partitioners.md)。

1. 使用介面 VPC 端點搭配 Apache Spark 來設定 Amazon Keyspaces 的 IAM 許可。
   + 指派使用者資料表的讀取/寫入存取權，以及系統資料表的讀取存取權，如下列 IAM 政策範例所示。
   + 對於透過 VPC 端點透過 Spark 存取 Amazon Keyspaces 的用戶端，需要使用可用的介面 [VPC 端點](https://docs.aws.amazon.com/keyspaces/latest/devguide/vpc-endpoints.html)填入 system.peers 資料表。

   ```
   {
      "Version":"2012-10-17",		 	 	 
      "Statement":[
         {
            "Effect":"Allow",
            "Action":[
               "cassandra:Select",
               "cassandra:Modify"
            ],
            "Resource":[
               "arn:aws:cassandra:us-east-1:111122223333:/keyspace/mykeyspace/table/mytable",
               "arn:aws:cassandra:us-east-1:111122223333:/keyspace/system*"
            ]
         },
         {
            "Sid":"ListVPCEndpoints",
            "Effect":"Allow",
            "Action":[
               "ec2:DescribeNetworkInterfaces",
               "ec2:DescribeVpcEndpoints"
            ],
            "Resource":"*"
         }
      ]
   }
   ```

1. 請考慮下列最佳實務，為您的 Amazon Keyspaces 資料表設定足夠的讀取/寫入輸送量容量，以支援來自 Spark Cassandra 連接器的流量。
   + 開始使用隨需容量來協助您測試案例。
   + 若要最佳化生產環境的資料表輸送量成本，請針對連接器的流量使用速率限制器，並將資料表設定為使用佈建容量搭配自動擴展。如需詳細資訊，請參閱[使用 Amazon Keyspaces 自動擴展自動管理輸送量容量](autoscaling.md)。
   + 您可以使用 Cassandra 驅動程式隨附的固定速率限制器。[AWS 範例](https://github.com/aws-samples)儲存庫中有一些[針對 Amazon Keyspaces 量身打造的速率限制器](https://github.com/aws-samples/amazon-keyspaces-java-driver-helpers)。
   + 如需容量管理的詳細資訊，請參閱 [在 Amazon Keyspaces 中設定讀取/寫入容量模式](ReadWriteCapacityMode.md)。