本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
阿帕奇星火是用於大規模數據分析的開源引擎。Apache Spark 可讓您更有效率地對儲存在 Amazon Keyspaces 中的資料執行分析。您也可以使用 Amazon Keyspaces,為應用程式提供對 Spark 分析資料的一致 single-digit-millisecond 讀取存取權。開源的星火卡桑德拉連接器簡化了 Amazon Keyspaces 間和星火之間的讀取和寫入數據。
Amazon Keyspaces 支援 Spark Cassandra 連接器,可使用完全受管的無伺服器資料庫服務,簡化在以火花為基礎的分析管道中執行 Cassandra 工作負載的程序。使用 Amazon Keyspaces,您不必擔心 Spark 會爭奪與資料表相同的基礎設施資源。Amazon Keyspaces 表會根據您的應用程式流量自動擴展和縮減。
下列教學將引導您完成使用 Spark Cassandra 連接器將資料讀取和寫入 Amazon Keyspaces 所需的步驟和最佳實務。本教程演示如何通過使用 Spark Cassandra 連接器從文件中加載數據並將其寫入 Amazon 密鑰空間表,將數據遷移到 Amazon 密鑰空間。然後,本教程演示了如何使用星火卡桑德拉連接器從 Amazon Keyspaces 讀回數據。您可以這樣做,在基於 Spark 的分析管道中運行卡桑德拉工作負載。