效能調校 - Amazon DynamoDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

效能調校

在建立映射至 DynamoDB 資料表的 Hive 外部資料表時,您不會從 DynamoDB 消耗任何讀取或寫入容量。不過,Hive 資料表上的讀取和寫入活動 (例如 INSERTSELECT) 會直接轉譯為基礎 DynamoDB 資料表上的讀取和寫入作業。

Amazon EMR 上的 Apache Hive 會實作自己的邏輯來平衡 DynamoDB 資料表上的輸入/輸出負載,並盡量減少超出資料表佈建輸送量的可能性。每個 Hive 查詢結束時,Amazon EMR 都會傳回執行時間指標,包括超出佈建輸送量的次數。您可以將此資訊與 DynamoDB 表上的 CloudWatch 指標一起使用,以提高後續請求的效能。

Amazon EMR 主控台可為叢集提供基本監控工具。如需詳細資訊,請參閱《Amazon EMR 管理指南》中的檢視及監控叢集

您也可以使用以 Web 類型工具 (例如 Hue、Ganglia 和 Hadoop Web 介面) 來監控叢集及 Hadoop 任務。如需詳細資訊,請參閱《Amazon EMR 管理指南》中的檢視 Amazon EMR 叢集上託管的 Web 介面

本節說明可在外部 DynamoDB 資料表上調校 Hive 作業效能所採取的步驟。