本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 5 万或更多 v 上运行大型工作负载之前CPUs,请考虑以下清单。
注意
如果您计划在 100 万或更多 v 上运行大量工作负载,CPUs 或者需要大规模运行指导,请联系您的 AWS 团队。
-
查看您的亚马逊 EC2 配额 — 在的 “服务 EC2 配额” 面板中查看您的亚马逊配额(也称为限制) AWS Management Console。如有必要,可以申请增加您的 Amazon EC2 实例峰值数量的配额。请记住,Amazon EC2 Spot 和亚马逊按需实例有单独的配额。有关更多信息,请参阅服务限额入门。
-
验证每个区域的 Amazon Elastic Block Store 配额 — 每个实例都使用 GP2 或 GP3 卷作为操作系统。默认情况下,每个 AWS 区域 限额为 300TiB。但是,每个实例都使用计数作为此限额的一部分。因此,在验证每个区域的 Amazon Elastic Block Store 限额时,请务必将其考虑在内。如果达到限额,则无法创建更多实例。有关更多信息,请参阅 Amazon Elastic Block Store 端点和限额
-
使用 Amazon S3 进行存储 – Amazon S3 提供高吞吐量,有助于消除根据每个可用区域中的作业和实例数量来猜测要配置多少存储空间。有关更多信息,请参阅最佳实践设计模式:优化 Amazon S3 性能。
-
逐步扩展以尽早发现瓶颈 — 对于运行在 100 万 v 或更多 v 上的作业CPUs,请从较低的起点开始并逐渐增加,这样您就可以尽早发现瓶颈。例如,首先在 50,000 v 上运行CPUs。 然后,将计数增加到 20 万 vCPUs,然后增加到 50 万 vCPUs,依此类推。换句话说,继续逐渐增加 vCPU 数量,直到达到所需的 v 数。CPUs
-
监控以尽早发现潜在问题 – 为了避免在大规模运行时出现潜在的中断和问题,请务必同时监控您的应用程序和架构。即使从 1000 v 缩放到 5000 v,也可能发生中断CPUs。 您可以使用 Amazon Log CloudWatch s 查看日志数据,也可以使用客户端库使用 CloudWatch 嵌入式指标。有关更多信息,请参阅CloudWatch 日志代理参考和
aws-embedded-metrics