设置 Amazon Managed Grafana 工作区 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

设置 Amazon Managed Grafana 工作区

使用 Amazon Managed Service for Prometheus 作为数据来源,创建新的 Amazon Managed Grafana 作业区或更新现有的 Amazon Managed Grafana 作业区。

创建 Grafana 作业区并将 Amazon Managed Service for Prometheus 设置为数据来源

要可视化 Amazon Managed Service for Prometheus 的指标,请创建 Amazon Managed Grafana 作业区并将其设置为使用 Amazon Managed Service for Prometheus 作为数据来源。

  1. 要创建 Grafana 作业区,请按照 Amazon Managed Service for Prometheus User Guide 中的创建空间进行操作。

    1. 在步骤 13 中,选择 Amazon Managed Service for Prometheus 作为数据来源。

    2. 在步骤 17 中,您可以在 IAM Identity Center 中添加管理员用户和其他用户。

要了解更多信息,请参阅以下资源。

打开 Grafana 作业区并完成数据来源设置

成功创建或更新 Amazon Managed Grafana 作业区后,选择作业区 URL 以打开作业区。系统会提示您输入在 IAM Identity Center 中设置的用户名和密码。您应该使用管理员用户登录,以完成作业区的设置。

  1. 在作业区主页页面,选择应用程序AWS 数据来源数据来源

  2. 数据来源页面,选择数据来源选项卡。

  3. 服务中,选择 Amazon Managed Service for Prometheus。

  4. 浏览和配置数据源部分,选择您为 Prometheus 工作空间配置亚马逊托管服务的 AWS 区域。

  5. 从所选区域的数据来源列表中,选择 Amazon Managed Service for Prometheus 的数据来源。请务必检查您为可观察性堆栈设置的适用于 Prometheus 的亚马逊托管服务工作空间的资源 ID 和资源别名。 HyperPod

导入开源 Grafana 控制面板

成功设置 Amazon Managed Grafana 作业区并将 Amazon Managed Service for Prometheus 作为数据来源后,您就可以开始向 Prometheus 收集指标,然后就可以看到显示图表、信息等的各种控制面板。Grafana 开源软件提供各种控制面板,您可以将它们导入 Amazon Managed Grafana。

将开源 Grafana 控制面板导入 Amazon Managed Grafana

  1. 在 Amazon Managed Grafana 作业区的主页页面中,选择控制面板

  2. 选择带有用户界面文本新建的下拉菜单按钮,然后选择导入

  3. 将 URL 粘贴到 Slurm 控制面板

    https://grafana.com/grafana/dashboards/4323-slurm-dashboard/
  4. 选择加载

  5. 重复前面的步骤导入以下控制面板。

    1. Node Exporter Full Dashboard

      https://grafana.com/grafana/dashboards/1860-node-exporter-full/
    2. NVIDIA DCGM Exporter Dashboard

      https://grafana.com/grafana/dashboards/12239-nvidia-dcgm-exporter-dashboard/
    3. EFA Metrics Dashboard

      https://grafana.com/grafana/dashboards/20579-efa-metrics-dev/
    4. FSx 适用于 Lustre 指标控制面板

      https://grafana.com/grafana/dashboards/20906-fsx-lustre/