

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 探索 AWS PCS 中的叢集環境
<a name="getting-started_explore"></a>

 登入叢集後，您可以執行 shell 命令。例如，您可以變更使用者、使用共用檔案系統上的資料，以及與 Slurm 互動。

## 變更使用者
<a name="getting-started_explore_change-user"></a>

 如果您已使用 Session Manager 登入叢集，則可能會以 身分連線`ssm-user`。這是為 Session Manager 建立的特殊使用者。使用下列命令在 Amazon Linux 2 上切換到預設使用者。如果您使用 SSH 連線，則不需要執行此操作。

```
sudo su - ec2-user
```

## 使用共用檔案系統
<a name="getting-started_explore_fs"></a>

您可以確認 EFS 檔案系統和 FSx for Lustre 檔案系統可與命令 搭配使用`df -h`。叢集上的輸出應類似以下內容：

```
[ec2-user@ip-10-3-6-103 ~]$ df -h
Filesystem                 Size  Used Avail Use% Mounted on
devtmpfs                   3.8G     0  3.8G   0% /dev
tmpfs                      3.9G     0  3.9G   0% /dev/shm
tmpfs                      3.9G  556K  3.9G   1% /run
tmpfs                      3.9G     0  3.9G   0% /sys/fs/cgroup
/dev/nvme0n1p1              24G   18G  6.6G  73% /
127.0.0.1:/                8.0E     0  8.0E   0% /home
10.3.132.79@tcp:/zlshxbev  1.2T  7.5M  1.2T   1% /shared
tmpfs                      780M     0  780M   0% /run/user/0
tmpfs                      780M     0  780M   0% /run/user/1000
```

 `/home` 檔案系統掛載 127.0.0.1 且容量非常大。這是您在教學中稍早建立的 EFS 檔案系統。在此處寫入的任何檔案都會在叢集中所有節點`/home`的 下提供。

 `/shared` 檔案系統掛載私有 IP，容量為 1.2 TB。這是您在教學中稍早建立的 FSx for Lustre 檔案系統。在此處寫入的任何檔案都將在叢集中所有節點`/shared`的 下提供。

## 與 Slurm 互動
<a name="getting-started_explore_slurm"></a>

**Contents**
+ [列出佇列和節點](#getting-started_explore_slurm_queues)
+ [顯示任務](#getting-started_explore_slurm_jobs)

### 列出佇列和節點
<a name="getting-started_explore_slurm_queues"></a>

 您可以使用 列出佇列及其相關聯的節點`sinfo`。叢集的輸出應類似於以下內容：

```
[ec2-user@ip-10-3-6-103 ~]$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
demo         up   infinite      4  idle~ compute-1-[1-4]
[ec2-user@ip-10-3-6-103 ~]$
```

 請注意名為 的分割區`demo`。其狀態為 ，`up`且最多有 4 個節點。它與節點群組中的`compute-1`節點相關聯。如果您編輯運算節點群組，並將執行個體數目上限增加到 8，則節點數目會讀取，`8`而節點清單會讀取 `compute-1-[1-8]`。如果您建立名為 `test`的第二個運算節點群組，其中包含 4 個節點，並將其新增至`demo`佇列，這些節點也會顯示在節點清單中。

### 顯示任務
<a name="getting-started_explore_slurm_jobs"></a>

 您可以使用 列出系統上任何狀態的所有任務`squeue`。叢集的輸出應類似於以下內容：

```
[ec2-user@ip-10-3-6-103 ~]$ squeue
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
```

當您有待定或正在執行的 Slurm 任務時，請稍後`squeue`再次嘗試執行。