本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker AI 網域實體和狀態
Amazon SageMaker AI 網域支援 SageMaker AI 機器學習 (ML) 環境。 SageMaker AI 網域由下列實體及其相關聯的狀態值組成。如需建立網域的加入步驟,請參閱 Amazon SageMaker AI 網域概觀。
-
網域:網域包含下列項目。
-
相關聯的 Amazon Elastic File System (Amazon EFS) 磁碟區。
-
授權使用者清單。
-
各種安全性、應用程式、政策和 Amazon Virtual Private Cloud (AmazonVPC) 組態。
網域內的使用者可以彼此共享筆記本檔案和其他成品。帳戶可以有多個網域。如需多個網域的詳細資訊,請參閱多個網域概觀。
-
-
使用者描述檔:使用者描述檔代表網域中的單一使用者。這是參考使用者的主要方式,用於共享、報告和其他使用者導向功能。當使用者加入 Amazon SageMaker AI 網域時,就會建立此實體。如需使用者設定檔的詳細資訊,請參閱網域使用者設定檔。
-
共用空間:共用空間由共用 JupyterServer 應用程式和共用目錄組成。網域內的所有使用者都可以存取共用空間。網域中的所有使用者設定檔都可以存取網域中的所有共用空間。如需空間共用的詳細資訊,請參閱與共用空間協作。
-
應用程式:應用程式代表支援用戶筆記本,終端和主控台的讀取和執行體驗的應用程式。應用程式類型可以是 JupyterServer、RStudioServerPro、 KernelGateway或 RSession。使用者可能會同時啟用多個應用程式。
下列資料表說明的狀態值是針對domain
、UserProfile
、shared space
和App
實體。如果適用,他們還提供故障排除步驟。
網域狀態值
Value | 描述 |
---|---|
待定 | 持續建立網域。 |
InService | 成功建立網域。 |
更新中 | 網域的持續更新。 |
正在刪除 | 持續刪除網域。 |
失敗 | 網域建立失敗。呼叫 DescribeDomain API以查看建立網域的失敗原因。刪除失敗的網域,並在修正 中提到的錯誤後重新建立網域FailureReason 。 |
UPDATE_FAILED | 網域更新不成功。呼叫 DescribeDomain API以查看網域更新的失敗原因。修正 中提到的錯誤UpdateDomain API後,請呼叫 FailureReason 。 |
Delete_Failed | 網域刪除不成功。呼叫 DescribeDomain API以查看刪除網域的失敗原因。由於刪除失敗,您可能有一些資源仍在執行中,但無法使用或更新網域。修正 中提到的錯誤後,DeleteDomain API再次呼叫 FailureReason 。 |
UserProfile
狀態值
Value | 描述 |
---|---|
待定 | 正在進行建立的UserProfile 。 |
InService | 成功建立UserProfile 。 |
更新中 | 正在進行的更新UserProfile 。 |
正在刪除 | 正在進行刪除的 UserProfile 。 |
失敗 | 失敗建立的 UserProfile 。呼叫 DescribeUserProfile API以查看UserProfile 建立失敗原因。修復FailureReason 中提到的錯誤後,刪除失敗的UserProfile 並重新建立網域。 |
UPDATE_FAILED | UserProfile 更新不成功。呼叫 DescribeUserProfile API以查看UserProfile 更新失敗原因。修正 中提到的錯誤後,UpdateUserProfile API請再次呼叫 FailureReason 。 |
Delete_Failed | 失敗刪除的UserProfile 。呼叫 DescribeUserProfile API以查看UserProfile 刪除失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新UserProfile 。修正 中提到的錯誤後,DeleteUserProfile API請再次呼叫 FailureReason 。 |
共用空間狀態值
Value | 描述 |
---|---|
待定 | 持續建立共享空間。 |
InService | 成功建立共享空間。 |
正在刪除 | 持續刪除共享空間。 |
失敗 | 失敗建立共享空間。呼叫 DescribeSpace API以查看建立共用空間的失敗原因。修復FailureReason 中提到的錯誤後,刪除失敗的共用空間並重新建立它。 |
UPDATE_FAILED | 更新失敗的共用空間。呼叫 DescribeSpace API以查看共用空間更新的失敗原因。修正 中提到的錯誤後,UpdateSpace API請再次呼叫 FailureReason 。 |
Delete_Failed | 失敗刪除共用空間。呼叫 DescribeSpace API以查看共用空間刪除的失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新共用空間。修正 中提到的錯誤後,DeleteSpace API再次呼叫 FailureReason 。 |
已刪除 | 成功刪除的共用空間。 |
App
狀態值
Value | 描述 |
---|---|
待定 | 正在進行建立的App 。 |
InService | 成功建立的 App 。 |
正在刪除 | 正在進行刪除的 App 。 |
失敗 | 失敗建立的 App 。呼叫 DescribeApp API以查看App 建立失敗原因。修正 中提到的錯誤後,CreateApp API請再次呼叫 FailureReason 。 |
已刪除 | 成功刪除的 App 。 |
應用程式維護
至少每 90 天一次, SageMaker AI 會針對 Amazon SageMaker Studio Classic、 JupyterServer KernelGateway SageMaker Canvas 和 Amazon SageMaker Data Wrangler 應用程式執行基礎軟體的安全性和效能更新。某些維護項目,例如作業系統升級,需要 SageMaker AI 在維護時段內讓您的應用程式短暫離線。由於此維護會使應用程式離線,因此您無法在更新基礎軟體時執行任何作業。當維護活動進行中時,應用程式的狀態會從 轉換為InService待定。維護完成時,應用程式的狀態會轉換回 InService。如果修補失敗,則應用程式的狀態會變成失敗。如果應用程式處於失敗狀態,建議您建立相同類型的新應用程式。如需建立 Studio Classic 應用程式的相關資訊,請參閱 關閉並更新 SageMaker Studio Classic 和 Studio Classic 應用程式。如需建立 SageMaker Canvas 應用程式的詳細資訊,請參閱 應用程式管理。
如需詳細資訊,請聯絡 https://aws.amazon.com/premiumsupport/。