Amazon SageMaker AI 網域實體和狀態 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 網域實體和狀態

Amazon SageMaker AI 網域支援 SageMaker AI 機器學習 (ML) 環境。 SageMaker AI 網域由下列實體及其相關聯的狀態值組成。如需建立網域的加入步驟,請參閱 Amazon SageMaker AI 網域概觀

  • 網域:網域包含下列項目。

    • 相關聯的 Amazon Elastic File System (Amazon EFS) 磁碟區。

    • 授權使用者清單。

    • 各種安全性、應用程式、政策和 Amazon Virtual Private Cloud (AmazonVPC) 組態。

    網域內的使用者可以彼此共享筆記本檔案和其他成品。帳戶可以有多個網域。如需多個網域的詳細資訊,請參閱多個網域概觀

  • 使用者描述檔:使用者描述檔代表網域中的單一使用者。這是參考使用者的主要方式,用於共享、報告和其他使用者導向功能。當使用者加入 Amazon SageMaker AI 網域時,就會建立此實體。如需使用者設定檔的詳細資訊,請參閱網域使用者設定檔

  • 共用空間:共用空間由共用 JupyterServer 應用程式和共用目錄組成。網域內的所有使用者都可以存取共用空間。網域中的所有使用者設定檔都可以存取網域中的所有共用空間。如需空間共用的詳細資訊,請參閱與共用空間協作

  • 應用程式:應用程式代表支援用戶筆記本,終端和主控台的讀取和執行體驗的應用程式。應用程式類型可以是 JupyterServer、RStudioServerPro、 KernelGateway或 RSession。使用者可能會同時啟用多個應用程式。

下列資料表說明的狀態值是針對domainUserProfileshared spaceApp實體。如果適用,他們還提供故障排除步驟。

網域狀態值

Value 描述
待定 持續建立網域。
InService 成功建立網域。
更新中 網域的持續更新。
正在刪除 持續刪除網域。
失敗 網域建立失敗。呼叫 DescribeDomainAPI以查看建立網域的失敗原因。刪除失敗的網域,並在修正 中提到的錯誤後重新建立網域FailureReason
UPDATE_FAILED 網域更新不成功。呼叫 DescribeDomainAPI以查看網域更新的失敗原因。修正 中提到的錯誤UpdateDomainAPI後,請呼叫 FailureReason
Delete_Failed 網域刪除不成功。呼叫 DescribeDomainAPI以查看刪除網域的失敗原因。由於刪除失敗,您可能有一些資源仍在執行中,但無法使用或更新網域。修正 中提到的錯誤後,DeleteDomainAPI再次呼叫 FailureReason

UserProfile 狀態值

Value 描述
待定 正在進行建立的UserProfile
InService 成功建立UserProfile
更新中 正在進行的更新UserProfile
正在刪除 正在進行刪除的 UserProfile
失敗 失敗建立的 UserProfile。呼叫 DescribeUserProfileAPI以查看UserProfile建立失敗原因。修復FailureReason中提到的錯誤後,刪除失敗的UserProfile並重新建立網域。
UPDATE_FAILED UserProfile更新不成功。呼叫 DescribeUserProfileAPI以查看UserProfile更新失敗原因。修正 中提到的錯誤後,UpdateUserProfileAPI請再次呼叫 FailureReason
Delete_Failed 失敗刪除的UserProfile。呼叫 DescribeUserProfileAPI以查看UserProfile刪除失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新UserProfile。修正 中提到的錯誤後,DeleteUserProfileAPI請再次呼叫 FailureReason

共用空間狀態值

Value 描述
待定 持續建立共享空間。
InService 成功建立共享空間。
正在刪除 持續刪除共享空間。
失敗 失敗建立共享空間。呼叫 DescribeSpaceAPI以查看建立共用空間的失敗原因。修復FailureReason中提到的錯誤後,刪除失敗的共用空間並重新建立它。
UPDATE_FAILED 更新失敗的共用空間。呼叫 DescribeSpaceAPI以查看共用空間更新的失敗原因。修正 中提到的錯誤後,UpdateSpaceAPI請再次呼叫 FailureReason
Delete_Failed 失敗刪除共用空間。呼叫 DescribeSpaceAPI以查看共用空間刪除的失敗原因。因為刪除失敗,所以您可能有一些資源仍在執行,但是您無法使用或更新共用空間。修正 中提到的錯誤後,DeleteSpaceAPI再次呼叫 FailureReason
已刪除 成功刪除的共用空間。

App 狀態值

Value 描述
待定 正在進行建立的App
InService 成功建立的 App
正在刪除 正在進行刪除的 App
失敗 失敗建立的 App。呼叫 DescribeAppAPI以查看App建立失敗原因。修正 中提到的錯誤後,CreateAppAPI請再次呼叫 FailureReason
已刪除 成功刪除的 App

應用程式維護

至少每 90 天一次, SageMaker AI 會針對 Amazon SageMaker Studio Classic、 JupyterServer KernelGateway SageMaker Canvas 和 Amazon SageMaker Data Wrangler 應用程式執行基礎軟體的安全性和效能更新。某些維護項目,例如作業系統升級,需要 SageMaker AI 在維護時段內讓您的應用程式短暫離線。由於此維護會使應用程式離線,因此您無法在更新基礎軟體時執行任何作業。當維護活動進行中時,應用程式的狀態會從 轉換為InService待定。維護完成時,應用程式的狀態會轉換回 InService。如果修補失敗,則應用程式的狀態會變成失敗。如果應用程式處於失敗狀態,建議您建立相同類型的新應用程式。如需建立 Studio Classic 應用程式的相關資訊,請參閱 關閉並更新 SageMaker Studio Classic 和 Studio Classic 應用程式。如需建立 SageMaker Canvas 應用程式的詳細資訊,請參閱 應用程式管理

如需詳細資訊,請聯絡 https://aws.amazon.com/premiumsupport/。