為什麼我無法啟動在 AWS Glue 開發端點備份的 Amazon SageMaker 筆記本執行個體?

上次更新日期︰2021 年 8 月 26 日

使用 AWS Glue 開發端點支援的 Amazon SageMaker 筆記本執行個體逾時,且顯示下列錯誤:

「筆記本執行個體 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' 的筆記本執行個體生命週期組態 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' 花費超過 5 分鐘的時間。如果您的筆記本執行個體接入網際網路,請查看您的 CloudWatch 日誌以了解詳細資訊。」

解決方案

此錯誤可能指示 AWS Glue 開發端點上的 Apache Lvy 服務無法與筆記執行所在的伺服器通訊。此問題最常見的原因是,連接至筆記的生命週期組態可能參考不存在的開發端點。SageMaker 生命週期指令碼用於設定 SparkMagic 外掛程式,以針對運行於開發端點的 Lvy 伺服器呼叫 REST API。若要了解這些元件如何共同運作,請參閱 AWS Glue 開發端點如何與 SageMaker 筆記搭配運作

若要解決此問題,請嘗試適合您使用案例的疑難排解選項。

建立新的開發端點

建立新的 AWS Glue 開發端點,最好使用與您正在使用的端點相同的名稱和組態。如需詳細資訊,請參閱新增開發端點

更新筆記本執行個體的生命週期組態

如果下列任一條件成立,您必須更新失敗的筆記本執行個體的生命週期組態:

  • 您建立了使用不同名稱的開發端點。
  • 您想要使用之前建立的開發端點。

若要更新筆記本的生命週期組態,請執行下列操作:

  1. 開啟 SageMaker 主控台
  2. 在導覽窗格的 Notebook (筆記本) 下,選擇 Lifecycle configurations (生命週期組態)。
  3. 選取失敗的筆記本執行個體的生命週期組態。
  4. 選擇 Edit (編輯)。
  5. 在筆記本指令碼中,用您建立的端點取代開發端點的名稱。

復原筆記本資料

當您有權存取 SageMaker 時,可以考慮復原筆記本,但無法建立新的開發端點。

若要復原您的筆記本資料,請執行下列操作:

  1. 開啟 SageMaker 主控台
  2. 在導覽窗格的 Notebook (筆記本) 下,選擇 Notebook instances (筆記本執行個體)。
  3. 選取您要復原的筆記本。
  4. 如果您的筆記本狀態不是 Stopped (已停止),請選擇 Actions (動作),然後選擇 Stop (停止),以停止筆記本執行個體。
    您可以看到筆記本執行個體狀態變更為 Stopping (正在停止)。等待狀態變更為 Stopped (已停止),以完成其餘步驟。
  5. 選擇 Actions (動作),然後選擇 Update settings (更新設定)。
  6. Edit notebook instance (編輯筆記本執行個體) 頁面的 Additional Configuration (其他組態) 下,針對 Lifecycle configuration (生命週期組態),選取 No configuration (無組態)。
  7. 選擇 Update Notebook Instance (更新筆記本執行個體)。

您的筆記本執行個體狀態會變更為 Updating (正在更新)。筆記本執行個體更新完成後,狀態會變更為 Stopped (已停止)。選擇 Start (開始),以啟動執行個體。執行個體啟動後,您可以存取 Jupyter 和 JupyterLab 以在本機下載指令碼和資料。然後,您仍然無法連線至 AWS Glue 開發端點。

重要提示:您可以將指令碼連結至 GitHub 儲存庫,以避免資料今後遺失。

注意:如果在嘗試安裝庫時生命週期組態逾時,則請參閱如果我嘗試安裝庫時,如果在嘗試安裝程式庫時生命週期組態逾時,我如何確保手動安裝的程式庫在 Amazon SageMaker 中持續存在?