翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
トラブルシューティング
Studio ノートブックまたは Studio Classic ノートブックから Amazon EMRクラスターを操作すると、接続または使用プロセス中にさまざまな潜在的な問題や課題が発生する可能性があります。これらのエラーのトラブルシューティングと解決に役立つように、このセクションでは、発生する可能性のある一般的な問題に関するガイダンスを提供します。
Studio ノートブックまたは Studio Classic ノートブックから Amazon EMRクラスターを接続したり使用したりする際に発生する一般的なエラーを次に示します。
Livy 接続がハングアップまたは失敗した場合のトラブルシューティング
Studio または Studio Classic ノートブックの Amazon EMRクラスターの使用中に発生する可能性のある Livy 接続の問題は次のとおりです。
-
Amazon EMRクラスターで out-of-memoryエラーが発生しました。
Amazon EMRクラスターでエラーが発生した場合 out-of-memoryは、
sparkmagic
ハンギングまたは失敗による Livy 接続の理由が考えられます。デフォルトでは、Apache Spark ドライバーの Java 設定パラメータ
spark.driver.defaultJavaOptions
は-XX:OnOutOfMemoryError='kill -9 %p'
に設定されています。つまり、ドライバープログラムが に遭遇したときに実行されるデフォルトのアクションOutOfMemoryError
は、SIGKILLシグナルを送信してドライバープログラムを終了することです。Apache Spark ドライバーが終了すると、そのドライバーに依存するsparkmagic
経由の Livy 接続はすべてハングまたは失敗します。これは、Spark ドライバーがタスクのスケジュール設定や実行など、Spark アプリケーションのリソースを管理する責任があるためです。このドライバーがないと Spark アプリケーションは機能せず、Spark アプリケーションを操作しようとしても失敗します。Spark クラスターでメモリの問題が発生している疑いがある場合は、Amazon EMRログ を確認できます。エラーにより out-of-memory強制終了されたコンテナは、通常、 のコードで終了します
137
。このような場合は、Spark アプリケーションを再起動し、新しい Livy 接続を確立して Spark クラスターとのやり取りを再開する必要があります。ナレッジベースの記事「Amazon の Spark でメモリ制限を超えたYARNために によって殺されたコンテナ」というエラーを解決する方法を参照EMR
AWS re:Post し、 out-of-memory問題に対処するために使用できるさまざまな戦略とパラメータについて説明します。 Amazon EMRクラスターで Apache Spark ワークロードを実行する際のベストプラクティスとチューニングガイダンスについては、Amazon EMRベストプラクティスガイド
を確認することをお勧めします。 -
Amazon EMRクラスターに初めて接続すると、Livy セッションがタイムアウトします。
を使用して Amazon EMRクラスターに最初に接続するとsagemaker-studio-analytics-extension
、Apache Livy を使用してSparkMagic ライブラリ経由でリモート Spark (Amazon EMR) クラスターへの接続を有効にすると、接続タイムアウトエラーが発生することがあります。 An error was encountered: Session 0 did not start up in 60 seconds.
Amazon EMRクラスターで接続の確立時に Spark アプリケーションの初期化が必要な場合は、接続タイムアウトエラーが表示される可能性が高くなります。
分析拡張機能を介して Livy を使用して Amazon EMRクラスターに接続するときにタイムアウトが発生する可能性を減らすために、
sagemaker-studio-analytics-extension
バージョン0.0.19
以降では、デフォルトのサーバーセッションタイムアウトがsparkmagic
のデフォルト秒ではなく120
秒に上書きされます60
。以下のアップグレードコマンドを実行して、拡張機能を
0.0.18
以降にアップグレードすることをおすすめします。pip install --upgrade sagemaker-studio-analytics-extension
sparkmagic
でカスタムタイムアウト設定を指定する場合、sagemaker-studio-analytics-extension
は、このオーバーライドを優先することに注意してください。ただし、セッションタイムアウトを60
秒に設定すると、sagemaker-studio-analytics-extension
でデフォルトのサーバーセッションタイムアウト120
秒が自動的にトリガーされます。