

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# システムロールバックのベストプラクティス
<a name="troubleshooting-system-rollback"></a>

Amazon Managed Service for Apache Flink の自動システムロールバックとオペレーションの可視化機能により、アプリケーションの問題を特定して解決できます。

## システムロールバック
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

コードのバグやアクセス許可の問題など、顧客側のエラーが原因でアプリケーションの更新またはスケーリング操作が失敗した場合、この機能にオプトインしていれば、Amazon Managed Service for Apache Flink は自動で以前の稼働バージョンへロールバックを試みます。詳細については、「[Managed Service for Apache Flink アプリケーションのシステムロールバックを有効にする](how-system-rollbacks.md)」を参照してください。この自動ロールバックが失敗した場合、またはオプトインまたはオプトアウトしていない場合、アプリケーションは `READY` 状態になります。アプリケーションを更新するには、次のステップを実行します。   Amazon Managed Service for Apache Flink のコンソールをチェックするか、`DescribeApplicationOperation` API を利用して、エラーの説明を表示し、操作が失敗した理由を確認します。   完全なエラースタックの場合は、[CloudWatch logs](https://docs.aws.amazon.com/managed-flink/latest/java/logging.html) を使用します。   一般的な問題には、アクセス許可の不足、互換性のないコード変更、インフラストラクチャの設定ミスがあります。根本的な問題を解決します。   `UpdateApplicaton` API を使用して、新しいアプリケーションバージョンを再デプロイします。   

## 手動ロールバック
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

アプリケーションが進行しておらず、長時間一時的な状態である場合、またはアプリケーションが正常に `Running` に移行したが、正常に更新された Flink アプリケーションで処理エラーなどのダウンストリームの問題が表示される場合は、`RollbackApplication` API を使用して手動でロールバックできます。

1. `RollbackApplication` の呼び出し- これにより、以前の稼働バージョンに戻り、以前の状態が復元されます。

1. `DescribeApplicationOperation` API を使用してロールバック操作をモニタリングします。

1. ロールバックが失敗した場合は、前のシステムロールバックステップを使用します。

## 操作の可視性
<a name="troubleshooting-unsupported-kinesis-connectors-error"></a>

`ListApplicationOperations` API には、アプリケーションのすべての顧客とシステムオペレーションの履歴が表示されます。

1. 失敗した操作の *operationId* をリストから取得します。

1. `DescribeApplicationOperation` を呼び出し、ステータスと *statusDescription* を確認します。

1. もし操作が失敗した場合、その説明には調査対象となる可能性のあるエラーが記載されます。

**一般的なエラーコードのバグ:** ロールバック機能を使用して、最後の動作バージョンに戻ります。バグを解決し、更新を再試行します。

**アクセス許可の問題:** `DescribeApplicationOperation` を使用して、必要なアクセス許可を確認します。アプリケーションのアクセス許可を更新して再試行します。

**Amazon Managed Service for Apache Flink サービスの問題:** を確認する AWS Health Dashboard か、サポートケースを開きます。