AWS Systems Manager OpsCenter - AWS Systems Manager

AWS Systems Manager OpsCenter

AWS Systems Manager의 기능인 OpsCenter는 운영 엔지니어와 IT 전문가가 AWS 리소스와 관련된 운영 작업 항목(OpsItems)을 보고, 조사하고, 해결할 수 있는 중앙 위치를 제공합니다. OpsCenter는 AWS 리소스에 영향을 미치는 문제에 대한 평균 해결 시간을 단축하도록 설계되었습니다. OpsCenter는 서비스 전반에서 OpsItems를 집계 및 표준화하는 동시에 각 OpsItem, 관련 OpsItems, 관련 리소스에 대한 상황별 조사 데이터를 제공합니다. OpsCenter은 또한 문제를 신속하게 해결하는 데 사용할 수 있는 Systems Manager 자동화 런북을 제공합니다. 각 OpsItem에 대해 검색 가능한 사용자 지정 데이터를 지정할 수 있습니다. 상태 및 소스별로 OpsItems에 대한 자동 생성 요약 보고서를 볼 수도 있습니다. OpsCenter를 시작하려면 Systems Manager 콘솔을 엽니다. 탐색 창에서 OpsCenter를 선택합니다.

OpsCenter는 Amazon EventBridge 및 Amazon CloudWatch와 통합됩니다. 즉, CloudWatch 경보가 ALARM 상태가 되거나 EventBridge가 이벤트를 게시하는 AWS 서비스의 이벤트를 처리할 때 OpsCenter에 OpsItem을 자동으로 생성하도록 이러한 서비스를 구성할 수 있습니다. OpsItems를 자동으로 생성하도록 CloudWatch 경보와 EventBridge 이벤트를 구성하면 단일 콘솔에서 AWS 리소스와 관련된 문제를 신속하게 진단하고 해결할 수 있습니다.

문제 진단을 돕기 위해 각 OpsItem에는 OpsItem을 생성한 AWS 리소스의 이름과 ID, 경보 또는 이벤트 세부 정보, 경보 기록, 경보 타임라인 그래프와 같은 상황에 맞는 관련 정보가 포함되어 있습니다.

AWS 리소스의 경우 OpsCenter는 AWS Config, AWS CloudTrail 로그 및 Amazon CloudWatch Events에서 정보를 집계하므로 조사 중에 여러 콘솔 페이지를 탐색할 필요가 없습니다.

다음 목록에는 고객이 OpsItems를 생성하는 CloudWatch 경보를 구성하는 AWS 리소스 및 지표의 유형이 포함되어 있습니다.

  • Amazon DynamoDB: 데이터베이스 읽기 및 쓰기 작업이 임계값에 도달함

  • Amazon EC2: CPU 사용률이 임계값에 도달함

  • AWS 결제: 예상 요금이 임계값에 도달함

  • Amazon EC2: 인스턴스 상태 확인 실패

  • Amazon Elastic Block Store(EBS): 디스크 공간 사용률이 임계값에 도달함

다음 목록에는 OpsItems를 생성하기 위해 고객이 구성하는 EventBridge 규칙의 유형이 포함되어 있습니다.

  • AWS Security Hub: 보안 알림 발령

  • DynamoDB: 제한 이벤트

  • Amazon EC2 Auto Scaling: 인스턴스 시작 실패

  • Systems Manager: 자동화 실행 실패

  • AWS Health: 예약된 유지 관리에 대한 알림

  • EC2: Running에서 Stopped로 인스턴스 상태 변경

또한 OpsCenter는 .NET 및 SQL Server용 Amazon CloudWatch Application Insights와 통합됩니다. 즉 애플리케이션에서 감지된 문제에 대한 OpsItems를 자동으로 생성할 수 있습니다. 또한 OpsCenter를 AWS Security Hub와 통합하여 Systems Manager에서 보안, 성능 및 운영 문제를 집계하고 조치를 취할 수 있습니다.

운영 엔지니어와 IT 전문가는 AWS Systems Manager 콘솔의 OpsCenter 페이지, 퍼블릭 API 작업, AWS Command Line Interface(AWS CLI), AWS Tools for Windows PowerShell 또는 AWS SDK를 사용하여 OpsItems를 생성하고 보고 편집할 수 있습니다. OpsCenter 퍼블릭 API 운영을 통해 OpsCenter를 사례 관리 시스템 및 상태 대시보드와 통합할 수도 있습니다.

OpsCenter가 조직에 주는 이점은 무엇인가요?

OpsCenter는 AWS 리소스와 관련된 문제를 보고, 작업하고, 해결하는 데 필요한 표준 및 통합된 환경을 제공합니다. 표준 및 통합 환경을 통해 문제를 해결하고 관련 문제를 조사하며 새로운 운영 엔지니어 및 IT 전문가를 양성하는 데 소요되는 시간을 단축할 수 있습니다. 표준 및 통합 환경을 통해 문제를 관리 및 해결하는 시스템에 입력되는 수동 오류 수를 줄일 수 있습니다.

구체적으로, OpsCenter는 운영 엔지니어 및 조직에 다음과 같은 이점을 제공합니다.

  • 더 이상 AWS 리소스와 관련된 OpsItems를 보고, 조사하고, 해결하기 위해 여러 콘솔 페이지를 탐색할 필요가 없습니다. OpsItems는 중앙 위치에서 전체 서비스에 대해 집계됩니다.

  • CloudWatch 경보, EventBridge 이벤트 및 .NET 및 SQL Server용 CloudWatch Application Insights에 의해 자동 생성되는 OpsItems에 대한 서비스별 데이터 및 문맥 관련 데이터를 볼 수 있습니다.

  • OpsItem과 관련된 리소스의 Amazon 리소스 이름(ARN)을 지정할 수 있습니다. 관련 리소스를 지정함으로써 OpsCenter는 기본 제공된 로직을 사용하여 중복된 OpsItems 생성을 방지합니다.

  • 유사한 OpsItems에 대한 세부 정보와 해결 정보를 볼 수 있습니다.

  • Systems Manager Automation 실행서에 대한 정보를 신속하게 보고 실행하여 문제를 해결할 수 있습니다.

OpsCenter에는 어떤 기능이 있나요?

  • 자동 및 수동 OpsItem 생성

    OpsCenter는 Amazon CloudWatch와 통합되어 있습니다. 즉, 경보가 ALARM 상태가 되거나 Amazon EventBridge가 이벤트를 게시하는 AWS 서비스의 이벤트를 처리할 때 OpsCenter에 OpsItem을 자동으로 생성하도록 CloudWatch를 구성할 수 있습니다. OpsItems를 수동으로 생성할 수도 있습니다.

    또한 OpsCenter는 .NET 및 SQL Server용 Amazon CloudWatch Application Insights와 통합됩니다. 즉 애플리케이션에서 감지된 문제에 대한 OpsItems를 자동으로 생성할 수 있습니다.

  • 세부적이고 검색 가능한 OpsItems

    각 OpsItem에는 제목, ID, 우선순위, 설명, OpsItem의 소스 및 마지막으로 업데이트된 날짜/시간을 포함하여 여러 정보 필드가 있습니다. 또한 각 OpsItem에는 다음과 같은 구성 가능한 기능이 포함되어 있습니다.

    • 상태: Open(미결), 진행 중, 해결됨, Open and In progress(미결 및 진행 중)입니다.

    • 관련 리소스: 관련 리소스는 영향을 받은 리소스 또는 OpsItem을 생성한 EventBridge 이벤트를 시작한 리소스입니다. 각 OpsItem에는 관련 리소스 섹션이 포함되어 있습니다. OpsCenter는 이 섹션에 관련 리소스의 Amazon 리소스 이름(ARN)을 자동으로 나열합니다. 또한 관련 리소스의 ARN을 수동으로 지정할 수도 있습니다. 일부 ARN 유형의 경우 OpsCenter는 해당 정보를 보기 위해 다른 콘솔 페이지를 방문할 필요가 없도록 리소스에 대한 세부 정보를 표시하는 딥 링크를 자동으로 생성합니다. 예를 들어 EC2 인스턴스의 ARN을 지정하면 EC2에서 OpsCenter의 해당 인스턴스에 대해 제공한 모든 세부 정보를 볼 수 있습니다. 관련 추가 리소스의 ARN을 수동으로 추가할 수 있습니다. 각 OpsItem은 최대 100개의 관련 리소스 ARN을 나열할 수 있습니다. 자세한 내용은 OpsItem에 관련 리소스 추가 단원을 참조하십시오.

    • 관련된 및 유사한 OpsItems: [관련된 OpsItems(Related OpsItems)] 기능을 사용하면 현재 OpsItem과 관련된 방식으로 OpsItems의 ID를 지정할 수 있습니다. [유사한 OpsItem(Similar OpsItem)] 기능은 OpsItem 제목과 설명을 자동으로 검토한 다음 사용자와 관련이 있거나 관심이 있을 만한 다른 OpsItems 목록을 표시합니다.

    • 검색 가능한 프라이빗 운영 데이터: 운영 데이터는 OpsItem에 대한 유용한 참조 정보를 제공하는 사용자 지정 데이터입니다. 예를 들어 로그 파일, 오류 문자열, 라이선스 키, 문제 해결 팁 또는 기타 관련 데이터를 지정할 수 있습니다. 운영 데이터를 키-값 페어로 입력합니다. 키의 최대 길이는 128자입니다. 값의 최대 크기는 20KB입니다.

      이 사용자 지정 데이터는 검색 가능하지만 제한이 있습니다. [검색 가능한 운영 데이터(Searchable operational data)] 기능의 경우 [OpsItem 개요(OpsItem Overview)] 페이지(DescribeOpsItems API 작업에서 제공)에 액세스할 수 있는 모든 사용자가 지정된 데이터를 보고 검색할 수 있습니다. [프라이빗 운영 데이터(Private operational data)] 기능의 경우 데이터는 OpsItem(GetOpsItem API 작업에서 제공)에 액세스할 수 있는 사용자만 볼 수 있습니다.

    • 중복 제거: OpsCenter는 관련 리소스를 지정하여 기본 제공 논리로 중복 OpsItems 생성을 방지합니다. OpsCenter에는 중복 OpsItems에 대한 정보를 표시하는 Operational insights라는 기능도 포함되어 있습니다. 계정의 중복 OpsItems 수를 추가로 제한하기 위해 EventBridge 이벤트 규칙에 대한 중복 제거 문자열을 수동으로 지정할 수 있습니다. 자세한 내용은 중복 OpsItems 관리 단원을 참조하십시오.

  • OpsItems 대량 편집: OpsCenter에서 여러 OpsItems를 선택하고 상태(Status), 우선순위(Priority), 심각도(Severity), 범주(Category) 필드 중 하나를 편집할 수 있습니다.

  • 실행서를 사용하여 쉽게 문제 해결

    각 OpsItem의 [실행서(Runbooks)] 섹션에는 AWS 리소스의 일반적인 문제를 자동으로 해결하는 데 사용할 수 있는 Systems Manager Automation 실행서 목록이 있습니다. OpsItem을 열고 해당 OpsItem에 대한 AWS 리소스를 선택한 다음 콘솔에서 [자동화 실행(Run automation)] 버튼을 선택하면 OpsCenter가 OpsItem을 생성한 AWS 리소스에서 실행할 수 있는 Automation 실행서 목록을 제공합니다. OpsItem에서 Automation 실행서를 실행한 후에는 나중에 참조할 수 있도록 실행서가 OpsItem의 관련 리소스와 자동으로 연결됩니다. 또한 OpsCenter를 사용하여 EventBridge에서OpsItem 규칙을 자동으로 설정하는 경우 EventBridge는 일반적인 이벤트에 대해 실행서를 자동으로 연결합니다. OpsCenter는 특정 OpsItem에 대해 실행된 Automation 실행서의 30일 레코드를 유지합니다. 자세한 내용은 OpsItem 문제 해결 단원을 참조하십시오.

  • 변경 알림: Amazon Simple Notification Service(SNS) 주제의 ARN을 지정하여 OpsItem이 변경되거나 편집될 때마다 알림을 게시할 수 있습니다. SNS 주제는 OpsItem과 동일한 AWS 리전에 있어야 합니다.

  • 포괄적인 OpsItem 검색 기능: OpsCenter는 OpsItems를 빠르게 찾을 수 있도록 여러 가지 검색 옵션을 제공합니다. 예를 들어 OpsItem ID, 제목, 마지막으로 수정한 시간, 운영 데이터 값, 소스 및 실행서 실행의 Automation ID 등이 있습니다. 상태 필터를 사용하여 검색 결과를 더 제한할 수 있습니다.

  • OpsItem 요약 보고서

    OpsCenter에는 다음 섹션이 자동으로 표시되는 요약 보고서 페이지가 있습니다.

    • Status summary(상태 요약): 상태(Open(미결), 진행 중, 해결됨, Open and In progress(미결 및 진행 중))별 OpsItems 요약

    • [미결 OpsItems가 가장 많은 소스(Sources with most open OpsItems)]: 미결 OpsItems가 있는 상위 AWS 서비스에 대한 분석

    • OpsItems by source and age(소스 및 기간별 OpsItems): 소스 및 생성 후 기간(일)에 따라 그룹화된 OpsItems 수

    OpsCenter 요약 보고서 보기에 대한 자세한 내용은 OpsCenter 요약 보고서 보기 섹션을 참조하세요.

  • 로깅 및 감사 기능 지원

    다른 AWS 서비스와의 통합을 통해 AWS 계정에서 OpsCenter 사용자 작업을 감사하고 로그할 수 있습니다. 자세한 내용은 OpsCenter 로그 및 보고서 보기 단원을 참조하십시오.

  • 콘솔, CLI, PowerShell 및 SDK에서 OpsCenter 기능에 액세스

    선택한 AWS Systems Manager 콘솔, AWS Command Line Interface(AWS CLI), AWS Tools for PowerShell 또는 AWS SDK를 사용하여 OpsCenter로 작업할 수 있습니다.

OpsCenter는 기존의 사례 관리 시스템과 통합됩니까?

OpsCenter는 기존 사례 관리 시스템을 보완하도록 설계되었습니다. 퍼블릭 API 작업을 사용하여 OpsItems를 기존 사례 관리 시스템에 통합할 수 있습니다. 또한 현재 시스템에서 수동 수명 주기 워크플로우를 유지 관리하고 OpsCenter를 조사 및 해결 허브로 사용할 수 있습니다.

OpsCenter 퍼블릭 API 작업에 대한 자세한 내용은 AWS Systems Manager API Reference의 다음 API 작업을 참조하세요.

OpsCenter를 사용하는 데 비용이 듭니까?

예. 자세한 내용은 AWS Systems Manager 요금을 참조하십시오.

OpsCenter는 온프레미스 및 하이브리드 관리형 노드와 함께 작동하나요?

예. OpsCenter를 사용하여 Systems Manager용으로 구성된 온프레미스 관리형 노드의 문제를 조사하고 해결할 수 있습니다. Systems Manager에 대한 온프레미스 서버 및 가상 머신 설정과 구성에 대한 자세한 내용은 Systems Manager로 하이브리드 및 멀티클라우드 환경에서 서버 관리 섹션을 참조하세요.

OpsCenter의 할당량은 얼마인가요?

Amazon Web Services 일반 참조의 Systems Manager 서비스 할당량에서 모든 Systems Manager 기능의 할당량을 볼 수 있습니다. 다르게 표시되지 않는 한 리전별로 각 할당량이 적용됩니다.