기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
애널리틱스
AWS 모든 데이터 분석 요구 사항에 맞는 포괄적인 분석 서비스 세트를 제공하며 모든 규모 및 산업의 조직이 데이터를 사용하여 비즈니스를 재창조할 수 있도록 합니다. 스토리지 및 관리, 데이터 거버넌스, 조치 및 경험에 이르기까지 AWS 최고의 가격 대비 성능, 확장성, 최저 비용을 제공하는 전용 서비스를 제공합니다.
각 서비스는 다이어그램 뒤에 설명되어 있습니다. 요구 사항에 가장 적합한 서비스를 결정하는 데 도움이 필요하면 선택을 참조하십시오. AWS 분석 서비스. 일반 정보는 애널리틱스 온을 참조하십시오. AWS.
로 돌아가기AWS 서비스.
Amazon Athena
Amazon Athena는 표준을 사용하여 Amazon S3의 데이터를 쉽게 분석할 수 있게 해주는 대화형 쿼리 서비스입니다. SQL Athena는 서버리스 서비스이므로 관리할 인프라가 없으며 실행한 쿼리에 대해서만 비용을 지불하면 됩니다.
Athena는 사용하기 쉽습니다. Amazon S3의 데이터를 가리키고 스키마를 정의한 다음 표준을 사용하여 쿼리를 시작하기만 하면 됩니다. SQL 대부분의 결과는 몇 초 내에 전달됩니다. Athena를 사용하면 분석을 위해 데이터를 준비하기 위해 복잡한 추출, 변환 및 load (ETL) 작업을 수행할 필요가 없습니다. 따라서 SQL 기술이 있는 사람이라면 누구나 쉽게 대규모 데이터 세트를 빠르게 분석할 수 있습니다.
Athena는 다음과 out-of-the-box 통합되었습니다. AWS Glue Data Catalog를 사용하면 다양한 서비스에 걸쳐 통합된 메타데이터 리포지토리를 생성하고, 데이터 원본을 크롤링하여 스키마를 검색하고, 카탈로그에 신규 및 수정된 테이블 및 파티션 정의를 채우고, 스키마 버전을 관리할 수 있습니다.
아마존 CloudSearch
CloudSearchAmazon은 다음의 관리형 서비스입니다. AWS 클라우드 따라서 웹 사이트 또는 애플리케이션을 위한 검색 솔루션을 간단하고 비용 효율적으로 설정, 관리 및 확장할 수 있습니다. CloudSearch Amazon은 34개 언어를 지원하고 강조 표시, 자동 완성, 지리공간 검색과 같은 인기 있는 검색 기능을 지원합니다.
아마존 DataZone
DataZoneAmazon은 데이터를 게시하고 맞춤형 웹 애플리케이션을 통해 비즈니스 데이터 카탈로그에서 사용할 수 있도록 하는 데 사용할 수 있는 데이터 관리 서비스입니다. 데이터가 어디에 저장되어 있든 상관없이 더 안전하게 데이터에 액세스할 수 있습니다. AWS, 온프레미스 또는 SaaS 애플리케이션 (예: Salesforce) 에서 사용할 수 있습니다. Amazon은 DataZone 전반에서 사용자 경험을 단순화합니다. AWS 아마존 레드시프트, 아마존 아테나와 같은 서비스 AWS Glue, AWS Lake Formation, 그리고 아마존 QuickSight.
아마존 EMR
EMRAmazon은 아파치 스파크, 아파치 하이브, 아파치, 아파치 플링크, 아파치 후디, 프레스토와 같은 오픈 소스 도구를 사용하여 방대한 양의 데이터를 처리하는 업계 최고의 클라우드 빅 데이터 플랫폼입니다. HBase EMRAmazon은 용량 프로비저닝 및 클러스터 튜닝과 같이 시간이 많이 걸리는 작업을 자동화하여 빅 데이터 환경을 쉽게 설정, 운영 및 확장할 수 있도록 합니다. EMRAmazon을 사용하면 기존 온 프레미스 솔루션 비용의 절반도 안 되고 표준 Apache Spark보다 3배 이상 빠른 속도로 페타바이트 규모의 분석을 실행할 수 있습니다. Amazon EC2 인스턴스, Amazon Elastic Kubernetes Service EKS (Amazon) 클러스터 또는 Amazon을 사용하는 온프레미스에서 워크로드를 실행할 수 있습니다. EMR AWS Outposts.
Amazon FinSpace
Amazon FinSpace금융 서비스 산업을 위해 특별히 구축된 데이터 관리 및 분석 서비스입니다 (). FSI FinSpace 분석에 사용할 수 있도록 페타바이트 규모의 재무 데이터를 찾고 준비하는 데 소요되는 시간을 몇 개월에서 몇 분으로 단축합니다.
금융 서비스 조직은 포트폴리오, 보험 계리 및 위험 관리 시스템과 같은 내부 데이터 스토어의 데이터는 물론 증권 거래소의 과거 증권 가격과 같은 타사 데이터 피드의 페타바이트 규모의 데이터를 분석합니다. 올바른 데이터를 찾고, 규정을 준수하는 방식으로 데이터에 액세스할 수 있는 권한을 얻고, 분석을 위해 준비하는 데 몇 개월이 걸릴 수 있습니다.
FinSpace 재무 분석을 위한 데이터 관리 시스템을 구축하고 유지 관리하는 번거로움을 없애줍니다. 를 사용하면 데이터를 수집하고 자산 등급 FinSpace, 위험 분류 또는 지리적 지역과 같은 관련 비즈니스 개념별로 분류할 수 있습니다. FinSpace 규정 준수 요구 사항에 따라 조직 전체에서 데이터를 쉽게 검색하고 공유할 수 있습니다. 한 곳에서 데이터 액세스 정책을 정의하고 FinSpace 시행하는 동시에 규정 준수 및 활동 보고가 가능하도록 감사 로그를 보관합니다. FinSpace 또한 분석을 위한 데이터를 준비할 수 있도록 타임바, 볼린저 밴드 등 100개 이상의 함수 라이브러리가 포함되어 있습니다.
Amazon Kinesis
Amazon Kinesis를 사용하면 실시간 스트리밍 데이터를 쉽게 수집, 처리 및 분석할 수 있으므로 적시에 통찰력을 얻고 새로운 정보에 신속하게 대응할 수 있습니다. Amazon Kinesis는 애플리케이션 요구 사항에 가장 적합한 도구를 선택할 수 있는 유연성과 함께 모든 규모의 스트리밍 데이터를 비용 효율적으로 처리할 수 있는 주요 기능을 제공합니다. Amazon Kinesis를 사용하면 기계 학습 (ML), 분석 및 기타 애플리케이션을 위해 비디오, 오디오, 애플리케이션 로그, 웹 사이트 클릭스트림 및 IoT 원격 측정 데이터와 같은 실시간 데이터를 수집할 수 있습니다. Amazon Kinesis를 사용하면 데이터가 도착하는 즉시 처리 및 분석하여 처리가 시작되기 전에 모든 데이터가 수집될 때까지 기다릴 필요 없이 즉시 응답할 수 있습니다.
Amazon Kinesis는 현재 Firehose, 아파치 플링크용 관리형 서비스, Kinesis Data Streams, Kinesis Video Streams의 네 가지 서비스를 제공합니다.
Amazon Data Firehose
Amazon Data Firehose는 스트리밍 데이터를 데이터 스토어 및 분석 도구에 안정적으로 로드할 수 있는 가장 쉬운 방법입니다. 스트리밍 데이터를 캡처, 변환 및 Amazon S3, Amazon Redshift, Amazon OpenSearch Service 및 Splunk로 로드할 수 있으므로 현재 이미 사용하고 있는 기존 비즈니스 인텔리전스 도구 및 대시보드를 사용하여 거의 실시간으로 분석할 수 있습니다. 데이터 처리량에 맞춰 자동으로 확장되는 완전관리형 서비스이므로 지속적인 관리가 필요하지 않습니다. 또한 데이터를 로드하기 전에 일괄 처리, 압축, 변환 및 암호화하여 대상에서 사용되는 스토리지의 양을 최소화하고 보안을 강화할 수 있습니다.
에서 Firehose 전송 스트림을 쉽게 만들 수 있습니다. AWS Management Console클릭 몇 번으로 구성하고 지속적으로 로드될 수 있는 수십만 개의 데이터 소스에서 스트림으로 데이터를 전송하기 시작합니다. AWS—이 모든 것이 단 몇 분 만에 완료됩니다. 또한 Amazon S3로 데이터를 전송하기 전에 수신 데이터를 Apache Parquet 및 Apache와 같은 열 형식 형식으로 자동 변환하도록 전송 스트림을 구성하여 비용 효율적인 저장 및 분석을 수행할 수 있습니다. ORC
Amazon Managed Service for Apache Flink
Apache Flink용 Amazon Managed Service는 스트리밍 데이터를 분석하고, 실행 가능한 통찰력을 얻고, 비즈니스 및 고객 요구에 실시간으로 대응할 수 있는 가장 쉬운 방법입니다. Apache Flink용 Amazon 관리형 서비스는 스트리밍 애플리케이션을 구축, 관리 및 다른 애플리케이션과 통합하는 복잡성을 줄여줍니다. AWS 서비스. SQL사용자는 템플릿과 대화형 SQL 편집기를 사용하여 스트리밍 데이터를 쉽게 쿼리하거나 전체 스트리밍 애플리케이션을 구축할 수 있습니다. Java 개발자는 오픈 소스 Java 라이브러리를 사용하여 정교한 스트리밍 애플리케이션을 빠르게 구축할 수 있습니다. AWS
데이터를 실시간으로 변환하고 분석하기 위한 통합.
Amazon Managed Service for Apache Flink는 쿼리를 지속적으로 실행하는 데 필요한 모든 것을 처리하고 수신 데이터의 볼륨 및 처리 속도에 맞춰 자동으로 확장합니다.
Amazon Kinesis Data Streams
Amazon Kinesis Data Streams는 대규모로 확장 가능하고 내구성이 뛰어난 실시간 데이터 스트리밍 서비스입니다. Kinesis Data Streams는 웹사이트 클릭스트림, 데이터베이스 이벤트 스트림, 금융 거래, 소셜 미디어 피드, IT 로그, 위치 추적 이벤트 등 수십만 개의 소스에서 초당 기가바이트의 데이터를 지속적으로 캡처할 수 있습니다. 수집된 데이터는 밀리초 단위로 제공되므로 실시간 대시보드, 실시간 이상 탐지, 동적 가격 책정 등과 같은 실시간 분석 사용 사례를 지원할 수 있습니다.
Amazon Kinesis Video Streams
Amazon Kinesis Video Streams를 사용하면 연결된 디바이스에서 다음으로 비디오를 안전하게 스트리밍할 수 있습니다. AWS 분석, ML, 재생 및 기타 처리용. Kinesis Video Streams는 수백만 개의 디바이스로부터 스트리밍 비디오 데이터를 수집하는 데 필요한 모든 인프라를 자동으로 프로비저닝하고 탄력적으로 확장합니다. 또한 스트림의 비디오 데이터를 안정적으로 저장, 암호화 및 인덱싱하며, 이를 통해 데이터에 액세스할 수 있습니다. easy-to-use APIs Kinesis Video Streams를 사용하면 라이브 및 온디맨드 시청을 위해 비디오를 재생하고, Amazon Rekognition Video 및 Apache, OpenCV와 같은 ML 프레임워크용 라이브러리와 통합을 통해 컴퓨터 비전 및 비디오 분석을 활용하는 애플리케이션을 빠르게 구축할 수 있습니다. MxNet TensorFlow
아마존 OpenSearch 서비스
Amazon OpenSearch OpenSearch Service (Service) 를 사용하면 데이터를 실시간으로 검색, 분석 및 시각화할 수 OpenSearch 있도록 쉽게 배포, 보호, 운영 및 확장할 수 있습니다. Amazon OpenSearch Service에서는 엔터프라이즈급 가용성, 확장성 easy-to-use APIs 및 보안과 함께 로그 분석, 전체 텍스트 검색, 애플리케이션 모니터링, 클릭스트림 분석과 같은 사용 사례를 지원하는 실시간 분석 기능을 제공합니다. 이 서비스는 데이터 수집 및 시각화를 위해 대시보드 및 Logstash와 같은 오픈 소스 도구와의 통합을 제공합니다. OpenSearch 또한 다른 제품과 원활하게 통합됩니다. AWS Amazon Virtual Private Cloud (아마존VPC) 와 같은 서비스, AWS Key Management Service (AWS KMS), 아마존 데이터 파이어호스, AWS Lambda, AWS Identity and Access Management(IAM), Amazon Cognito 및 Amazon을 사용하면 원시 데이터에서 실행 가능한 인사이트로 빠르게 전환할 수 있습니다. CloudWatch
아마존 OpenSearch 서버리스
Amazon OpenSearch 서버리스는 아마존 서비스의 서버리스 옵션입니다. OpenSearch 개발자는 클러스터를 구성, 관리 및 확장하지 않고도 OpenSearch 서버리스를 사용하여 페타바이트 규모의 워크로드를 실행할 수 있습니다. OpenSearch 서버리스 환경의 단순성을 통해 OpenSearch Service와 동일한 대화형 밀리초 응답 시간을 얻을 수 있습니다.
Amazon OpenSearch Serverless용 벡터 엔진에는 간단하고 확장 가능한 고성능의 벡터 스토리지 및 검색 기능이 추가되어 개발자가 벡터 데이터베이스 인프라를 관리할 필요 없이 ML 증강 검색 경험과 제너레이티브 AI 애플리케이션을 구축할 수 있도록 지원합니다. 벡터 검색 컬렉션의 사용 사례에는 이미지 검색, 문서 검색, 음악 검색, 제품 추천, 비디오 검색, 위치 기반 검색, 사기 탐지, 예외 항목 탐지가 포함됩니다.
Amazon Redshift
Amazon Redshift는 가장 널리 사용되는 클라우드 데이터 웨어하우스입니다. 표준 및 기존 비즈니스 인텔리전스 (BI) 도구를 사용하여 모든 데이터를 빠르고 SQL 간단하며 비용 효율적으로 분석할 수 있습니다. 정교한 쿼리 최적화, 고성능 스토리지의 컬럼형 스토리지, 대규모 병렬 쿼리 완성을 사용하여 테라바이트에서 페타바이트까지의 정형 및 반정형 데이터에 대해 복잡한 분석 쿼리를 실행할 수 있습니다. 대부분의 결과는 몇 초 안에 반환됩니다. 약정 없이 시간당 0.25 USD로 소규모로 시작하여 기존 온프레미스 솔루션 비용의 10분의 1도 안 되는 연간 테라바이트당 1,000 USD에 페타바이트 규모의 데이터로 확장할 수 있습니다.
Amazon Redshift Serverless
Amazon Redshift Serverless를 사용하면 데이터 웨어하우스 인프라를 관리할 필요 없이 분석을 더 쉽게 실행하고 확장할 수 있습니다. 개발자, 데이터 과학자 및 분석가는 데이터베이스, 데이터 웨어하우스 및 데이터 레이크 전반에서 작업하여 보고 및 대시보드 애플리케이션을 구축하고, 실시간에 가까운 분석을 수행하고, 데이터를 공유 및 협업하고, 기계 학습 (ML) 모델을 구축 및 교육할 수 있습니다. 몇 초 만에 대량의 데이터를 인사이트로 전환하세요. Amazon Redshift Serverless는 데이터 웨어하우스 용량을 자동으로 프로비저닝하고 지능적으로 확장하여 가장 까다롭고 예측할 수 없는 워크로드에도 빠른 성능을 제공하므로 사용한 만큼만 비용을 지불하면 됩니다. Amazon Redshift Query Editor 또는 자주 사용하는 비즈니스 인텔리전스 (BI) 도구에서 데이터를 로드하고 바로 쿼리를 시작하면 관리가 필요 easy-to-use 없는 환경에서 최고의 가격 성능과 SQL 친숙한 기능을 계속 이용할 수 있습니다.
아마존 QuickSight
QuickSightAmazon은 조직의 모든 사람에게 통찰력을 쉽게 제공할 수 있는 빠른 클라우드 기반 비즈니스 인텔리전스 (BI) 서비스입니다. QuickSight 브라우저 또는 모바일 디바이스에서 액세스할 수 있는 대화형 대시보드를 만들고 게시할 수 있습니다. 대시보드를 애플리케이션에 내장하여 고객에게 강력한 셀프 서비스 분석을 제공할 수 있습니다. Amazon은 소프트웨어를 설치하거나 서버를 배포하거나 인프라를 관리할 필요 없이 수만 명의 사용자까지 QuickSight 쉽게 확장할 수 있습니다.
AWS Clean Rooms
AWS Clean Rooms기업과 파트너가 서로의 기본 데이터를 공유하거나 복사하지 않고도 집단 데이터 세트를 보다 쉽고 안전하게 분석하고 협업할 수 있도록 지원합니다. ... AWS Clean Rooms고객은 몇 분 만에 안전한 데이터 클린룸을 만들고 다른 회사와 협업할 수 있습니다. AWS 클라우드 광고 캠페인, 투자 결정, 연구 개발에 대한 고유한 통찰력을 제공합니다.
AWS Data Exchange
AWS Data Exchange클라우드에서 타사 데이터를 쉽게 찾고, 구독하고, 사용할 수 있습니다. 자격을 갖춘 데이터 제공업체로는 연간 220만 개 이상의 고유한 뉴스 기사 데이터를 여러 언어로 큐레이션하는 Reuters, 연간 140억 건 이상의 의료 거래와 1조 달러 규모의 클레임을 처리하고 익명화하는 Change Healthcare, 3억 3천만 개 이상의 글로벌 비즈니스 기록을 데이터베이스로 유지 관리하는 Dun & Bradstreet, 2억 2천만 명의 고유 소비자로부터 위치 데이터를 추출하고 전 세계 6천만 명 이상을 포함하는 Foursquare와 같은 카테고리를 선도하는 브랜드가 포함됩니다. 상업 장소.
데이터 제품에 가입하면 다음을 사용할 수 있습니다. AWS Data Exchange APIAmazon S3에 직접 데이터를 로드한 다음 다양한 방법으로 데이터를 분석합니다. AWS 분석 및 ML 서비스. 예를 들어 재산 보험사는 데이터를 구독하여 과거 날씨 패턴을 분석하여 다양한 지역의 보험 적용 범위를 조정할 수 있고, 레스토랑은 인구 및 위치 데이터를 구독하여 확장에 적합한 최적의 지역을 식별할 수 있으며, 학계 연구원은 이산화탄소 배출량 데이터를 구독하여 기후 변화에 대한 연구를 수행할 수 있으며, 의료 전문가는 과거 임상 시험에서 집계된 데이터를 구독하여 연구 활동을 가속화할 수 있습니다.
데이터 제공자의 경우 AWS Data Exchange 수백만 명의 사용자에게 쉽게 다가갈 수 있습니다. AWS 고객은 데이터 저장, 제공, 청구 및 권한 부여를 위한 인프라를 구축하고 유지할 필요가 없으므로 클라우드로 마이그레이션합니다.
AWS Data Pipeline
AWS Data Pipeline서로 다른 데이터 간에 데이터를 안정적으로 처리하고 이동할 수 있도록 도와주는 웹 서비스입니다. AWS 컴퓨팅 및 스토리지 서비스와 온프레미스 데이터 소스를 지정된 간격으로 제공합니다. 를 사용하여 AWS Data Pipeline, 저장된 데이터에 정기적으로 액세스하여 대규모로 변환 및 처리하고 결과를 Amazon S3, Amazon, Amazon RDSDynamoDB 및 Amazon과 같은 AWS 서비스로 효율적으로 전송할 수 있습니다. EMR
AWS Data Pipeline 내결함성이 있고 반복 가능하며 가용성이 높은 복잡한 데이터 처리 워크로드를 쉽게 생성할 수 있도록 도와줍니다. 리소스 가용성 보장, 작업 간 종속성 관리, 개별 작업의 일시적 실패 또는 제한 시간 재시도, 실패 알림 시스템 생성 등에 대해 걱정할 필요가 없습니다. AWS Data Pipeline 또한 이전에는 온프레미스 데이터 사일로에 갇혀 있던 데이터를 이동하고 처리할 수 있습니다.
AWS 엔티티 해상도
AWS Entity Resolution은 사용자 지정 솔루션을 구축하지 않고도 여러 애플리케이션, 채널 및 데이터 스토어에 저장된 관련 레코드를 일치시키고 연결할 수 있도록 지원하는 서비스입니다. 유연하고 구성 가능한 ML 및 규칙 기반 기술을 사용하여 AWS Entity Resolution은 중복 기록을 제거하고, 다양한 고객 상호 작용을 연결하여 고객 프로필을 만들고, 광고 및 마케팅 캠페인, 로열티 프로그램, 전자 상거래 전반에서 경험을 개인화할 수 있습니다. 예를 들어 광고 클릭, 장바구니 포기, 구매 등의 최근 이벤트를 고유한 매칭 ID로 연결하여 고객 상호 작용을 통합적으로 파악할 수 있습니다.
AWS Glue
AWS Glue고객이 분석을 위해 데이터를 쉽게 준비하고 로드할 수 있도록 하는 완전 관리형 추출, 변환 및 로드 (ETL) 서비스입니다. 에서 몇 번의 클릭만으로 ETL 작업을 생성하고 실행할 수 있습니다. AWS Management Console. 가리키기만 하면 됩니다. AWS Glue 에 저장된 데이터를 확인할 수 있습니다. AWS, 및 AWS Glue 데이터를 검색하고 관련 메타데이터 (예: 테이블 정의 및 스키마) 를 다음 위치에 저장합니다. AWS Glue Data Catalog. 카탈로그가 작성되면 데이터를 즉시 검색, 조회 및 사용할 수 있습니다. ETL
AWS Glue 데이터 통합 엔진은 Apache, Spark PySpark, Python을 사용하여 데이터에 액세스할 수 있도록 합니다. 다음과 같은 기능이 추가되었습니다. AWS Glue Ray의 경우 오픈 소스 통합 컴퓨팅 프레임워크인 Ray를 사용하여 워크로드를 추가로 확장할 수 있습니다.
AWS Glue Data Quality는 Amazon S3 기반 데이터 레이크, 데이터 웨어하우스 및 기타 데이터 리포지토리의 데이터 품질을 측정하고 모니터링할 수 있습니다. 자동으로 통계를 계산하고, 품질 규칙을 권장하고, 누락되거나, 오래되었거나, 잘못된 데이터가 감지되면 모니터링하고 경고를 보낼 수 있습니다. 다음에서 액세스할 수 있습니다. AWS Glue Data Catalog 그리고... AWS Glue Data Catalog ETL직업.
AWS Lake Formation보안 데이터 레이크를 며칠 만에 쉽게 설정할 수 있게 해주는 서비스입니다. 데이터 레이크는 모든 데이터를 원래 형식과 분석을 위한 형식 모두로 저장하는 큐레이팅된 중앙 집중식 보안 리포지토리입니다. 데이터 레이크를 사용하면 데이터 사일로를 분해하고 다양한 유형의 분석을 결합하여 인사이트를 얻고 더 나은 비즈니스 결정을 내릴 수 있습니다.
하지만 오늘날 데이터 레이크를 설정하고 관리하려면 복잡하고 시간이 많이 걸리는 수동 작업이 많이 필요합니다. 이 작업에는 다양한 소스에서 데이터 로드, 해당 데이터 흐름 모니터링, 파티션 설정, 암호화 설정 및 키 관리, 변환 작업 정의 및 작업 모니터링, 데이터를 컬럼 형식으로 재구성, 액세스 제어 설정 구성, 중복 데이터 제거, 연결된 레코드 매칭, 데이터 세트에 대한 액세스 권한 부여, 시간 경과에 따른 액세스 감사 등이 포함됩니다.
Lake Formation으로 데이터 레이크를 생성하는 것은 데이터의 상주 위치와 적용할 데이터 액세스 및 보안 정책을 정의하는 것만큼 간단합니다. 그런 다음 Lake Formation은 데이터베이스 및 객체 스토리지에서 데이터를 수집 및 분류하고, 데이터를 새로운 Amazon S3 데이터 레이크로 이동하고, ML 알고리즘을 사용하여 데이터를 정리 및 분류하고, 민감한 데이터에 대한 액세스를 보호합니다. 그러면 사용자는 사용 가능한 데이터 세트와 적절한 사용법을 설명하는 중앙 집중식 데이터 카탈로그에 액세스할 수 있습니다. 그런 다음 사용자는 Amazon EMR for Apache Spark, Amazon Redshift, Amazon Athena, Amazon 등 원하는 분석 및 ML 서비스를 통해 이러한 데이터 세트를 활용할 수 있습니다. SageMaker QuickSight
아파치 Kafka용 아마존 매니지드 스트리밍 (아마존) MSK
Apache Kafka용 Amazon Managed Streaming (MSKAmazon) 은 Apache Kafka를 사용하여 스트리밍 데이터를 처리하는 애플리케이션을 쉽게 구축하고 실행할 수 있는 완전관리형 서비스입니다. Apache Kafka는 실시간 스트리밍 데이터 파이프라인 및 애플리케이션을 구축하기 위한 오픈 소스 플랫폼입니다. Amazon에서는 Apache APIs Kafka를 사용하여 데이터 레이크를 채우고MSK, 데이터베이스에서 변경 사항을 스트리밍하고, ML 및 분석 애플리케이션을 지원할 수 있습니다.
Apache Kafka 클러스터는 프로덕션 환경에서 설정, 확장 및 관리하기가 어렵습니다. Apache Kafka를 직접 실행하는 경우 서버를 프로비저닝하고, Apache Kafka를 수동으로 구성하고, 장애 발생 시 서버를 교체하고, 서버 패치 및 업그레이드를 오케스트레이션하고, 고가용성을 위한 클러스터를 설계하고, 데이터가 안정적으로 저장되고 보호되는지 확인하고, 모니터링 및 경보를 설정하고, 부하 변경을 지원하기 위해 조정 이벤트를 신중하게 계획해야 합니다. Amazon을 MSK 사용하면 Apache Kafka 인프라 관리 전문 지식 없이도 Apache Kafka에서 프로덕션 애플리케이션을 쉽게 구축하고 실행할 수 있습니다. 따라서 인프라 관리에 소요되는 시간을 줄이고 애플리케이션 구축에 더 많은 시간을 할애할 수 있습니다.
Amazon MSK 콘솔에서 클릭 몇 번으로 Apache Kafka의 배포 모범 사례를 기반으로 한 설정 및 구성을 사용하여 가용성이 높은 Apache Kafka 클러스터를 생성할 수 있습니다. Amazon은 Apache Kafka 클러스터를 MSK 자동으로 프로비저닝하고 실행합니다. Amazon은 클러스터 상태를 MSK 지속적으로 모니터링하고 애플리케이션 가동 중지 없이 비정상 노드를 자동으로 교체합니다. 또한 Amazon은 저장된 데이터를 암호화하여 Apache Kafka 클러스터를 MSK 보호합니다.
로 돌아가기. AWS 서비스