기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
분석
AWS 는 모든 데이터 분석 요구 사항에 맞는 포괄적인 분석 서비스 세트를 제공하며 모든 규모 및 산업의 조직이 데이터를 사용하여 비즈니스를 재창조할 수 있도록 지원합니다. 스토리지 및 관리, 데이터 거버넌스, 작업 및 경험에서는 최상의 가격 대비 성능, 확장성 및 최저 비용을 제공하는 특별히 구축된 서비스를 AWS 제공합니다.
각 서비스는 다이어그램 뒤에 설명되어 있습니다. 필요에 가장 적합한 서비스를 결정하는 데 도움이 되도록 AWS 분석 서비스 선택을 참조하세요. 일반 정보는 의 분석을 AWS참조하세요.
로 돌아갑니다AWS 서비스.
Amazon Athena
Amazon Athena는 표준를 사용하여 Amazon S3의 데이터를 쉽게 분석할 수 있는 대화형 쿼리 서비스입니다SQL. Athena는 서버리스 서비스이므로 관리할 인프라가 없으며 실행한 쿼리에 대해서만 비용을 지불하면 됩니다.
Athena는 사용하기 쉽습니다. Amazon S3의 데이터를 가리키고 스키마를 정의한 다음 표준를 사용하여 쿼리를 시작합니다SQL. 대부분의 결과는 몇 초 내에 전달됩니다. Athena를 사용하면 분석을 위해 데이터를 준비하는 데 복잡한 추출, 변환 및 로드(ETL) 작업이 필요하지 않습니다. 이를 통해 SQL 기술을 보유한 모든 사용자가 대규모 데이터 세트를 빠르게 분석할 수 있습니다.
Athena는 out-of-the-box와 통합되어 있으므로 다양한 서비스에서 통합 메타데이터 리포지토리를 AWS Glue Data Catalog생성하고, 데이터 소스를 크롤링하여 스키마를 검색하고, 카탈로그를 새롭고 수정된 테이블 및 파티션 정의로 채우고, 스키마 버전 관리를 유지할 수 있습니다.
Amazon CloudSearch
Amazon CloudSearch은 웹 사이트 또는 애플리케이션에 대한 검색 솔루션을 간단하고 비용 효율적으로 설정, 관리 및 확장할 수 AWS 클라우드 있는의 관리형 서비스입니다. Amazon은 강조 표시, 자동 완성 및 지리 공간 검색과 같은 34개 언어와 인기 있는 검색 기능을 CloudSearch 지원합니다.
Amazon DataZone
Amazon DataZone은 개인 맞춤형 웹 애플리케이션을 통해 데이터를 게시하고 비즈니스 데이터 카탈로그에 제공하는 데 사용할 수 있는 데이터 관리 서비스입니다. 온 AWS, 온프레미스 또는 Salesforce와 같은 SaaS 애플리케이션에서 저장된 위치에 관계없이 데이터에 더 안전하게 액세스할 수 있습니다. Amazon은 Amazon Redshift, Amazon Athena, AWS Glue AWS Lake Formation, Amazon과 같은 AWS 서비스 전반에서 경험을 DataZone 간소화합니다 QuickSight.
Amazon EMR
AmazonEMR은 Apache Spark, Apache Hive, Apache , Apache Flink, Apache Hudi, Presto와 같은 오픈 소스 도구를 사용하여 방대한 양의 데이터를 처리하기 위한 업계 최고의 클라우드 빅 데이터 플랫폼입니다. HBase https://aws.amazon.com/blogs/big-data/use-apache-flink-on-amazon-emr/ Amazon을 EMR 사용하면 프로비저닝 용량 및 클러스터 튜닝과 같이 시간이 많이 걸리는 작업을 자동화하여 빅 데이터 환경을 쉽게 설정, 운영 및 확장할 수 있습니다. Amazon를 EMR사용하면 기존 온프레미스 솔루션 비용의 절반 미만에서 표준 Apache Spark보다 3배 이상 빠르게 페타바이트 규모의 분석을 실행할 수 있습니다. Amazon EC2 인스턴스, Amazon Elastic Kubernetes Service(AmazonEKS) 클러스터 또는 Amazon EMR on을 사용하는 온프레미스에서 워크로드를 실행할 수 있습니다 AWS Outposts.
Amazon FinSpace
Amazon FinSpace는 금융 서비스 산업을 위해 특별히 구축된 데이터 관리 및 분석 서비스입니다(FSI).는 몇 달에서 몇 분으로 분석을 준비하기 위해 페타바이트의 금융 데이터를 찾고 준비하는 데 소요되는 시간을 FinSpace 줄입니다.
금융 서비스 조직은 포트폴리오, 보험계리 및 위험 관리 시스템과 같은 내부 데이터 스토어의 데이터와 증권 거래소의 과거 증권 가격과 같은 타사 데이터 피드의 페타바이트 데이터를 분석합니다. 올바른 데이터를 찾고, 규정을 준수하는 방식으로 데이터에 액세스할 수 있는 권한을 얻고, 분석을 준비하는 데 몇 달이 걸릴 수 있습니다.
FinSpace 는 재무 분석을 위한 데이터 관리 시스템을 구축하고 유지 관리하는 데 드는 부담을 제거합니다. FinSpace를 사용하면 데이터를 수집하고 자산 클래스, 위험 분류 또는 지리적 리전과 같은 관련 비즈니스 개념에 따라 카탈로그화할 수 있습니다.를 FinSpace 사용하면 규정 준수 요구 사항에 따라 조직 전체에서 데이터를 쉽게 검색하고 공유할 수 있습니다. 데이터 액세스 정책을 한 곳에서 정의하고 감사 로그를 유지 FinSpace 하여 규정 준수 및 활동 보고를 허용합니다. FinSpace 또한 분석을 위해 데이터를 준비할 수 있도록 타임바 및 Bollinger 밴드와 같은 100개 이상의 함수 라이브러리가 포함되어 있습니다.
Amazon Kinesis
Amazon Kinesis를 사용하면 실시간 스트리밍 데이터를 쉽게 수집, 처리 및 분석할 수 있으므로 적시에 인사이트를 얻고 새로운 정보에 빠르게 대응할 수 있습니다. Amazon Kinesis는 애플리케이션의 요구 사항에 가장 적합한 도구를 선택할 수 있는 유연성과 함께 모든 규모에서 스트리밍 데이터를 비용 효율적으로 처리할 수 있는 주요 기능을 제공합니다. Amazon Kinesis를 사용하면 기계 학습(ML), 분석 및 기타 애플리케이션을 위한 비디오, 오디오, 애플리케이션 로그, 웹 사이트 클릭스트림 및 IoT 원격 측정 데이터와 같은 실시간 데이터를 수집할 수 있습니다. Amazon Kinesis를 사용하면 모든 데이터가 수집될 때까지 기다렸다가 처리를 시작하는 대신 데이터가 도착할 때 데이터를 처리하고 분석하고 즉시 대응할 수 있습니다.
Amazon Kinesis는 현재 Firehose, Managed Service for Apache Flink, Kinesis Data Streams, Kinesis Video Streams의 네 가지 서비스를 제공합니다.
Amazon Data Firehose
Amazon Data Firehose는 스트리밍 데이터를 데이터 스토어 및 분석 도구에 안정적으로 로드하는 가장 쉬운 방법입니다. 스트리밍 데이터를 캡처, 변환 및 Amazon S3, Amazon Redshift, Amazon OpenSearch Service 및 Splunk로 로드하여 현재 이미 사용 중인 기존 비즈니스 인텔리전스 도구 및 대시보드를 사용하여 거의 실시간에 가까운 분석을 수행할 수 있습니다. 이 서비스는 데이터의 처리량에 맞게 자동으로 확장되며 지속적인 관리가 필요하지 않은 완전 관리형 서비스입니다. 또한 데이터를 로드하기 전에 배치, 압축, 변환 및 암호화하여 대상에서 사용되는 스토리지 양을 최소화하고 보안을 강화할 수 있습니다.
에서 Firehose 전송 스트림을 쉽게 생성하고 AWS Management Console, 몇 번의 클릭으로 구성하고, 수십만 개의 데이터 소스에서 스트림으로 데이터를 전송하여 지속적으로 로드할 수 있습니다. AWS모두 몇 분 만에 가능합니다. 또한 데이터가 Amazon S3로 전송되기 ORC전에 수신 데이터를 Apache Parquet 및 Apache와 같은 열 형식으로 자동으로 변환하도록 전송 스트림을 구성하여 비용 효율적인 스토리지 및 분석을 수행할 수 있습니다.
Amazon Managed Service for Apache Flink
Amazon Managed Service for Apache Flink는 스트리밍 데이터를 분석하고, 실행 가능한 인사이트를 얻고, 비즈니스 및 고객 요구 사항에 실시간으로 대응하는 가장 쉬운 방법입니다. Amazon Managed Service for Apache Flink는 스트리밍 애플리케이션을 구축, 관리 및 다른 AWS 서비스와 통합하는 복잡성을 줄입니다. SQL 사용자는 템플릿과 대화형 SQL 편집기를 사용하여 스트리밍 데이터를 쉽게 쿼리하거나 전체 스트리밍 애플리케이션을 빌드할 수 있습니다. Java 개발자는 오픈 소스 Java 라이브러리 및 AWS 통합을 사용하여 정교한 스트리밍 애플리케이션을 빠르게 구축하여 데이터를 실시간으로 변환하고 분석할 수 있습니다.
Amazon Managed Service for Apache Flink는 쿼리를 지속적으로 실행하는 데 필요한 모든 것을 처리하고 수신 데이터의 볼륨 및 처리량 비율에 맞게 자동으로 확장합니다.
Amazon Kinesis Data Streams
Amazon Kinesis Data Streams는 확장성과 내구성이 뛰어난 실시간 데이터 스트리밍 서비스입니다. Kinesis Data Streams는 웹 사이트 클릭스트림, 데이터베이스 이벤트 스트림, 금융 트랜잭션, 소셜 미디어 피드, IT 로그 및 위치 추적 이벤트와 같은 수십만 개의 소스에서 초당 기가바이트의 데이터를 지속적으로 캡처할 수 있습니다. 수집된 데이터는 밀리초 단위로 실시간 대시보드, 실시간 이상 탐지, 동적 요금 등과 같은 실시간 분석 사용 사례를 활성화할 수 있습니다.
Amazon Kinesis Video Streams
Amazon Kinesis Video Streams를 사용하면 연결된 디바이스에서 로 비디오를 안전하게 스트리밍하여 AWS 분석, ML, 재생 및 기타 처리를 수행할 수 있습니다. Kinesis Video Streams는 수백만 개의 디바이스에서 스트리밍 비디오 데이터를 수집하는 데 필요한 모든 인프라를 자동으로 프로비저닝하고 탄력적으로 확장합니다. 또한 스트림에 비디오 데이터를 내구성 있게 저장, 암호화 및 인덱싱하고를 통해 easy-to-use 데이터에 액세스할 수 있습니다APIs. Kinesis Video Streams를 사용하면 라이브 및 온디맨드 보기를 위해 비디오를 재생하고 Amazon Rekognition Video와의 통합을 통해 컴퓨터 비전 및 비디오 분석을 활용하는 애플리케이션과 Apache, OpenCV와 같은 ML 프레임워크용 라이브러리 MxNet TensorFlow를 빠르게 구축할 수 있습니다.
Amazon OpenSearch 서비스
Amazon OpenSearch Service(OpenSearch 서비스)를 사용하면 데이터를 실시간으로 검색, 분석 및 시각화 OpenSearch 하기 위해 쉽게 배포, 보안, 운영 및 확장할 수 있습니다. Amazon OpenSearch Service를 사용하면 로그 분석, 전체 텍스트 검색, 애플리케이션 모니터링 및 클릭스트림 분석과 같은 사용 사례를 엔터프라이즈급 가용성, 확장성 및 보안으로 강화할 수 있는 APIs 및 실시간 분석 기능을 얻을 수 easy-to-use 있습니다. 이 서비스는 데이터 수집 및 시각화를 위한 OpenSearch 대시보드 및 Logstash와 같은 오픈 소스 도구와의 통합을 제공합니다. 또한 Amazon Virtual Private Cloud(Amazon VPC), AWS Key Management Service (AWS KMS), Amazon Data Firehose, AWS Lambda, AWS Identity and Access Management (IAM), Amazon Cognito 및 Amazon CloudWatch과 같은 다른 AWS 서비스와 원활하게 통합되어 원시 데이터에서 실행 가능한 인사이트로 빠르게 이동할 수 있습니다.
Amazon OpenSearch Serverless
Amazon OpenSearch Serverless는 Amazon OpenSearch Service의 서버리스 옵션입니다. 개발자는 OpenSearch Serverless를 사용하여 OpenSearch 클러스터를 구성, 관리 및 확장하지 않고도 페타바이트 규모의 워크로드를 실행할 수 있습니다. 서버리스 환경의 단순성을 통해 OpenSearch 서비스와 동일한 대화형 밀리초 응답 시간을 얻을 수 있습니다.
Amazon OpenSearch Serverless용 벡터 엔진은 간단하고 확장 가능하며 성능이 뛰어난 벡터 스토리지 및 검색 기능을 추가하여 개발자가 벡터 데이터베이스 인프라를 관리할 필요 없이 ML 증강 검색 경험과 생성형 AI 애플리케이션을 구축할 수 있도록 지원합니다. 벡터 검색 컬렉션의 사용 사례에는 이미지 검색, 문서 검색, 음악 검색, 제품 추천, 비디오 검색, 위치 기반 검색, 사기 탐지 및 이상 탐지가 포함됩니다.
Amazon Redshift
Amazon Redshift는 가장 널리 사용되는 클라우드 데이터 웨어하우스입니다. 표준 및 기존 비즈니스 인텔리전스(BI) 도구를 사용하여 모든 데이터를 빠르고 간단SQL하며 비용 효율적으로 분석할 수 있습니다. 이를 통해 정교한 쿼리 최적화, 고성능 스토리지의 열 기반 스토리지, 대규모 병렬 쿼리 완료를 사용하여 테라바이트에서 페타바이트에 이르는 정형 및 반정형 데이터에 대해 복잡한 분석 쿼리를 실행할 수 있습니다. 대부분의 결과는 몇 초 만에 반환됩니다. 약정 없이 시간당 단 0.25 USD로 소규모로 시작하고 기존 온프레미스 솔루션 비용의 1/10 미만에 해당하는 연간 테라바이트당 1,000 USD로 페타바이트의 데이터로 확장할 수 있습니다.
Amazon Redshift Serverless
Amazon Redshift Serverless를 사용하면 데이터 웨어하우스 인프라를 관리할 필요 없이 분석을 더 쉽게 실행하고 확장할 수 있습니다. 개발자, 데이터 과학자 및 분석가는 데이터베이스, 데이터 웨어하우스 및 데이터 레이크에서 작업하여 보고 및 대시보드 애플리케이션을 구축하고, 실시간에 가까운 분석을 수행하고, 데이터를 공유하고 협업하고, 기계 학습(ML) 모델을 빌드하고 훈련할 수 있습니다. 대량의 데이터에서 몇 초 만에 인사이트로 이동합니다. Amazon Redshift Serverless는 데이터 웨어하우스 용량을 자동으로 프로비저닝하고 지능적으로 확장하여 가장 까다롭고 예측할 수 없는 워크로드에 대해서도 빠른 성능을 제공하며 사용한 만큼만 비용을 지불합니다. Amazon Redshift Query Editor 또는 선호하는 비즈니스 인텔리전스(BI) 도구에서 즉시 데이터를 로드하고 쿼리를 시작하면 easy-to-use제로 관리 환경에서 최고의 가격 성능과 친숙한 SQL 기능을 계속 누릴 수 있습니다.
Amazon QuickSight
Amazon QuickSight은 조직의 모든 사람에게 인사이트를 쉽게 제공할 수 있는 클라우드 기반 비즈니스 인텔리전스(BI) 서비스입니다.를 QuickSight 사용하면 브라우저 또는 모바일 디바이스에서 액세스할 수 있는 대화형 대시보드를 생성하고 게시할 수 있습니다. 대시보드를 애플리케이션에 포함시켜 고객에게 강력한 셀프 서비스 분석을 제공할 수 있습니다. Amazon은 설치할 소프트웨어, 배포할 서버 또는 관리할 인프라 없이 수만 명의 사용자로 QuickSight 쉽게 확장할 수 있습니다.
AWS Clean Rooms
AWS Clean Rooms는 기업과 파트너가 서로의 기본 데이터를 공유하거나 복사하지 않고도 집합 데이터 세트를 보다 쉽고 안전하게 분석하고 협업할 수 있도록 지원합니다. AWS Clean Rooms를 사용하면 몇 분 만에 안전한 데이터 정리 공간을 만들고에서 다른 회사와 협력하여 광고 캠페인, 투자 결정, 연구 및 개발에 대한 고유한 인사이트 AWS 클라우드 를 생성할 수 있습니다.
AWS Data Exchange
AWS Data Exchange를 사용하면 클라우드에서 타사 데이터를 쉽게 찾고, 구독하고, 사용할 수 있습니다. 적격 데이터 제공업체에는 로이터, 연간 220만 개 이상의 고유한 뉴스 기사에서 여러 언어로 데이터를 큐레이션하는 사용자 변경 의료, 연간 140억 건 이상의 의료 거래와 1조 달러 이상의 클레임을 처리하고 익명화하는 사람 Dun & Bradstreet, 3억 3천만 개 이상의 글로벌 비즈니스 레코드 데이터베이스를 유지 관리하는 사용자 및 포스퀘어, 위치 데이터는 2억 2천만 명의 고유한 소비자로부터 파생되며 6천만 개 이상의 글로벌 상업 장소를 포함합니다.
데이터 제품을 구독하면 AWS Data Exchange API를 사용하여 Amazon S3에 직접 데이터를 로드한 다음 다양한 AWS 분석 및 ML 서비스로 분석할 수 있습니다. 예를 들어 부동산 보험사는 데이터를 구독하여 과거 날씨 패턴을 분석하여 다양한 지역의 보험 적용 범위 요구 사항을 조정할 수 있습니다. 레스토랑은 모집단 및 위치 데이터를 구독하여 확장할 최적의 리전을 식별할 수 있습니다. 학술 연구원은 이산화탄소 배출량에 대한 데이터를 구독하여 기후 변화에 대한 연구를 수행할 수 있습니다. 및 의료 전문가는 과거 임상 실험에서 집계된 데이터를 구독하여 연구 활동을 가속화할 수 있습니다.
데이터 공급자의 경우 AWS Data Exchange 는 데이터 스토리지, 전송, 결제 및 권한 부여를 위한 인프라를 구축하고 유지 관리할 필요가 없으므로 클라우드로 마이그레이션하는 수백만 명의 AWS 고객에게 쉽게 연락할 수 있습니다.
AWS Data Pipeline
AWS Data Pipeline는 지정된 간격으로 다양한 AWS 컴퓨팅 및 스토리지 서비스와 온프레미스 데이터 소스 간에 데이터를 안정적으로 처리하고 이동하는 데 도움이 되는 웹 서비스입니다. 를 사용하면 저장된 데이터에 정기적으로 액세스하고, 대규모로 데이터를 변환 및 처리하고, 결과를 Amazon S3, Amazon RDS, Amazon DynamoDB 및 Amazon EMR와 같은 AWS 서비스로 효율적으로 전송할 AWS Data Pipeline수 있습니다.
AWS Data Pipeline 를 사용하면 내결함성, 반복성 및 가용성이 뛰어난 복잡한 데이터 처리 워크로드를 쉽게 생성할 수 있습니다. 리소스 가용성 보장, 작업 간 종속성 관리, 개별 작업에서 일시적인 장애 또는 제한 시간 재시도 또는 장애 알림 시스템 생성에 대해 걱정할 필요가 없습니다. AWS Data Pipeline 또한를 사용하면 이전에 온프레미스 데이터 사일로에 잠긴 데이터를 이동하고 처리할 수 있습니다.
AWS 개체 확인
AWS Entity Resolution은 사용자 지정 솔루션을 구축하지 않고 여러 애플리케이션, 채널 및 데이터 스토어에 저장된 관련 레코드를 일치시키고 연결하는 데 도움이 되는 서비스입니다. 유연하고 구성 가능한 ML 및 규칙 기반 기술을 사용하여 AWS Entity Resolution은 중복 레코드를 제거하고, 다양한 고객 상호 작용을 연결하여 고객 프로필을 생성하고, 광고 및 마케팅 캠페인, 로열티 프로그램 및 전자 상거래 전반에서 경험을 개인화할 수 있습니다. 예를 들어 광고 클릭, 장바구니 포기 및 구매와 같은 최근 이벤트를 고유한 일치 ID에 연결하여 고객 상호 작용의 통합 보기를 생성할 수 있습니다.
AWS Glue
AWS Glue는 고객이 분석을 위해 데이터를 쉽게 준비하고 로드할 수 있는 완전 관리형 추출, 변환 및 로드(ETL) 서비스입니다. 에서 몇 번의 클릭으로 ETL 작업을 생성하고 실행할 수 있습니다 AWS Management Console. 에 저장된 데이터를 AWS Glue 가리키면가 데이터를 AWS AWS Glue 검색하고 연결된 메타데이터(예: 테이블 정의 및 스키마)를에 저장합니다 AWS Glue Data Catalog. 카탈로그가 작성되면 데이터를 즉시 검색하고 쿼리할 수 있으며에 사용할 수 있습니다ETL.
AWS Glue 데이터 통합 엔진은 Apache Spark PySpark및 Python을 사용하여 데이터에 대한 액세스를 제공합니다. AWS Glue for Ray를 추가하면 오픈 소스 통합 컴퓨팅 프레임워크인 Ray를 사용하여 워크로드를 추가로 확장할 수 있습니다.
AWS Glue 데이터 품질은 Amazon S3 기반 데이터 레이크, 데이터 웨어하우스 및 기타 데이터 리포지토리의 데이터 품질을 측정하고 모니터링할 수 있습니다. 통계를 자동으로 계산하고, 품질 규칙을 권장하며, 누락되거나 오래된 데이터 또는 잘못된 데이터를 감지하면 이를 모니터링하고 알릴 수 있습니다. AWS Glue Data Catalog 및 작업에서 액세스할 수 있습니다 AWS Glue Data Catalog ETL.
AWS Lake Formation는 며칠 내에 안전한 데이터 레이크를 쉽게 설정할 수 있는 서비스입니다. 데이터 레이크는 모든 데이터를 원래 형식과 분석을 위한 형식 모두로 저장하는 큐레이팅된 중앙 집중식 보안 리포지토리입니다. 데이터 레이크를 사용하면 데이터 사일로를 분해하고 다양한 유형의 분석을 결합하여 인사이트를 얻고 더 나은 비즈니스 결정을 내릴 수 있습니다.
그러나 오늘날 데이터 레이크를 설정하고 관리하려면 많은 수동적이고 복잡하며 시간이 많이 걸리는 작업이 필요합니다. 이 작업에는 다양한 소스에서 데이터 로드, 이러한 데이터 흐름 모니터링, 파티션 설정, 암호화 및 키 관리, 변환 작업 정의 및 작업 모니터링, 데이터를 열 형식으로 재구성, 액세스 제어 설정 구성, 중복 데이터 중복 제거, 연결된 레코드 일치, 데이터 세트에 대한 액세스 권한 부여, 시간 경과에 따른 액세스 감사가 포함됩니다.
Lake Formation을 사용하여 데이터 레이크를 생성하는 것은 데이터가 있는 위치와 적용할 데이터 액세스 및 보안 정책을 정의하는 것만큼 간단합니다. 그런 다음 Lake Formation은 데이터베이스 및 객체 스토리지에서 데이터를 수집 및 카탈로그화하고, 데이터를 새 Amazon S3 데이터 레이크로 이동하고, ML 알고리즘을 사용하여 데이터를 정리 및 분류하고, 민감한 데이터에 대한 액세스를 보호합니다. 그런 다음 사용자는 사용 가능한 데이터 세트와 적절한 사용을 설명하는 중앙 집중식 데이터 카탈로그에 액세스할 수 있습니다. 그런 다음 사용자는 Amazon EMR for Apache Spark, Amazon Redshift, Amazon Athena, SageMaker AI, Amazon과 같은 분석 및 ML 서비스 선택에 따라 이러한 데이터 세트를 활용합니다 QuickSight.
Amazon Managed Streaming for Apache Kafka(AmazonMSK)
Amazon Managed Streaming for Apache Kafka(Amazon MSK)는 Apache Kafka를 사용하여 스트리밍 데이터를 처리하는 애플리케이션을 쉽게 구축하고 실행할 수 있는 완전 관리형 서비스입니다. Apache Kafka는 실시간 스트리밍 데이터 파이프라인 및 애플리케이션을 구축하기 위한 오픈 소스 플랫폼입니다. Amazon를 사용하면 Apache KafkaAPIs를 사용하여 데이터 레이크를 채우고, 데이터베이스 간에 변경 사항을 스트리밍하고, ML 및 분석 애플리케이션에 전원을 MSK공급할 수 있습니다.
Apache Kafka 클러스터는 프로덕션 환경에서 설정, 확장 및 관리하기가 어렵습니다. Apache Kafka를 자체적으로 실행할 때는 서버를 프로비저닝하고, Apache Kafka를 수동으로 구성하고, 서버가 실패할 때 서버를 교체하고, 서버 패치 및 업그레이드를 오케스트레이션하고, 고가용성을 위해 클러스터를 설계하고, 데이터가 내구성 있게 저장 및 보호되는지 확인하고, 모니터링 및 경보를 설정하고, 로드 변경을 지원하기 위해 조정 이벤트를 신중하게 계획해야 합니다. AmazonMSK을 사용하면 Apache Kafka 인프라 관리 전문 지식 없이도 Apache Kafka에서 프로덕션 애플리케이션을 쉽게 빌드하고 실행할 수 있습니다. 즉, 인프라 관리에 소요되는 시간을 줄이고 애플리케이션 구축에 더 많은 시간을 할애할 수 있습니다.
Amazon MSK 콘솔에서 몇 번의 클릭으로 Apache Kafka의 배포 모범 사례를 기반으로 설정 및 구성을 사용하여 가용성이 높은 Apache Kafka 클러스터를 생성할 수 있습니다. Amazon은 Apache Kafka 클러스터를 MSK 자동으로 프로비저닝하고 실행합니다. Amazon은 클러스터 상태를 MSK 지속적으로 모니터링하고 애플리케이션의 가동 중지 없이 비정상 노드를 자동으로 교체합니다. 또한 Amazon은 저장 데이터를 암호화하여 Apache Kafka 클러스터를 MSK 보호합니다.
로 돌아갑니다AWS 서비스.