기계 학습
Amazon Redshift 기계 학습은 모든 기술 수준의 분석가와 데이터 사이언티스트가 기계 학습 기술을 더 쉽게 사용할 수 있도록 하는 강력한 클라우드 기반 서비스입니다. Amazon Redshift ML은 모델을 사용하여 결과를 만듭니다. 모델 사용 방법은 다음과 같습니다.
모델을 훈련하려는 데이터와 데이터 입력과 연결된 메타데이터를 Amazon Redshift에 제공합니다. 그런 다음 Amazon Redshift ML은 입력 데이터의 패턴을 캡처하는 Amazon SageMaker의 모델을 생성합니다. 모델에 자체 데이터를 사용하여 Amazon Redshift ML로 이탈 예측, 고객 생애 주기 값 또는 수익 예측 등의 데이터 추세를 식별할 수 있습니다. 이러한 모델을 사용하면 추가 비용 없이 새 입력 데이터에 대한 예측을 생성하는 것이 가능합니다.
Claude 또는 Amazon Titan과 같이 Amazon Bedrock에서 제공하는 파운데이션 모델(FM) 중 하나를 사용할 수 있습니다. Amazon Bedrock을 사용하면 몇 가지 단계로 대규모 언어 모델(LLM)의 힘을 Amazon Redshift의 분석 데이터와 통합할 수 있습니다. 외부 대규모 언어 모델(LLM)을 사용하여 Amazon Redshift로 데이터에 대한 자연어 처리(NLP)를 수행하는 것이 가능합니다. 텍스트 작성, 감정 분석 또는 번역 등의 애플리케이션에 NLP를 사용할 수 있습니다. Amazon Redshift에서 Amazon Bedrock 사용에 관한 자세한 내용은 Amazon Redshift ML과 Amazon Bedrock의 통합 섹션을 참조하시기 바랍니다.
참고
서비스 개선을 위한 데이터 사용 선택 해제
Amazon Bedrock 모델을 사용하고 있으며 서비스 개선을 목적으로 AWS가 데이터를 처리하지 않도록 하려면 Amazon Bedrock의 선택 해제 정책을 사용 설정해야 합니다.
참고
LLM은 부정확한 정보나 불완전한 정보를 생성할 수 있습니다. LLM이 생성하는 정보를 확인하여 정확하고 완전한 정보인지 확인하는 것이 좋습니다.
Amazon Redshift 기계 학습이 Amazon SageMaker와 작동하는 방식
Amazon Redshift는 Amazon SageMaker Autopilot과 함께 작동하여 최상의 모델을 자동으로 얻고 Amazon Redshift에서 예측 함수를 사용할 수 있도록 합니다.
다음 다이어그램은 Amazon Redshift 기계 학습의 작동 방식을 보여줍니다.
일반적인 워크플로는 다음과 같습니다.
-
Amazon Redshift는 훈련 데이터를 Amazon S3로 내보냅니다.
-
Amazon SageMaker Autopilot은 훈련 데이터를 사전 처리합니다. 사전 처리는 누락 값 대치와 같은 중요한 기능을 수행합니다. 특정 열이 우편 번호와 같은 범주형임을 인식하고 훈련을 위해 적절한 형식을 지정하고 기타 여러 태스크를 수행합니다. 훈련 데이터 집합에 적용할 최고의 전처리기를 선택하는 것 자체가 문제이며 Amazon SageMaker Autopilot은 솔루션을 자동화합니다.
-
Amazon SageMaker Autopilot은 가장 정확한 예측으로 모델을 제공하는 알고리즘 및 알고리즘 하이퍼파라미터를 찾습니다.
-
Amazon Redshift는 예측 함수를 Amazon Redshift 클러스터에 SQL 함수로 등록합니다.
-
CREATE MODEL 문을 실행할 때 Amazon Redshift는 훈련에 Amazon SageMaker를 사용합니다. 따라서 모델 훈련을 위한 관련 비용이 있습니다. 이는 AWS 청구서에서 Amazon SageMaker에 대한 별도의 품목입니다. 또한 훈련 데이터를 저장하기 위해 Amazon S3에서 사용하는 스토리지에 대한 비용을 지불합니다. Redshift 클러스터에서 컴파일하고 실행할 수 있는 CREATE MODEL로 생성된 모델을 사용한 추론에는 요금이 부과되지 않습니다. Amazon Redshift 기계 학습 사용에 따른 추가 Amazon Redshift 요금은 없습니다.