초보자 및 전문가를 위한 기계 학습 - Amazon Redshift

초보자 및 전문가를 위한 기계 학습

Amazon Redshift를 사용하면 기계 학습(ML) 기능을 활용하여 ML 초보자든 전문가든 관계없이 데이터에서 인사이트를 얻을 수 있습니다. 기계 학습은 광범위한 ML 전문 지식이나 복잡한 데이터 엔지니어링 없이 SQL 명령을 사용하여 ML 모델을 생성, 훈련 및 배포할 수 있는 Amazon Redshift 기능입니다.

다음 섹션을 통해 기계 학습을 활용하는 프로세스를 설명하여 Amazon Redshift를 사용하여 데이터의 잠재력을 최대한 활용할 수 있도록 지원합니다.

Amazon Redshift ML을 사용하면 단일 SQL CREATE MODEL 명령으로 모델을 훈련할 수 있습니다. CREATE MODEL 명령은 Amazon Redshift에서 익숙한 SQL 구문으로 모델 기반 예측을 생성하는 데 사용하는 모델을 생성합니다.

Amazon Redshift 기계 학습은 기계 학습, 도구, 언어, 알고리즘 및 API에 대한 전문 지식이 없는 경우 특히 유용합니다. Amazon Redshift 기계 학습을 사용하면 외부 기계 학습 서비스와 통합하는 데 필요한 획일적이고 과중한 업무를 수행할 필요가 없습니다. Amazon Redshift를 사용하면 데이터 형식 지정 및 이동, 권한 제어 관리, 사용자 정의 통합, 워크플로 및 스크립트 구축에 소요되는 시간을 절약할 수 있습니다. 인기 있는 기계 학습 알고리즘을 쉽게 사용하고 훈련에서 예측까지 자주 반복해야 하는 훈련 요구 사항을 단순화할 수 있습니다. Amazon Redshift는 자동으로 최상의 알고리즘을 검색하고 문제에 가장 적합한 모델을 조정합니다. Amazon Redshift 외부로 데이터를 이동하거나 다른 서비스와 인터페이스하고 비용을 지불할 필요 없이 Amazon Redshift 클러스터 내에서 예측할 수 있습니다.

Amazon Redshift 기계 학습은 기계 학습을 사용하는 데이터 분석가와 데이터 사이언티스트를 지원합니다. 또한 이를 통해 기계 학습 전문가는 지식을 사용하여 CREATE MODEL 문이 지정한 측면만 사용하도록 안내할 수 있습니다. 이렇게 하면 CREATE MODEL이 최상의 후보를 찾는 데 필요한 시간을 단축하거나 모델의 정확도를 높이거나 둘 다 가능합니다.

CREATE MODEL 문은 훈련 작업에 파라미터를 지정하는 방법에 유연성을 제공합니다. 이러한 유연성을 통해 기계 학습 초보자 또는 전문가 모두 선호하는 프로프로세서, 알고리즘, 문제 유형 및 하이퍼파라미터를 선택할 수 있습니다. 예를 들어 고객 이탈에 관심이 있는 사용자는 CREATE MODEL 문에서 문제 유형이 고객 이탈에 잘 작동하는 이진 분류라고 지정할 수 있습니다. 그런 다음 CREATE MODEL 문은 최상의 모델 검색을 이진 분류 모델로 좁힙니다. 사용자가 문제 유형을 선택하더라도 CREATE MODEL 문이 사용할 수 있는 옵션은 여전히 많습니다. 예를 들어 CREATE MODEL은 최상의 사전 처리 변환을 검색 및 적용하고 최상의 하이퍼파라미터 설정을 검색합니다.

Amazon Redshift 기계 학습이 Amazon SageMaker Autopilot을 사용하여 최적의 모델을 자동으로 찾아 훈련을 더 쉽게 만듭니다. 백그라운드에서 Amazon SageMaker Autopilot은 제공된 데이터를 기반으로 최고의 기계 학습 모델을 자동으로 훈련하고 조정합니다. 그런 다음 Amazon SageMaker Neo가 훈련 모델을 컴파일하고 Redshift 클러스터에서 예측에 사용할 수 있도록 합니다. 훈련된 모델을 사용하여 기계 학습 추론 쿼리를 실행할 때 쿼리는 Amazon Redshift의 대규모 병렬 처리 기능을 사용할 수 있습니다. 동시에 쿼리는 기계 학습 기반 예측을 사용할 수 있습니다.

  • 기계 학습 초보자로서 프로프로세서, 알고리즘 및 하이퍼파라미터와 같은 기계 학습의 다양한 측면에 대한 일반 지식이 있는 경우 지정한 측면에만 CREATE MODEL 문을 사용합니다. 그런 다음 CREATE MODEL이 최상의 후보를 찾는 데 필요한 시간을 줄이거나 모델의 정확도를 향상시킬 수 있습니다. 문제 유형이나 목표와 같은 추가 도메인 지식을 도입하여 예측의 비즈니스 가치를 높일 수도 있습니다. 예를 들어 고객 이탈 시나리오에서 "고객이 활동하고 있지 않음"이라는 결과가 드물다면 F1 목표가 정확도 목표보다 선호되는 경우가 많습니다. 높은 정확도 모델은 항상 "고객이 활동하고 있음"이라고 예측할 수 있기 때문에 정확도는 높지만 비즈니스 가치는 거의 없습니다. F1 목표에 대한 자세한 내용은 Amazon SageMaker API ReferenceAutoMLJobObjective 섹션을 참조하세요.

    CREATE MODEL 문의 기본 옵션에 대한 자세한 내용은 단순 CREATE MODEL 섹션을 참조하세요.

  • 기계 학습 고급 실무자는 특정(일부) 기능에 대한 문제 유형과 전처리기를 지정할 수 있습니다. 그런 다음 CREATE MODEL은 지정된 측면에 대한 제안을 따릅니다. 동시에 CREATE MODEL은 여전히 나머지 기능과 최고의 하이퍼파라미터에 대한 최고의 프로프로세서를 검색합니다. 훈련 파이프라인의 하나 이상의 측면을 제한하는 방법에 대한 자세한 내용은 사용자 안내에 따라 CREATE MODEL 섹션을 참조하세요.

  • 기계 학습 전문가는 훈련 및 하이퍼파라미터 튜닝을 완벽하게 제어할 수 있습니다. 그러면 CREATE MODEL 문은 사용자가 모든 선택을 하기 때문에 최적의 프로프로세서, 알고리즘 및 하이퍼파라미터를 검색하려고 하지 않습니다. AUTO OFF와 함께 CREATE MODEL을 사용하는 방법에 대한 자세한 내용은 AUTO OFF로 CREATE XGBoost 모델 섹션을 참조하세요.

  • 데이터 엔지니어는 로컬 추론을 위해 Amazon SageMaker에서 Amazon Redshift로 사전 훈련된 XGBoost 모델을 가져올 수 있습니다. 기존 보유 모델 사용(BYOM)으로 Amazon Redshift에서 로컬로 데이터베이스 내 추론을 위해 Amazon SageMaker와 함께 Amazon Redshift 외부에서 훈련된 모델을 사용할 수 있습니다. Amazon Redshift 기계 학습은 로컬 또는 원격 추론에서 BYOM 사용을 지원합니다.

    로컬 또는 원격 추론에 CREATE MODEL 문을 사용하는 방법에 대한 자세한 내용은 기존 보유 모델 사용(BYOM) - 로컬 추론 섹션을 참조하세요.

Amazon Redshift 기계 학습 사용자는 다음 옵션을 선택하여 모델을 훈련하고 배포할 수 있습니다.