기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker AI JumpStart Industry: Financial 솔루션, 모델 및 예제 노트북을 사용하여 엄선된 원스텝 솔루션과 산업 중심 기계 학습(ML) 문제의 예제 노트북을 통해 SageMaker AI 기능에 대해 알아봅니다. 해당 노트북에서는 SageMaker JumpStart Industry Python SDK를 사용하여 업종 텍스트 데이터를 향상시키고 사전 훈련 모델을 미세 조정하는 방법도 안내합니다.
주제
Amazon SageMaker AI JumpStart Industry Python SDK
SageMaker Runtime JumpStart는 SageMaker JumpStart Industry Python SDK라는 클라이언트 라이브러리를 통해 업종 데이터세트를 엄선하고 사전 훈련 모델을 미세 조정하기 위한 처리 도구를 제공합니다. 이 SDK에 대한 자세한 API 설명서를 확인하고, SageMaker JumpStart로 최신 모델의 성능을 개선하기 위한 업종 텍스트 데이터세트를 처리 및 개선하는 방법을 자세히 알아보려면 SageMaker JumpStart Industry Python SDK 오픈 소스 설명서
Amazon SageMaker AI JumpStart Industry: 금융 솔루션
SageMaker AI JumpStart Industry: Financial은 다음과 같은 솔루션 노트북을 제공합니다.
-
기업 신용 등급 예측
이 SageMaker AI JumpStart Industry: Financial 솔루션은 텍스트 강화 기업 신용 등급 모델을 위한 템플릿을 제공합니다. 이 솔루션에서는 수치적 특징(이 경우에는 Altman의 유명한 5개 재무비율)을 기준으로 하는 모델을 SEC 자료의 텍스트와 결합시켜 신용 등급 예측을 개선하는 방법을 보여줍니다. Altman의 5개 비율 외에도 필요에 따라 더 많은 변수를 추가하거나 사용자 지정 변수를 설정할 수 있습니다. 이 솔루션 노트북은 SageMaker JumpStart Industry Python SDK가 SEC 자료 내 텍스트의 자연어 처리(NLP) 점수 평가 처리에 어떤 도움이 되는지를 보여줍니다. 또한 솔루션은 향상된 데이터 세트를 사용하여 모델을 훈련하여 best-in-class강의 모델을 달성하고, 프로덕션을 위해 모델을 SageMaker AI 엔드포인트에 배포하고, 향상된 예측을 실시간으로 수신하는 방법을 보여줍니다.
-
그래프 기반 신용 점수 평가
신용 등급은 일반적으로 재무제표 데이터 및 시장 데이터를 이용하는 모델을 사용하여 생성됩니다. 이러한 데이터는 표 형식(숫자 및 범주로 구성됨)으로만 제공됩니다. 이 솔루션은 SEC 자료
참고
이 솔루션 노트북은 시연용일 뿐입니다. 이들 자료를 금융 또는 투자 조언으로 삼아서는 안 됩니다.
해당 금융 서비스 솔루션은 Studio Classic의 SageMaker JumpStart 페이지에서 확인할 수 있습니다.
중요
2023년 11월 30일부터 이전 Amazon SageMaker Studio 환경이 이제 Amazon SageMaker Studio Classic으로 명명되었습니다. 다음 섹션은 Studio Classic 애플리케이션 사용에 관해 다룹니다. 업데이트된 Studio 환경 사용에 대한 자세한 내용은 Amazon SageMaker Studio 섹션을 참조하세요.
참고
SageMaker AI JumpStart Industry: Financial 솔루션, 모델 카드 및 예제 노트북은 SageMaker Studio Classic을 통해서만 호스팅되고 실행 가능합니다. SageMaker AI 콘솔
Amazon SageMaker AI JumpStart Industry: 금융 모델
SageMaker AI JumpStart Industry: Financial은 다음과 같은 사전 훈련된 강력한 최적화 BERT 접근 방식(RoBERTa)
-
금융 텍스트 임베딩(RoBERTa-SEC-Base)
-
RoBERTa-SEC-WIKI-Base
-
RoBERTa-SEC-Large
-
RoBERTa-SEC-WIKI-Large
RoBERTa-SEC-Base 모델 및 RoBERTa-SEC-Large 모델은 GluonNLP의 RoBERTa 모델
이들 모델은 SageMaker JumpStart에서 텍스트 모델 노드로 이동하여 모든 텍스트 모델 탐색을 선택한 다음, ML 작업에 대해 텍스트 임베딩을 필터링하면 찾을 수 있습니다. 원하는 모델을 선택한 후 해당하는 노트북에 액세스하면 됩니다. 페어링된 노트북에서는 SageMaker JumpStart Industry Python SDK로 개선된 다중 모달 데이터세트를 이용한 특정 분류 작업에 맞게 사전 훈련 모델을 미세 조정하는 방법을 안내합니다.
참고
이 모델 노트북은 시연용일 뿐입니다. 이들 자료를 금융 또는 투자 조언으로 삼아서는 안 됩니다.
다음 스크린샷은 Studio Classic의 SageMaker AI JumpStart 페이지를 통해 제공되는 사전 훈련된 모델 카드를 보여줍니다.

참고
SageMaker AI JumpStart Industry: Financial 솔루션, 모델 카드 및 예제 노트북은 SageMaker Studio Classic을 통해서만 호스팅되고 실행 가능합니다. SageMaker AI 콘솔
Amazon SageMaker AI JumpStart Industry: 재무 예제 노트북
SageMaker AI JumpStart Industry: Financial은 업계 중심 ML 문제에 대한 솔루션을 시연하기 위해 다음 예제 노트북을 제공합니다.
-
Financial TabText 데이터 구성 - 이 예제에서는 SageMaker JumpStart Industry Python SDK를 사용하여 SEC 자료(예: NLP 점수 유형 및 해당 단어 목록을 기준으로 한 텍스트 요약과 점수 평가 텍스트)를 처리하는 방법을 소개합니다. 이 노트북의 내용을 미리 보려면 SEC 자료 및 NLP 점수를 이용한 간단한 다중 모달 데이터세트 구성
을 참조하세요. -
TabText 데이터를 이용한 다중 모달 ML - 이 예제에서는 다양한 유형의 데이터세트를 TabText라는 단일 데이터 프레임으로 병합하고 다중 모달 ML을 수행하는 방법을 보여줍니다. 이 노트북의 내용을 미리 보려면 TabText 데이터 프레임을 이용한 기계 학습 – 급여 보호 프로그램 기반 예제
를 참조하세요. -
SEC 자료 데이터를 이용한 다중 범주 ML – 이 예제에서는 멀티클래스 분류 작업을 위해 SEC 자료에서 엄선한 다중 모달(TabText) 데이터세트로 AutoGluon NLP 모델을 훈련시키는 방법을 보여줍니다. MDNA 텍스트 열의 업종 코드에 따라 SEC 10K/Q 자료를 분류하세요
.
참고
이 예제 노트북은 시연용일 뿐입니다. 이들 자료를 금융 또는 투자 조언으로 삼아서는 안 됩니다.
참고
SageMaker AI JumpStart Industry: Financial 솔루션, 모델 카드 및 예제 노트북은 SageMaker Studio Classic을 통해서만 호스팅되고 실행 가능합니다. SageMaker AI 콘솔
해당 예제 노트북의 내용을 미리 보려면 SageMaker JumpStart Industry Python SDK 설명서의 튜토리얼 - 금융
Amazon SageMaker AI JumpStart Industry: 금융 블로그 게시물
SageMaker AI JumpStart Industry 사용의 철저한 애플리케이션: 금융 솔루션, 모델, 예제 및 SDK는 다음 블로그 게시물을 참조하세요.
Amazon SageMaker AI JumpStart Industry: 금융 관련 연구
SageMaker AI JumpStart Industry: Financial 솔루션과 관련된 연구에 대해서는 다음 문서를 참조하세요.
Amazon SageMaker AI JumpStart Industry: 금융 추가 리소스
추가 설명서 및 튜토리얼은 다음 리소스를 참조하세요.