Amazon SageMaker Partner AI App 개요

Amazon SageMaker Partner AI App을 사용하면 사용자는 업계 최고의 애플리케이션 제공업체가 구축, 게시 및 배포한 생성형 AI 및 기계 학습(ML) 개발 애플리케이션에 액세스할 수 있습니다. Partner AI App은 SageMaker AI에서 실행되도록 인증되었습니다. Partner AI App을 사용하면 사용자는 민감한 데이터의 보안을 침해하지 않고 파운데이션 모델(FM) 및 클래식 ML 모델을 기반으로 솔루션을 구축하는 방법을 가속화하고 개선할 수 있습니다. 데이터는 신뢰할 수 있는 보안 구성 내에 완전히 유지되며 제3자와 공유되지 않습니다.

작동 방식

Partner AI App은 Amazon Elastic Kubernetes Service 클러스터를 포함하는 전체 애플리케이션 스택과 Application Load Balancer, Amazon Relational Database Service, Amazon Simple Storage Service 버킷, Amazon Simple Queue Service 대기열 및 Redis 캐시를 포함할 수 있는 동반 제공되는 서비스 배열입니다.

이러한 서비스 애플리케이션은 SageMaker AI 도메인의 모든 사용자 간에 공유할 수 있으며 관리자가 프로비저닝합니다. 를 통해 구독을 구매하여 애플리케이션을 프로비저닝한 후 AWS Marketplace관리자는 SageMaker AI 도메인의 사용자에게 Amazon SageMaker Studio, Amazon SageMaker Unified Studio(미리 보기)에서 직접 파트너 AI 앱에 액세스할 수 있는 권한을 부여하거나 미리 서명된 URL을 사용할 수 있습니다. Amazon SageMaker Studio에서 애플리케이션을 시작하는 방법에 대한 자세한 내용은 Amazon SageMaker Studio 출시 섹션을 참조하세요.

Partner AI App은 관리자와 사용자에게 다음과 같은 이점을 제공합니다.

관리자는 SageMaker AI 콘솔을 사용하여 데이터 과학 및 ML 팀이 사용할 Partner AI App을 검색, 선택 및 프로비저닝합니다. 파트너 AI 앱이 배포되면 SageMaker AI는 서비스 관리형에서 이를 실행합니다 AWS 계정. 이렇게 하면 이러한 애플리케이션 구축 및 운영과 관련된 운영 오버헤드가 크게 줄어들고 고객 데이터의 보안 및 개인 정보 보호에 기여할 수 있습니다.
데이터 과학자와 ML 개발자는 Amazon SageMaker Studio 또는 Amazon SageMaker Unified Studio(미리 보기)의 ML 개발 환경 내에서 Partner AI App에 액세스할 수 있습니다. Partner AI App을 사용하여 SageMaker AI에서 생성된 데이터, 실험 및 모델을 분석할 수 있습니다. 이렇게 하면 컨텍스트 전환을 최소화하고 파운데이션 모델 구축을 가속화하고 새로운 생성형 AI 기능을 출시하는 데 도움이 됩니다.

와 통합 AWS 서비스

파트너 AI 앱은 권한 부여 및 인증을 위해 기존 AWS Identity and Access Management (IAM) 구성을 사용합니다. 따라서 사용자는 Amazon SageMaker Studio에서 각 Partner AI App에 액세스하기 위해 별도의 자격 증명을 제공할 필요가 없습니다. Partner AI App에서의 권한 부여와 인증에 대한 자세한 내용은 Partner AI App 설정 섹션을 참조하세요.

파트너 AI 앱은와 통합되어 운영 모니터링 및 관리를 Amazon CloudWatch 제공합니다. 고객은 Partner AI App을 탐색하고 AWS Management Console에서 기능, 고객 경험, 요금과 같은 세부 정보도 얻을 수 있습니다. 에 대한 자세한 내용은 Amazon CloudWatch 작동 방식을 Amazon CloudWatch참조하세요.

Deepchecks와 같은 파트너 AI 애플리케이션은 Amazon Bedrock과의 통합을 지원하여 "판사로서의 LLM" 평가 및 자동 주석 기능과 같은 LLM 기반 평가 기능을 활성화합니다. Amazon Bedrock 통합이 활성화되면 파트너 AI 앱은 고객 관리형 Amazon Bedrock 계정을 사용하여 파운데이션 모델에 액세스하여 데이터가 신뢰할 수 있는 보안 구성 내에 유지되도록 합니다. Amazon Bedrock 통합 구성에 대한 자세한 내용은 섹션을 참조하세요Amazon Bedrock 통합 구성.

지원되는 유형

Partner AI App은 다음 유형을 지원합니다.

Comet
Deepchecks
Fiddler
Lakera Guard

관리자가 Partner AI App을 시작할 때 Partner AI App 시작에 함께 사용되는 인스턴스 클러스터의 구성을 선택해야 합니다. 이 구성을 Partner AI App의 티어라고 합니다. Partner AI App의 티어는 다음 값 중 하나일 수 있습니다.

small
medium
large

다음 섹션에서는 각 Partner AI App 유형에 대한 정보와 Partner AI App의 티어 값에 대한 세부 정보를 제공합니다.

Comet은 LLM 평가, 실험 추적 및 프로덕션 모니터링 기능과 함께 AI 개발자에게 엔드투엔드 모델 평가 플랫폼을 제공합니다.

워크로드에 따라 다음과 같은 Partner AI App 티어를 사용하는 것이 좋습니다.

small - 최대 5명의 사용자와 20개의 실행 중인 작업에 권장됩니다.
medium - 최대 50명의 사용자와 100개의 실행 중인 작업에 권장됩니다.
large - 최대 500명의 사용자와 100개 이상의 실행 중인 작업에 권장됩니다.

참고

SageMaker AI는 Jupyter Notebook 출력의 일부로 Comet UI를 보는 것을 지원하지 않습니다.

AI 애플리케이션 개발자와 이해관계자는 Deepchecks를 사용하여 배포 전 및 내부 실험부터 프로덕션에 이르기까지 전체 수명 주기 동안 특성, 성능 지표 및 잠재적 위험 등 LLM 기반 애플리케이션을 지속적으로 검증할 수 있습니다.

워크로드에 필요한 속도를 기반으로 다음 Partner AI App 티어를 사용하는 것이 좋습니다.

small - 초당 200개의 토큰을 처리합니다.
medium - 초당 500개의 토큰을 처리합니다.
large - 초당 1,300개의 토큰을 처리합니다.

Fiddler AI Observability Platform은 테이블 형식, 딥 러닝, 컴퓨터 비전, 자연어 처리 모델을 포함하여 프로덕션 환경에서 ML 모델의 검증, 모니터링 및 분석을 용이하게 합니다.

워크로드에 필요한 속도를 기반으로 다음 Partner AI App 티어를 사용하는 것이 좋습니다.

small - 5개의 모델, 100개의 특성 및 20개의 반복에서 1,000만 개의 이벤트를 처리하는 데 약 53분이 걸립니다.
medium - 5개의 모델, 100개의 특성 및 20개의 반복에서 1,000만 개의 이벤트를 처리하는 데 약 23분이 걸립니다.
large - 5개의 모델, 100개의 특성 및 100개의 반복에서 1,000만 개의 이벤트를 처리하는 데 약 27분이 걸립니다.

Lakera Guard는 생성형 AI 애플리케이션을 생성형 AI 관련 위협으로부터 보호하기 위한 지연 시간이 짧은 AI 애플리케이션 방화벽입니다.

워크로드에 따라 다음과 같은 Partner AI App 티어를 사용하는 것이 좋습니다.

small - 최대 20개의 로봇 프로세스 자동화(RPA)에 권장됩니다.
medium - 최대 100개의 RPA에 권장됩니다.
large - 최대 200개의 RPA에 권장됩니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

사용자 지정

Partner AI App 설정