View a markdown version of this page

API 호환성 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

API 호환성

Amazon Bedrock은 각각 서로 다른 통합 패턴 및 사용 사례에 맞게 설계된 4가지 런타임 APIs 지원합니다.

패밀리 호출:는 동기식 단일 응답 호출을 InvokeModel 처리합니다.는 응답을 실시간 스트림으로 InvokeModelWithResponseStream 반환합니다.는 대화형 애플리케이션에 대해 전이중 스트리밍을 InvokeModelWithBidirectionalStream 활성화합니다.는 장기 실행 요청을 비동기적으로 AsyncInvoke 제출하고 출력을 Amazon S3에 저장합니다.

Converse family: Converse는 동기식 멀티턴 대화를 위한 모델에 구애받지 않는 통합 인터페이스를 제공합니다. ConverseStream는 스트리밍 출력과 동일한 경험을 제공합니다.

OpenAI 호환 패밀리:는 OpenAI Chat Completions 인터페이스를 ChatCompletions 구현하여 변경 사항을 최소화하면서 Bedrock에서 기존 OpenAI 기반 통합을 실행할 수 있습니다. Responses API는 OpenAI 응답 인터페이스를 구현하여 기본 제공 도구 사용 및 대화 기록 관리를 통한 상태 저장 에이전트 상호 작용을 지원합니다.

메시지 패밀리:는 bedrock-mantle 엔드포인트에서 Anthropic Messages 인터페이스를 Messages 구현하여 변경 사항을 최소화하면서 기존 Anthropic SDK 기반 통합을 Bedrock에서 실행할 수 있습니다.

이제 각 모델에서 지원하는 APIs 목록을 살펴보겠습니다.

AI21

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
Jamba 1.5 Large*
Jamba 1.5 Mini*

Amazon

Anthropic

Cohere

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
Command R*
Command R+*
Embed English
Embed Multilingual
임베드 v4
Rerank 3.5

DeepSeek

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

달샷

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
김기 K2 Thinking*
키미 K2.5*

NVIDIA

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 슈퍼 120B*

OpenAI

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
GPT OSS 보호 120B*
GPT OSS 보호 20B*
gpt-oss-120b*
gpt-oss-20b*

쿠엔

안정성

TwelveLabs

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
Marengo 임베드 3.0
Marengo 임베드 v2.7
Pegasus v1.2

라이터

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
팔미라 비전 7B
Palmyra X4*
Palmyra X5*

Z.AI

모델 이름 간접 호출 Converse 채팅 완료 응답 메시지
GLM 4.7*
GLM 4.7 플래시*
GLM 5*
참고

* 스트리밍 지원: 별표(*)로 표시된 모델은 응답을 실시간 스트림으로 반환InvokeModelWithResponseStream하는 도 지원합니다.

StartAsyncInvoke를 지원하는 모델

StartAsyncInvoke는 호출자가 모델 호출 요청을 제출하고 모델 처리가 완료될 때까지 기다리지 않고 즉시 invocationArn을 다시 수신할 수 있는 Amazon Bedrock 런타임 API입니다. 작업은 백그라운드에서 실행되며, 출력은 완료되면 호출자가 지정한 S3 버킷에 기록됩니다. 그런 다음 호출자는 컴패니언 GetAsyncInvoke 및 ListAsyncInvokes APIs. 이 패턴은 대규모 또는 지연 시간에 민감하지 않은 입력, 특히 비디오, 오디오 및 대량 임베딩 생성과 관련된 워크로드를 위해 특별히 구축되었으며,이 경우 개방형 동기 연결을 유지하는 것은 실용적이지 않습니다.

이를 지원하는 모델 측면에서 다음 모델은 StartAsyncInvoke를 지원합니다.

  • TwelveLabs Marengo 임베드 2.7(twelvelabs.marengo-embed-2-7-v1:0) - 비디오 및 오디오 입력에 필요합니다. InvokeModel은 텍스트 및 이미지만 처리합니다.

  • TwelveLabs Marengo Embed 3.0(twelvelabs.marengo-embed-3-0-v1:0) - 동일한 패턴, 대규모 비디오/오디오에 필요한 비동기화

  • Amazon Nova Reel(amazon.nova-reel-v1:0 및 v1:1) - 비디오 생성은 전적으로 비동기식이며 출력은 S3에 있습니다.

  • Amazon Nova Multimodal Embeddings(amazon.nova-2-multimodal-embeddings-v1:0) - 25MB base64 인코딩보다 큰 비디오 입력에는 비동기화가 필요하며 텍스트, 이미지 및 문서 입력에는 동기화를 사용할 수 있습니다.

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStream는 호출자와 모델 간에 영구 전이중 채널을 설정하여 오디오 데이터가 양방향으로 동시에 연속적으로 흐를 수 있도록 하는 Amazon Bedrock 런타임 API입니다. request-then-response 패턴을 따르는 표준 InvokeModel 또는 InvokeModelWithResponseStream APIs와 달리이 API는 세션 기간 동안 연결을 열어 두어 모델이 수신 오디오가 도착할 때 이를 처리하고 생성된 스피치를 거의 실시간으로 스트리밍할 수 있도록 하며, 완전한 발화가 완료될 때까지 기다리지 않습니다. 상호 작용은 세 단계로 구성됩니다. 세션 초기화(클라이언트가 스트림을 설정하기 위해 구성 이벤트를 보내는 경우), 오디오 스트리밍(캡처된 오디오가 인코딩되고 연속 이벤트 스트림으로 전송되는 경우) 및 응답 스트리밍(모델이 사용자 스피치 및 합성된 오디오 출력의 텍스트 트랜스크립션을 동시에 반환하는 경우).는 Amazon Bedrock API 키와 함께 사용할 수 InvokeModelWithBidirectionalStream 없으며 다른 Bedrock 런타임 작업에 비해 더 복잡한 세션 수명 주기를 반영하는 표준 AWS 자격 증명 기반 인증이 필요합니다.

다음 모델은이 API를 지원합니다.

  • Amazon Nova Sonic 패밀리: amazon.nova-sonic-v1:0 및 amazon.nova-2-sonic-v1:0은 모두 이를 유일한 호출 경로로 사용합니다. speech-to-speech 아키텍처에는 기본적으로 InvokeModel과 Converse가 제공할 수 없는 라이브 양방향 채널이 필요하기 때문입니다.