

# 動画理解
<a name="modalities-video"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 動画理解ガイドについては、「[動画の理解](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html#video-understanding)」を参照してください。

Amazon Nova モデルでは、ペイロードに 1 つの動画を含めることができます。base64 形式または Amazon S3 URI を介して提供できます。base64 方法を使用する際、全体的なペイロードサイズは 25 MB 以内である必要があります。ただし、動画理解には Amazon S3 URI を指定できます。ペイロード全体のサイズ制限に制約されることなく、この手法は長い動画 (最大 1 GB のサイズ) にモデルを活用できるようにします。Amazon Nova モデルは、提供された指示に基づいて渡された動画を分析して質問の回答、動画の分類、動画内の情報の要約ができます。


| メディアファイルタイプ | サポートされるファイル形式 | **入力方法** | 
| --- |--- |--- |
| 動画 | MP4、MOV、MKV、WebM、FLV、MPEG、MPG、WMV、3GP | Base64 *25 MB 未満のペイロードサイズに推奨* | 
|  |  | Amazon S3 URI *最大 2 GB の 25 MB を超えるペイロードに推奨 個々のファイルは 1 GB 以下である必要があります。* | 

動画が base-64 (サイズ制約に適合する限り) として渡されるか、Amazon S3 ロケーションを介して渡されるかを問わず、動画入力トークン数に違いはありません。

3GP ファイル形式の場合、API リクエストで渡される「format」フィールドは「three\$1gp」の形式である必要があることに注意してください。

Amazon S3 を使用する際、「コンテンツタイプ」メタデータが動画の正しい MIME タイプに設定されていることを確認してください。

## 動画サイズの情報
<a name="modalities-video-size"></a>

Amazon Nova の動画理解機能は、マルチアスペクト比をサポートしています。すべての動画は、モデルにフィードする前にゆがみ (入力に基づいて上下方向) がある **672 x 672 平方**のディメンションにサイズ調整されます。モデルは、動画の長さに基づいて動的サンプリング戦略を使用します。Amazon Nova Lite と Amazon Nova Pro の場合、再生時間が 16 分以下の動画には、1 秒あたり 1 フレーム (FPS) のサンプリングレートが適用されます。ただし、長さが 16 分を超える動画の場合、サンプリングされたフレームを一貫して 960 フレームに維持するためにサンプリングレートが低下し、それに応じてフレームサンプリングレートが異なります。この手法は、長い動画コンテンツと比較して短い動画において、より正確なシーンレベルの動画理解を実現するために開発されています。動画の長さは、低モーションの場合は 1 時間未満、高モーションの場合は 16 分未満にすることをお勧めします。Amazon Nova Premier では、1 FPS サンプリングレートが最大 3,200 フレームまで適用されます。

動画の 4K バージョンおよびフル HD バージョンを分析する際に違いはありません。同様に、サンプリングレートは最大 1 FPS であるため、60 FPS 動画も 30 FPS 動画も結果に違いはありません。動画サイズに 1 GB の制限があるため、必要以上の解像度および FPS を使用することは有益ではなく、そのサイズ制限に収まる動画の長さに制限されます。1 GB を超える動画は、事前処理することをお勧めします。

## 動画トークン
<a name="modalities-video-tokens"></a>

動画の長さは生成されるトークン数に影響する主な要因です。おおよそのコストを計算するには、動画トークンの概算数に、使用されている特定モデルのトークンあたりの価格を掛けてください。

次の表は、Amazon Nova Pro、Lite、Micro の動画の長さあたりのフレームサンプリングとトークン使用率の概算を示します。


| video\$1duration | 10 秒 | 30 秒 | 16 分 | 20 分 | 30 分 | 45 分 | 1 時間 | 1.5 時間 | 
| --- |--- |--- |--- |--- |--- |--- |--- |--- |
| frames\$1to\$1sample | 10 | 30 | 960 | 960 | 960 | 960 | 960 | 960 | 
| sample\$1rate\$1fps | 1 | 1 | 1 | 0.755 | 0.5 | 0.35556 | 0.14 | 0.096 | 
| 推定トークン数 | 2,880 | 8,640 | 276,480 | 276,480 | 276,480 | 276,480 | 276,480 | 276,480 | 

次の表は、Amazon Nova Premier の動画の長さあたりのフレームサンプリングとトークン使用率の概算を示します。


| video\$1duration | 10 秒 | 30 秒 | 16 分 | 20 分 | 30 分 | 45 分 | 1 時間 | 1.5 時間 | 
| --- |--- |--- |--- |--- |--- |--- |--- |--- |
| frames\$1to\$1sample | 10 | 30 | 960 | 1200 | 1800 | 2700 |  |  | 
| sample\$1rate\$1fps | 1 | 1 | 1 | 1 | 1 | 1 |  |  | 
| 推定トークン数 | 2,880 | 8,640 | 276,480 | 345,600 | 518,400 | 777,600 |  |  | 

次の表は、Amazon Nova Lite 1.5 の動画の長さあたりのフレームサンプリングとトークン使用率の概算を示します。


| video\$1duration | 10 秒 | 30 秒 | 16 分 | 20 分 | 30 分 | 45 分 | 1 時間 | 1.5 時間 | 
| --- |--- |--- |--- |--- |--- |--- |--- |--- |
| frames\$1to\$1sample | 10 | 30 | 960 | 1200 | 1800 | 2700 |  |  | 
| sample\$1rate\$1fps | 1 | 1 | 1 | 1 | 1 | 1 |  |  | 
| 推定トークン数 | 2,880 | 8,640 | 276,480 | 345,600 | 518,400 | 777,600 |  |  | 