

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pemahaman dokumen
<a name="modalities-document"></a>

**catatan**  
Dokumentasi ini untuk Amazon Nova Versi 1. Untuk panduan pemahaman dokumen Amazon Nova 2, kunjungi [Pemahaman dokumen](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html#document-understanding).

Kemampuan pemahaman dokumen Amazon Nova memungkinkan Anda untuk memasukkan seluruh dokumen (PDFs, file Word, spreadsheet, dll.) Dalam prompt Anda dan mengajukan pertanyaan atau permintaan tentang konten mereka. Model pemahaman multimodal Nova (Lite, Pro, Premier) dapat menafsirkan teks dan elemen visual (seperti bagan atau tabel) dalam dokumen-dokumen ini. Ini memungkinkan kasus penggunaan seperti menjawab pertanyaan, meringkas, dan analisis laporan panjang atau dokumen yang dipindai. Fitur utama termasuk jendela konteks yang sangat besar (1-2M token) untuk dokumen panjang dan kemampuan untuk menangani beberapa dokumen dalam satu kueri. 

Amazon Nova membedakan antara dua jenis input dokumen:
+ **Jenis dokumen berbasis teks** (misalnya TXT, CSV, Markdown, HTML, DOC): Ini diproses terutama untuk konten tekstualnya. Nova akan fokus pada pemahaman dan penggalian informasi dari teks dalam dokumen-dokumen ini. 
+ **Jenis dokumen berbasis media** (misalnya PDF, DOCX): File-file ini mungkin berisi tata letak kompleks, gambar, bagan, atau grafik tertanam. Untuk dokumen berbasis media, Nova memproses elemen visual dan tekstual. Nova menggunakan pemahaman berbasis visi untuk menafsirkan konten visual — seperti bagan, tabel, diagram, atau tangkapan layar — di samping teks dokumen.

  JPEG2000 dan JBIG2 tidak didukung dalam file PDF di Amazon Nova.

Format file yang didukung mencakup jenis dokumen umum: teks biasa dan file teks terstruktur (CSV, TXT), spreadsheet (XLS/XLSX), HTML/Markdown, Word documents (DOC/DOCX), dan file PDF. Untuk gambar dalam dokumen, format gambar standar (PNG, JPG, GIF, WebP) ditangani, meskipun PDFs mengandung pengkodean gambar tertentu (CYMK, SVG) tidak didukung. 


**Batas Ukuran Dokumen dan Pedoman Penggunaan**  

| Kendala | Kuota | 
| --- | --- | 
|  Jumlah dokumen maksimum  |  Hingga 5 dokumen per permintaan (berlaku untuk upload langsung dan Amazon S3)  | 
|  Ukuran dokumen berbasis teks  |  Setiap dokumen teks (mis., .txt, .csv, .md, .html, .doc) harus ≤ 4,5 MB  | 
|  Ukuran dokumen berbasis media  |  Untuk file.pdf dan.docx, tidak ada batasan ukuran file individual, tetapi: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/nova/latest/userguide/modalities-document.html)  | 
|  Konten PDF yang tidak didukung  |  PDFs yang berisi profil warna CMYK atau gambar SVG tidak didukung  | 

# Menggunakan Pemahaman Dokumen Nova melalui API
<a name="modalities-document-examples"></a>

Untuk mengilustrasikan cara menggunakan Amazon Nova untuk dokumen QA (Question-Answering) atau analisis, berikut adalah contoh sederhana dalam Python. Kami akan menggunakan API AWS Bedrock (melalui Boto3 SDK) untuk mengirim dokumen PDF bersama dengan pertanyaan untuk dijawab model.

```
            
import base64
import base64
import json
import boto3

# Initialize Bedrock runtime client (adjust region as needed)
client = boto3.client("bedrock-runtime", region_name="us-east-1")

MODEL_ID = "us.amazon.nova-lite-v1:5"  # using Nova Lite model in this example

# Read the document file (PDF) in binary mode
with open("my_document.pdf", "rb") as file:
    doc_bytes = file.read()

# Construct the conversation messages with document + question
messages = [
    {
        "role": "user",
        "content": [
            {
                "document": {
                    "format": "pdf",
                    "name": "Document1",  # neutral name for the document
                    "source": {
                        "bytes": doc_bytes  # embedding the PDF content directly
                    }
                }
            },
            {
                "text": "Here is a question about the document: ... (your question) ... ?"
            }
        ]
    }
]

# Set inference parameters (optional)
inf_params = {"maxTokens": 4000, "topP": 0.1, "temperature": 0.3}

# Invoke the model
response = client.converse(modelId=MODEL_ID, messages=messages, inferenceConfig=inf_params)

# Extract and print the answer
answer_text = response["output"]["message"]["content"][0]["text"]
print(answer_text)
```

Jika file input Anda besar (melebihi batas unggah langsung 25 MB) atau Anda memiliki banyak file, Anda dapat menyimpannya di Amazon S3 dan mereferensikannya. Ini menghindari pengiriman byte mentah melalui permintaan. Saat menggunakan S3, pastikan layanan Bedrock memiliki izin untuk mengakses ember/objek. Misalnya, untuk mereferensikan PDF di S3, sumber dokumen Anda akan menggunakan “S3location” alih-alih “byte”, seperti:

```
messages = [
    {
        "role": "user",
        "content": [
            {
                "document": {
                    "format": "pdf",
                    "name": "Report2023",
                    "source": {
                        "s3Location": {
                            "uri": "s3://your-bucket/path/to/document1.pdf",
                            "bucketOwner": "123456789012"
                        }
                    }
                }
            },
            {
                "text": "Summarize the key findings from the Q3 2023 report."
            }
        ]
    }
]
```

**catatan**  
Nama dokumen hanya dapat mencakup karakter alfanumerik, tanda hubung, tanda kurung, dan tanda kurung siku.  
`name`Bidang ini rentan terhadap suntikan cepat, karena model mungkin secara tidak sengaja menafsirkannya sebagai instruksi. Oleh karena itu, kami menyarankan Anda menentukan nama netral.