Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erweitertes Denken in Amazon Nova 2
Amazon Nova 2 Lite bietet erweiterte Denkfunktionen, die es dem Modell ermöglichen, bei komplexen Problemen tiefer zu denken. Diese optionale Funktion gibt Ihnen die Kontrolle darüber, wann und wie das Modell zusätzliche Rechenressourcen zuweist, um schwierige Aufgaben zu bewältigen.
So funktioniert erweitertes Denken
Amazon Nova 2 führt erweitertes Denken als Hybridfunktion ein. Sie haben die vollständige Kontrolle:
-
Erweitertes Denken AUS (Standard): Amazon Nova 2 arbeitet mit effizientem latentem Denken, das sich optimal für alltägliche Aufgaben und umfangreiche Anwendungen eignet.
-
Erweitertes Denken AKTIVIERT: Amazon Nova 2 bietet explizite step-by-step Argumentation, die sich am besten für komplexe Probleme eignet, die eine gründliche Analyse erfordern.
Bemühen um Argumentation
Im Folgenden werden verschiedene Ebenen des Argumentationsaufwands dargestellt.
Geringer Aufwand (maxReasoningEffort: „gering“)
Ideal für: Aufgaben mit erhöhter Komplexität, die strukturiertes Denken erfordern. Sie können dies beispielsweise für Codeüberprüfungen und Verbesserungsvorschläge verwenden, bei denen das Modell die vorhandene Codequalität sorgfältig berücksichtigen muss, für Analyseaufgaben, die eine sorgfältige Berücksichtigung mehrerer Faktoren erfordern, oder für Problemlösungsszenarien, die von einem methodischen Ansatz profitieren. Ein geringer Aufwand ist ideal für komplexe Aufgaben, bei denen grundlegende Überlegungen die Genauigkeit verbessern, ohne dass eine gründliche Planung in mehreren Schritten erforderlich ist.
Mittlerer Aufwand (maxReasoningEffort: „mittel“)
Am besten geeignet für: Mehrstufige Aufgaben und Codierungsworkflows. Sie können dies beispielsweise für Softwareentwicklung und Debugging verwenden, bei denen das Modell die bestehende Codestruktur verstehen muss, bevor Änderungen implementiert werden, für die Codegenerierung, die die Koordination mehrerer Dateien oder Komponenten erfordert, für mehrstufige Berechnungen mit gegenseitigen Abhängigkeiten oder für Planungsaufgaben mit mehreren Einschränkungen. Ein mittlerer Aufwand ist optimal für agentische Workflows, die mehrere Tools koordinieren und erfordern, dass das Modell den Kontext mehrerer sequentieller Operationen beibehält.
Hoher Aufwand (maxReasoningEffort: „hoch“)
Am besten geeignet für: STEM-Argumentation und fortgeschrittene Problemlösung. Sie können dies beispielsweise für fortgeschrittene mathematische Probleme und Beweise verwenden, die eine strenge step-by-step Überprüfung erfordern, für wissenschaftliche Analysen und Forschungsaufgaben, die gründliche Untersuchungen erfordern, für ein komplexes Systemdesign mit architektonischen Überlegungen über mehrere Dimensionen oder für kritische Entscheidungsszenarien mit erheblichen Auswirkungen. Ein hoher Aufwand sorgt für maximale Genauigkeit bei Aufgaben, die eine ausgeklügelte Argumentation, eine sorgfältige Bewertung von Alternativen und eine gründliche Validierung der Schlussfolgerungen erfordern.
Schnellstart: Erweitertes Denken ermöglichen
Erweitertes Denken wird durch den reasoningConfig Parameter gesteuert.
import boto3 bedrock = boto3.client('bedrock-runtime', region_name='us-east-1') response = bedrock.converse( modelId='us.amazon.nova-2-lite-v1:0', system=[{"text": "You are a highly capable personal assistant"}], messages=[{ "role": "user", "content": [{"text": "Provide a meal plan for a gluten free family of 4."}] }], inferenceConfig={ "temperature": 0.7, "topP": 0.9, "maxTokens": 10000 }, additionalModelRequestFields={ "reasoningConfig": { "type": "enabled", "maxReasoningEffort": "low" } } ) content_list = response["output"]["message"]["content"] for item in content_list: if "reasoningContent" in item: reasoning_text = item["reasoningContent"]["reasoningText"]["text"] print("=== REASONING ===") print(reasoning_text) print() elif "text" in item: print("=== ANSWER ===") print(item["text"])
Argumentationsparameter:
-
type: enabledoderdisabled(Standard:disabled) -
maxReasoningEffort:low,medium, oderhigh
Anmerkung
Temperature, TopP und TopK können nicht zusammen mit der maxReasoningEffort Einstellung auf verwendet werden. high Wenn diese Parameter zusammen verwendet werden, tritt ein Fehler auf.
Vollständige Beispiele für Code, der erweitertes Denken nutzt, finden Sie unterCode-Bibliothek.
Struktur der Antwort
Wenn Sie „Erweitertes Denken“ aktivieren, bestehen die Antworten aus reasoningContent Blöcken, gefolgt von text Inhaltsblöcken:
{ "output": { "message": { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "[REDACTED]" } } }, { "text": "Based on the premises, we can conclude..." } ] } }, "stopReason": "end_turn" }
Anmerkung
Bei Amazon Nova 2 werden Argumentationsinhalte als [REDACTED] angezeigt. Für Argumentations-Tokens fallen weiterhin Gebühren an, da sie zu einer verbesserten Ausgabequalität beitragen. Wir nehmen dieses Feld jetzt in die Antwortstruktur auf, um die Möglichkeit zu wahren, in future Argumentationsinhalte offenzulegen. Wir arbeiten aktiv mit unseren Kunden zusammen, um herauszufinden, wie der Argumentationsprozess des Modells am besten dargestellt werden kann. Der Inhalt der Argumentation wird als angezeigt. [REDACTED] Für Argumentations-Tokens fallen weiterhin Gebühren an, da diese zur Verbesserung der Antwortqualität beitragen.
Konfigurationsoptionen
Amazon Nova 2 führt einen neuen reasoningConfig Parameter ein, den Sie zu Ihrer bestehenden Konversationsanforderungsstruktur hinzufügen können, um Argumentation zu ermöglichen:
additionalModelRequestFields={ "reasoningConfig": { "type": "enabled", # or "disabled" (default) "maxReasoningEffort": "high" # "low", "medium", or "high" } }
Parameter:
-
Typ: Zwischen
"enabled"und umschalten"disabled"(Standard ist)"disabled" -
maxReasoningEffort: Wenn diese Option aktiviert ist, können Sie die Tiefe des Denkens steuern -
„niedrig“: Mäßig komplexe Aufgaben
-
„mittel“: Komplexe Probleme, die eine eingehende Analyse erfordern
-
„hoch“: Gründlichste Argumentation für hochkomplexe Aufgaben
Anmerkung
Bei der Verwendung "high" müssen temp, toPP und maxToken nicht gesetzt sein. In diesem Modus führt das Modell eine tiefere Analyse durch, um die beste Lösung zu finden. Diese gründlichere Verarbeitung kann zu einer Ausgabe von mehr als 65.000 Token führen. Die genaue Menge hängt von der Komplexität Ihrer Anfrage ab. Bei einigen Problemen haben wir jedoch festgestellt, dass es bis zu 128.000 Token sind. Dadurch wird sichergestellt, dass Sie eine vollständige und qualitativ hochwertige Argumentation erhalten und keine verkürzten Ergebnisse erhalten.
Unterstützte Modelle
Extended Thinking ist derzeit verfügbar in: Amazon Nova 2 Lite (us.amazon.nova-2-lite-v 1:0)
Erweitertes Denken mit der Verwendung des Tools
Extended Thinking funktioniert problemlos mit dem Aufrufen von Tools, sodass Amazon Nova überlegen kann, welche Tools verwendet werden sollen und wie ihre Ergebnisse zu interpretieren sind.
Grundlegendes zu Argumentation, Tokens und Preisgestaltung
Token-Typen
Token für erweitertes Denken werden als Output-Token abgerechnet:
-
Eingabe-Token: Ihr ursprünglicher Anforderungsinhalt (Standardpreis für Eingaben)
-
Ausgabetokens: Dazu gehören Begründungstoken und der endgültige sichtbare Inhalt der Antwort (Standardpreise für die Ausgabe)
Aufschlüsselung der Nutzung
Alle drei Tokentypen sind in Ihren Nutzungsmetriken und in der Abrechnung enthalten. Argumentations-Tokens haben denselben Preis wie Ausgabetokens und werden in der Modellantwort als „REDACTED“ angezeigt.
{ "usage": { "inputTokens": 45, "outputTokens": 1240, "totalTokens": 1285 } }
Häufig gestellte Fragen
- Warum zeigt Amazon Nova 2 Lite „[REDACTED]“ als Argumentationsinhalt an, anstatt den Denkprozess des Modells darzustellen?
-
Unser Hauptaugenmerk bei dieser Markteinführung liegt darauf, sicherzustellen, dass Nova 2 erstklassige Informationen für Ihre Aufgaben bietet, und Sie werden sehen, dass sich dies in der verbesserten Genauigkeit widerspiegelt.
Wir sind uns bewusst, dass Einblicke in den Argumentationsprozess wertvoll sind, und wir haben ein starkes Kundeninteresse daran gehört, zu verstehen, wie das Modell Probleme durchdenkt.
Wir suchen nach Möglichkeiten, dies bald verfügbar zu machen.
Ihnen werden weiterhin Argumentationsnachweise in Rechnung gestellt, da es sich dabei um tatsächliche Arbeit handelt, die Ihre Output-Qualität verbessert
die
outputTokenszusammen mit den Antwort-Token erfasst werden. - Woher weiß ich, ob erweitertes Denken funktioniert, wenn das Denken redigiert ist?
-
Sie können überprüfen, ob erweitertes Denken funktioniert, indem Sie in der Ausgabe nach
reasoningContentBlöcken in der Antwort suchen (diese erscheinen nur, wenn Argumentation aktiviert ist)