Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Format für openCypher Daten laden
Um openCypher Daten in diesem openCypher CSV Format zu laden, müssen Sie Knoten und Beziehungen in separaten Dateien angeben. Der Loader kann Daten aus mehreren Knoten- und Beziehungsdateien in einem einzigen Ladeauftrag laden.
Für jeden Ladebefehl muss der Satz von Dateien, die geladen werden sollen, dasselbe Pfadpräfix in einem Amazon-Simple-Storage-Service-Bucket aufweisen. Sie geben dieses Präfix im Quellparameter an. Die tatsächlichen Dateinamen und Dateierweiterungen sind nicht wichtig.
In Amazon Neptune entspricht das openCypher CSV Format der 4180-Spezifikation. RFC CSV Weitere Informationen finden Sie unter Common Format and MIME Type for CSV Files
Anmerkung
Diese Dateien MUST werden im Format -8 codiert. UTF
Jede Datei hat eine durch Komma getrennte Überschriftenzeile, die Systemspaltenüberschriften und Eigenschaftsspaltenüberschriften enthält.
Systemspaltenüberschriften in openCypher Dateien zum Laden von Daten
Jede Systemspalte kann nur einmal in einer Überschrift enthalten sein. Bei allen Systemspaltenüberschriften muss die Groß- und Kleinschreibung beachtet werden.
Die erforderlichen und zulässigen Systemspaltenüberschriften unterscheiden sich für openCypher Node-Load-Dateien und Relationship-Load-Dateien:
Systemspaltenüberschriften in Knotendateien
-
:ID
– (Erforderlich) Eine ID für den Knoten.Der Knoten–
:ID
Spaltenüberschrift kann ein optionaler ID-Bereich wie folgt hinzugefügt werden::ID(
. Ein Beispiel istID Space
):ID(movies)
.Beim Laden von Beziehungen, die die Knoten in dieser Datei verbinden, müssen Sie in den Spalten
:START_ID
und/oder:END_ID
der Beziehungsdateien dieselben ID-Bereiche verwenden.Die Knoten-
:ID
-Spalte kann optional als Eigenschaft im Formular gespeichert werden,
. Ein Beispiel istproperty name
:IDname:ID
.Der Knoten IDs sollte für alle Knotendateien beim aktuellen und beim vorherigen Ladevorgang eindeutig sein. Wenn ein ID-Raum verwendet wird, IDs sollte der Knoten in allen Knotendateien, die denselben ID-Raum im aktuellen und vorherigen Ladevorgang verwenden, eindeutig sein.
-
:LABEL
– Eine Bezeichnung für den Knoten.Es sind mehrere Bezeichnungswerte zulässig, getrennt durch Semikolon (
;
).
Systemspaltenüberschriften in Beziehungsdateien
-
:ID
– Eine ID für die Beziehung. Dies ist erforderlich, wennuserProvidedEdgeIds
wahr ist (Standard), jedoch ungültig, wennuserProvidedEdgeIds
false
ist.IDsDie Beziehung sollte für alle Beziehungsdateien beim aktuellen und beim vorherigen Laden eindeutig sein.
-
:START_ID
– (Erforderlich) Die Knoten-ID des Knotens, an dem diese Beziehung beginnt.Optional kann der Start-ID-Spalte ein ID-Bereich im Format
:START_ID(
zugeordnet werden. Der ID-Bereich der Startknoten-ID sollte mit dem ID-Bereich übereinstimmen, der dem Knoten in dessen Knotendatei zugewiesen ist.ID Space
) -
:END_ID
– (Erforderlich) Die Knoten-ID des Knotens, an dem diese Beziehung endet.Optional kann der End-ID-Spalte ein ID-Bereich im Format
:END_ID(
zugeordnet werden. Der ID-Bereich der Endknoten-ID sollte mit dem ID-Bereich übereinstimmen, der dem Knoten in dessen Knotendatei zugewiesen ist.ID Space
) -
:TYPE
– Ein Typ für die Beziehung. Beziehungen können nur einen einzigen Typ haben.
Anmerkung
openCypher Daten werden geladenInformationen darüber, wie doppelte Knoten oder Beziehungen beim Massenladen behandelt IDs werden, finden Sie unter.
Überschriften von Eigenschaftenspalten in Dateien zum Laden von openCypher Daten
Sie können mit einer Eigenschaftsspaltenüberschrift angeben, dass eine Spalte die Werte für eine bestimmte Eigenschaft enthält. Die Überschrift muss das folgende Format haben:
propertyname
:type
Leerzeichen, Kommas, Zeilenumbrüche und Zeilenumbrüche sind in den Spaltenüberschriften nicht zulässig, sodass Eigenschaftsnamen diese Zeichen nicht enthalten dürfen. Dies ist ein Beispiel für die Spaltenüberschrift einer Eigenschaft mit dem Namen age
und dem Typ Int
.
age:Int
Die Spalte mit age:Int
als Spaltenüberschrift müsste dann in jeder Zeile eine Ganzzahl oder einen leeren Wert enthalten.
Datentypen in openCypher Neptune-Datenladedateien
-
Bool
oderBoolean
– Ein boolesches Feld. Zulässige Werte sindtrue
undfalse
.Jeder andere Wert als
true
wird alsfalse
behandelt. -
Byte
– Eine ganze Zahl im Bereich von-128
bis127
. -
Short
– Eine ganze Zahl im Bereich von-32,768
bis32,767
. -
Int
– Eine ganze Zahl im Bereich von-2^31
bis2^31 - 1
. -
Long
– Eine ganze Zahl im Bereich von-2^63
bis2^63 - 1
. -
Float
— Eine IEEE 32-Bit-Gleitkommazahl vom Typ 754. Dezimalschreibweise und wissenschaftliche Notation werden unterstützt.Infinity
,-Infinity
undNaN
werden erkannt,INF
jedoch nicht.Werte mit zu vielen Stellen werden auf den nächsten Wert gerundet. (Ein in der Mitte liegender Wert Wert wird für die letzte Stelle auf Bit-Ebene auf 0 gerundet.)
-
Double
— Eine IEEE 64-Bit-754-Fließkommazahl. Dezimalschreibweise und wissenschaftliche Notation werden unterstützt.Infinity
,-Infinity
undNaN
werden erkannt,INF
jedoch nicht.Werte mit zu vielen Stellen werden auf den nächsten Wert gerundet. (Ein in der Mitte liegender Wert Wert wird für die letzte Stelle auf Bit-Ebene auf 0 gerundet.)
-
String
– Anführungszeichen sind optional. Kommas, Zeilenumbruchzeichen und Zeilenumschaltzeichen werden automatisch mit Escape-Zeichen markiert, wenn sie in einer von doppelten Anführungszeichen ("
) umschlossenen Zeichenfolge enthalten sind, z. B."Hello, World"
.Sie können Anführungszeichen in einer Zeichenfolge mit Anführungszeichen verwenden, indem Sie zwei in einer Zeile verwenden, z. B.
"Hello ""World"""
. -
DateTime
— Ein Java-Datum in einem der folgenden ISO -8601-Formate:yyyy-MM-dd
yyyy-MM-ddTHH:mm
yyyy-MM-ddTHH:mm:ss
yyyy-MM-ddTHH:mm:ssZ
Automatisch gecastete Datentypen in openCypher Neptune-Datenladedateien
Auto-Cast-Datentypen werden bereitgestellt, um Datentypen zu laden, die Neptune zurzeit nicht nativ unterstützt. Daten in solchen Spalten werden in unveränderter Form als Zeichenfolgen gespeichert, ohne sie anhand des beabsichtigten Formats zu verifizieren. Die folgenden Auto-Cast-Datentypen sind zulässig:
-
Char
– EinChar
-Feld. Als Zeichenfolge gespeichert. -
Date
,LocalDate
undLocalDateTime
– Siehe Zeitliche Neo4j-Instantwertefür eine Beschreibung der Typen date
,localdate
undlocaldatetime
. Die Werte werden in unveränderter Form als Zeichenfolgen ohne Validierung geladen. -
Duration
– Siehe das Neo4j-Dauerformat. Die Werte werden in unveränderter Form als Zeichenfolgen ohne Validierung geladen. -
Punkt – Ein Punktfeld zum Speichern räumlicher Daten. Siehe Räumliche Instantwerte
. Die Werte werden in unveränderter Form als Zeichenfolgen ohne Validierung geladen.
Beispiel für das Ladeformat openCypher
Das folgende Diagramm aus dem TinkerPop Modern Graph zeigt ein Beispiel für zwei Knoten und eine Beziehung:
Das Folgende ist das Diagramm im normalen openCypher Neptun-Ladeformat.
Knotendatei:
:ID,name:String,age:Int,lang:String,:LABEL v1,"marko",29,,person v2,"lop",,"java",software
Beziehungsdatei:
:ID,:START_ID(person),:END_ID(software),:TYPE,weight:Double e1,"marko","lop",created,0.4
Alternativ könnten Sie ID-Bereiche und ID wie folgt als Eigenschaft verwenden:
Erste Knotendatei:
name:ID(person),age:Int,lang:String,:LABEL "marko",29,,person
Zweite Knotendatei:
name:ID(software),age:Int,lang:String,:LABEL "lop",,"java",software
Beziehungsdatei:
:ID,:START_ID,:END_ID,:TYPE,weight:Double e1,"marko","lop",created,0.4