

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Schritt 4: Laden von Daten in HDFS
<a name="EMRforDynamoDB.Tutorial.LoadDataIntoHDFS"></a>

In diesem Schritt kopieren Sie eine Datendatei in Hadoop Distributed File System (HDFS) und erstellen dann eine externe Hive-Tabelle, die der Datendatei zugeordnet ist.

**Herunterladen der Beispieldaten**

1. Laden Sie das Beispieldatenarchiv (`features.zip`) herunter:

   ```
   wget https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/samples/features.zip
   ```

1. Extrahieren Sie die Datei `features.txt` aus dem Archiv:

   ```
   unzip features.zip
   ```

1. Zeigen Sie die ersten Zeilen der Datei `features.txt` an:

   ```
   head features.txt
   ```

   Das Ergebnis sollte wie folgt aussehen:

   ```
   1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794
   875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7
   1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10
   26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681
   1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605
   1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558
   1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024
   533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0
   829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671
   541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98
   ```

   Die `features.txt` Datei enthält eine Teilmenge von Daten des Vereinigte Staaten Board on Geographic Names ([http://geonames.usgs). gov/domestic/download](http://geonames.usgs.gov/domestic/download_data.htm)\$1data.htm). Die Felder in jeder Zeile repräsentieren Folgendes:
   + Merkmals-ID (eindeutige Kennung)
   + Name
   + Klasse (See, Wald, Strom usw.)
   + Status
   + Breitengrad (Grad)
   + Längengrad (Grad)
   + Höhe (in Fuß)

1. Geben Sie an der Eingabeaufforderung den folgenden Befehl ein:

   ```
   hive
   ```

   Die Eingabeaufforderung ändert sich wie folgt: `hive>` 

1. Geben Sie die folgende HiveQL-Anweisung zum Erstellen einer nativen Hive-Tabelle ein:

   ```
   CREATE TABLE hive_features
       (feature_id             BIGINT,
       feature_name            STRING ,
       feature_class           STRING ,
       state_alpha             STRING,
       prim_lat_dec            DOUBLE ,
       prim_long_dec           DOUBLE ,
       elev_in_ft              BIGINT)
       ROW FORMAT DELIMITED
       FIELDS TERMINATED BY '|'
       LINES TERMINATED BY '\n';
   ```

1. Geben Sie die folgende HiveQL-Anweisung zum Laden der Tabelle mit Daten ein:

   ```
   LOAD DATA
   LOCAL
   INPATH './features.txt'
   OVERWRITE
   INTO TABLE hive_features;
   ```

1. Damit haben Sie eine native Hive-Tabelle, die mit Daten aus der Datei `features.txt` gefüllt wurde. Zum Überprüfen geben Sie die folgende HiveQL-Anweisung ein:

   ```
   SELECT state_alpha, COUNT(*)
   FROM hive_features
   GROUP BY state_alpha;
   ```

   Die Ausgabe sollte eine Liste der Bundesstaaten und die Anzahl der geografischen Merkmale in jedem Bundesstaat enthalten.

**Nächster Schritt**  
[Schritt 5: Kopieren von Daten nach DynamoDB](EMRforDynamoDB.Tutorial.CopyDataToDDB.md)