本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
讀取不可列印的 UTF-8 字元資料
您可以在建立 Hive 資料表時使用 STORED
AS SEQUENCEFILE
子句,以此讀取和寫入不可列印的 UTF-8 字元資料。A SequenceFile 是 Hadoop 的二進製文件格式。您需要使用 Hadoop 來讀取此檔案。下列範例顯示如何將資料從 DynamoDB 匯出到 Amazon S3。您可以使用此功能處理不可列印的 UTF-8 編碼字元。
CREATE EXTERNAL TABLE
s3_export
(a_col string, b_col bigint, c_col array<string>
) STORED AS SEQUENCEFILE LOCATION 's3://bucketname/path/subpath/
'; INSERT OVERWRITE TABLEs3_export
SELECT * FROMhiveTableName
;