Ler dados de caracteres UTF-8 não imprimíveis
Para ler e gravar dados de caracteres UTF-8 não imprimíveis, é possível usar a cláusula STORED
AS SEQUENCEFILE
ao criar uma tabela do Hive. Um SequenceFile é um formato de arquivo binário do Hadoop. É necessário usar o Hadoop para ler esse arquivo. O exemplo a seguir mostra como exportar dados do DynamoDB para o Amazon S3. Você pode usar essa funcionalidade para lidar com caracteres de codificação UTF-8 não imprimíveis.
CREATE EXTERNAL TABLE
s3_export
(a_col string, b_col bigint, c_col array<string>
) STORED AS SEQUENCEFILE LOCATION 's3://bucketname/path/subpath/
'; INSERT OVERWRITE TABLEs3_export
SELECT * FROMhiveTableName
;