使用建立資料表 AWS Glue 或 Athena 控制台 - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用建立資料表 AWS Glue 或 Athena 控制台

您可以使用以下方式在 Athena 建立表格 AWS Glue、新增表格表單,或在 Athena 查詢編輯器中執行DDL陳述式。

若要使用建立資料表 AWS Glue 爬行者

  1. https://console.aws.amazon.com/athena/ 中開啟 Athena 主控台。

  2. 在查詢編輯器中,選擇 [資料表和檢視表] 旁邊的 [建立],然後選擇 AWS Glue 爬蟲

  3. 依照「新增爬行者程式」頁面上的步驟執行 AWS Glue 控制台添加爬蟲。

    如需詳細資訊,請參閱使用爬蟲程式新增資料表

使用 Athena 新增資料表表單來建立資料表

  1. https://console.aws.amazon.com/athena/ 中開啟 Athena 主控台。

  2. 在查詢編輯器中,選擇位在 Tables and views (資料表和檢視) 旁的 Create (建立),然後選擇 S3 bucket data (S3 儲存貯體資料)。

  3. Create Table From S3 bucket data (從 S3 儲存貯體資料建立資料表) 表單中,輸入用於建立資料表的資訊,然後選擇 Create table (建立資料表)。如需表單欄位的詳細資訊,請參閱使用 Athena 主控台中的表單新增 AWS Glue 表格

使用 Athena 查詢編輯器中的CREATETABLE陳述式建立資料表

  1. Database (資料庫) 選單中,選擇要為其建立資料表的資料庫。如果您未在 CREATE TABLE 陳述式中指定資料庫,則會在查詢編輯器中目前選取的資料庫中建立資料表。

  2. 在查詢編輯器中輸入類似下列的陳述式,然後選擇 Run (執行),或按 Ctrl+ENTER

    CREATE EXTERNAL TABLE IF NOT EXISTS cloudfront_logs ( `Date` Date, Time STRING, Location STRING, Bytes INT, RequestIP STRING, Method STRING, Host STRING, Uri STRING, Status INT, Referrer STRING, OS String, Browser String, BrowserVersion String ) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe' WITH SERDEPROPERTIES ( "input.regex" = "^(?!#)([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+[^\(]+[\(]([^\;]+).*\%20([^\/]+)[\/](.*)$" ) LOCATION 's3://athena-examples-MyRegion/cloudfront/plaintext/';