使用 AWS Glue 或 Athena 控制台创建表 - Amazon Athena

使用 AWS Glue 或 Athena 控制台创建表

您可以使用 AWS Glue、“添加表”表单或在 Athena 查询编辑器中运行 DDL 语句,从而在 Athena 中创建表。

使用 AWS Glue 爬网程序创建表

  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 在查询编辑器中,选择 Tables and views(表和视图)旁的 Create(创建),然后选择 AWS Glue crawler(爬网程序)。

  3. 按照 AWS Glue 控制台的 Add crawler(添加爬网程序)页面上的步骤,添加爬网程序。

    有关更多信息,请参阅 使用爬网程序添加表

使用 Athena“创建表”表单创建表

  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 在查询编辑器中,选择 Tables and views(表和视图)旁边的 Create(创建),然后选择 S3 bucket data(S3 存储桶数据)。

  3. Create Table From S3 bucket data(从 S3 存储桶数据创建表)表单中,输入创建表所需的信息,然后选择 Create table(创建表)。有关表单中字段的更多信息,请参阅 在 Athena 控制台中使用表单添加 AWS Glue 表

要在 Athena 查询编辑器中使用 CREATE TABLE 语句创建表

  1. Database (数据库) 菜单,选择要为其创建表的数据库。如果您未在 CREATE TABLE 语句中指定数据库,则将在查询编辑器中当前选定的数据库内创建表。

  2. 在查询编辑器中输入类似以下内容的语句,然后选择 Run Query(运行查询),或者按 Ctrl+ENTER

    CREATE EXTERNAL TABLE IF NOT EXISTS cloudfront_logs ( `Date` Date, Time STRING, Location STRING, Bytes INT, RequestIP STRING, Method STRING, Host STRING, Uri STRING, Status INT, Referrer STRING, OS String, Browser String, BrowserVersion String ) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe' WITH SERDEPROPERTIES ( "input.regex" = "^(?!#)([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+([^ ]+)\\s+[^\(]+[\(]([^\;]+).*\%20([^\/]+)[\/](.*)$" ) LOCATION 's3://athena-examples-MyRegion/cloudfront/plaintext/';