本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建数据库
数据库用于组织 AWS Glue 中的元数据表。在 AWS Glue Data Catalog 中定义表时,您将其添加到数据库。表只能位于一个数据库中。
您的数据库可以包含定义来自很多不同数据存储的数据的表。此数据可以包括 Amazon Simple Storage Service(Amazon S3)中的对象和 Amazon Relational Database Service 中的关系表。
注意
当您从 AWS Glue 数据目录中删除数据库时,也会删除数据库中的所有表。
要查看数据库列表,请登录 AWS Management Console 并通过以下网址打开 AWS Glue 控制台:https://console.aws.amazon.com/glue/
从 AWS Glue 控制台中的 Databases (数据库) 选项卡上,您可以添加、编辑和删除数据库。
-
要创建新的数据库,请选择 Add database (添加数据库) 并提供名称和描述。为了与其他元数据存储 (如 Apache Hive) 兼容,名称会转换为小写字符。
注意
如果您计划从 Amazon Athena 访问数据库,请提供只包含字母数字和下划线字符的名称。有关更多信息,请参阅 Athena 名称。
-
要编辑数据库的说明,请选中数据库名称旁边的复选框,然后选择 Edit(编辑)。
-
要删除数据库,请选中数据库名称旁边的复选框,然后选择 Remove(删除)。
-
要显示数据库中包含的表列表,请选择数据库名称,数据库属性将显示数据库中的所有表。
要更改爬网程序写入的数据库,必须更改爬网程序定义。有关更多信息,请参阅 使用爬网程序填充 Data Catalog 。
数据库资源链接
AWS Glue 控制台最近已更新。当前版本的控制台不支持数据库资源链接。 |
数据目录还可以包含到数据库的资源链接。数据库资源链接是指向本地或共享数据库的链接。目前,您只能在 AWS Lake Formation 中创建资源链接。创建到数据库的资源链接后,您可以在需要使用数据库名称的任何位置使用资源链接名称。与您拥有的或与您共享的数据库一起,数据库资源链接由 glue:GetDatabases()
返回,并在 AWS Glue 控制台的 Databases (数据库) 页面上显示为条目。
数据目录还可以包含表资源链接。
有关资源链接的更多信息,请参阅《AWS Lake Formation 开发人员指南》中的创建资源链接。