

 从补丁 198 开始，Amazon Redshift 将不再支持创建新的 Python UDF。现有的 Python UDF 将继续正常运行至 2026 年 6 月 30 日。有关更多信息，请参阅[博客文章](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/)。

# Amazon Redshift 预置集群概览
<a name="overview"></a>

Amazon Redshift 服务管理数据仓库的所有设置、操作和扩展工作。这些任务包括：预置容量，监控和备份集群，以及向 Amazon Redshift 引擎应用修补程序和升级。

以下视频向您展示如何创建集群并使用 Amazon Redshift 查询编辑器 v2 查询数据。

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/8b58xGDHIog/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/8b58xGDHIog)


## 集群管理
<a name="rs-overview-cluster-management"></a>

Amazon Redshift 集群是一组节点，其中包含一个领导节点以及一个或多个计算节点。所需计算节点的类型和数量取决于数据的大小、将运行的查询数以及所需的查询运行时性能。

### 创建和管理集群
<a name="rs-overview-create-and-manage-clusters"></a>

根据数据仓库需要，开始时您可以使用一个小的单节点集群，然后随着您的需求变化轻松地扩展为更大的多节点集群。您可以在集群中添加或删除计算节点，而不会出现任何服务中断。有关更多信息，请参阅 [Amazon Redshift 预置集群](working-with-clusters.md)。

### 预留计算节点
<a name="rs-overview-reserve-compute-nodes"></a>

如果您打算让集群保持运行一年或更长时间，则可以将计算节点保留一年或三年的时间，从而节省成本。与您按需预置计算节点时支付的小时费率相比，保留计算节点可大大地节省成本。有关更多信息，请参阅 [预留节点](purchase-reserved-node-instance.md)。

### 创建集群快照
<a name="rs-overview-create-cluster-snapshots"></a>

快照是集群的时间点备份。存在两种类型的快照：自动和手动。Amazon Redshift 通过使用加密的安全套接字层 (SSL) 连接，在 Amazon Simple Storage Service (Amazon S3) 内部存储这些快照。如果您需要从快照还原，Amazon Redshift 会创建一个新集群并从您指定的快照导入数据。有关 快照的更多信息，请参阅 [Amazon Redshift 快照和备份](working-with-snapshots.md)。

## 集群访问和安全性
<a name="rs-overview-cluster-access-and-security"></a>

Amazon Redshift 中有几项与集群访问和安全相关的功能。这些功能可帮助您控制对集群的访问，定义连接规则，以及对数据和连接进行加密。这些功能是除 Amazon Redshift 中与数据库访问和安全相关的功能之外的功能。有关数据库安全的更多信息，请参阅《Amazon Redshift 数据库开发人员指南》**中的[管理数据库安全](https://docs.aws.amazon.com/redshift/latest/dg/r_Database_objects.html)。

### AWS 账户和 IAM 凭证
<a name="rs-overview-aws-accounts-and-iam-credentials"></a>

预设情况下，只有创建集群的 AWS 账户才能访问 Amazon Redshift 集群。该集群被锁定，这样其他任何人都不能访问它。在 AWS 账户内，您可以使用 AWS Identity and Access Management (IAM) 服务创建用户账户和管理这些账户的权限以控制集群操作。有关更多信息，请参阅 [Amazon Redshift 中的安全性](iam-redshift-user-mgmt.md)。有关管理 IAM 身份的更多信息，包括 IAM 角色的指南和最佳实践，请参阅 [Amazon Redshift 中的 Identity and Access Management](redshift-iam-authentication-access-control.md)。

### 安全组
<a name="rs-overview-security-groups"></a>

预设情况下，您创建的任何集群都对所有人关闭。IAM 凭证仅控制对 Amazon Redshift API 相关资源的访问：Amazon Redshift 控制台、命令行界面 (CLI)、API 和开发工具包。要能够通过 JDBC 或 ODBC 从 SQL 客户端工具访问集群，您可以使用安全组：
+ 如果您使用 EC2-VPC 平台访问 Amazon Redshift 集群，则必须使用 VPC 安全组。我们建议您在 EC2-VPC 平台中启动集群。

  使用 EC2-Classic 启动集群后，无法将其移动到 VPC。不过，您可以使用 Amazon Redshift 控制台将 EC2-Classic 快照还原到 EC2-VPC 集群。有关更多信息，请参阅 [从快照还原集群](working-with-snapshot-restore-cluster-from-snapshot.md)。
+ 如果您使用 EC2-Classic 平台访问 Amazon Redshift 集群，则必须使用 Amazon Redshift 安全组。

在上述任一情况下，您可以向安全组中添加规则，以授予对特定 CIDR/IP 地址范围或 Amazon Elastic Compute Cloud (Amazon EC2) 安全组（如果 SQL 客户端运行在 Amazon EC2 实例上）的显式入站访问权限。有关更多信息，请参阅 [Amazon Redshift 安全组](security-network-isolation.md#working-with-security-groups)。

除入站访问规则之外，您还可以创建数据库用户以提供凭证向集群自身内的数据库进行身份验证。有关更多信息，请参阅本主题中的[数据库](#rs-overview-databases)。

### 加密
<a name="rs-overview-encryption"></a>

当您预置集群时，可以选择对集群进行加密以提高安全性。启用加密时，Amazon Redshift 会将所有数据以加密格式存储在用户创建的表中。使用 AWS Key Management Service (AWS KMS) 来管理 Amazon Redshift 的加密密钥。

加密是集群的不可变属性。从加密集群切换到非加密集群的唯一方式是：卸载数据并将其重新加载到新集群。加密会应用于集群和所有备份。从加密快照还原集群时，新集群也会加密。

有关加密、密钥和硬件安全模块的更多信息，请参阅 [Amazon Redshift 数据库加密](working-with-db-encryption.md)。

### SSL 连接
<a name="rs-overview-ssl-connections"></a>

您可以使用安全套接字层 (SSL) 加密对 SQL 客户端和集群之间的连接进行加密。有关更多信息，请参阅 [配置连接的安全选项](connecting-ssl-support.md)。

## 监控集群
<a name="rs-overview-monitoring-clusters"></a>

Amazon Redshift 中有几项与监控相关的功能。您可以使用数据库审计日志记录来生成活动日志，配置事件和通知订阅来跟踪感兴趣的信息。使用 Amazon Redshift 和 Amazon CloudWatch 中的指标，了解集群和数据库的运行状况及性能。

### 数据库审核日志记录
<a name="rs-overview-database-audit-logging"></a>

您可以使用数据库审计日志记录功能来跟踪有关身份验证尝试次数、连接数、断开连接数、数据库用户定义更改以及数据库中运行的查询的信息。这些信息对 Amazon Redshift 中的安全和故障排除非常有用。日志存储在 Amazon S3 桶中。有关更多信息，请参阅 [数据库审计日志记录](db-auditing.md)。

### 事件和通知
<a name="rs-overview-events-and-notifications"></a>

Amazon Redshift 跟踪事件并在您的 AWS 账户中将事件的相关信息保留几周。对于每个事件，Amazon Redshift 会报告事件发生日期、描述、事件源（例如，集群、参数组或快照）和源 ID 等信息。您可以创建 Amazon Redshift 事件通知订阅以指定一组事件筛选器。当发生与筛选条件匹配的事件时，Amazon Redshift 将使用 Amazon Simple Notification Service 通知您发生了该事件。有关事件和通知的更多信息，请参阅 [Amazon Redshift 事件](working-with-events.md)。

### 性能
<a name="rs-overview-performance"></a>

Amazon Redshift 提供性能指标和数据，以便您可以跟踪集群和数据库的运行状况及性能。Amazon Redshift 使用 Amazon CloudWatch 指标监控集群的物理方面，例如 CPU 使用率、延迟和吞吐量。Amazon Redshift 还提供查询和加载性能数据，以帮助您监控集群中的数据库活动。有关性能指标和监控的更多信息，请参阅[监控 Amazon Redshift 集群性能](metrics.md)。

## 数据库
<a name="rs-overview-databases"></a>

当您预置集群时，Amazon Redshift 会创建一个数据库。这是您用于加载数据并对数据运行查询的数据库。您可以根据需要通过运行 SQL 命令来创建其他数据库。有关创建其他数据库的更多信息，请参阅《Amazon Redshift 数据库开发人员指南》**中的[步骤 1：创建数据库](https://docs.aws.amazon.com/redshift/latest/dg/t_creating_database.html)。

当您预置集群时，可以指定一个管理员用户，此管理员用户可以访问在该集群内创建的所有数据库。此管理员用户是最初唯一可以访问数据库的超级用户，此用户也可以创建其它超级用户和用户。有关更多信息，请转至《Amazon Redshift 数据库开发人员指南》**中的[超级用户](https://docs.aws.amazon.com/redshift/latest/dg/r_superusers.html)和[用户](https://docs.aws.amazon.com/redshift/latest/dg/r_Users.html)。

Amazon Redshift 使用参数组定义集群中所有数据库的行为，例如，日期表示样式和浮点精度。如果您在预置集群时未指定参数组，则 Amazon Redshift 会将一个默认参数组与集群相关联。有关更多信息，请参阅 [Amazon Redshift 参数组](working-with-parameter-groups.md)。

有关 Amazon Redshift 中的数据库的更多信息，请转至 [Amazon Redshift 数据库开发人员指南](https://docs.aws.amazon.com/redshift/latest/dg/)。