

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 数据类型
<a name="API_Types"></a>

支持以下数据类型：
+  [AllowedStatistics](API_AllowedStatistics.md) 
+  [ColumnSelector](API_ColumnSelector.md) 
+  [ColumnStatisticsConfiguration](API_ColumnStatisticsConfiguration.md) 
+  [ConditionExpression](API_ConditionExpression.md) 
+  [CsvOptions](API_CsvOptions.md) 
+  [CsvOutputOptions](API_CsvOutputOptions.md) 
+  [DatabaseInputDefinition](API_DatabaseInputDefinition.md) 
+  [DatabaseOutput](API_DatabaseOutput.md) 
+  [DatabaseTableOutputOptions](API_DatabaseTableOutputOptions.md) 
+  [DataCatalogInputDefinition](API_DataCatalogInputDefinition.md) 
+  [DataCatalogOutput](API_DataCatalogOutput.md) 
+  [Dataset](API_Dataset.md) 
+  [DatasetParameter](API_DatasetParameter.md) 
+  [DatetimeOptions](API_DatetimeOptions.md) 
+  [EntityDetectorConfiguration](API_EntityDetectorConfiguration.md) 
+  [ExcelOptions](API_ExcelOptions.md) 
+  [FilesLimit](API_FilesLimit.md) 
+  [FilterExpression](API_FilterExpression.md) 
+  [FormatOptions](API_FormatOptions.md) 
+  [Input](API_Input.md) 
+  [Job](API_Job.md) 
+  [JobRun](API_JobRun.md) 
+  [JobSample](API_JobSample.md) 
+  [JsonOptions](API_JsonOptions.md) 
+  [Metadata](API_Metadata.md) 
+  [Output](API_Output.md) 
+  [OutputFormatOptions](API_OutputFormatOptions.md) 
+  [PathOptions](API_PathOptions.md) 
+  [ProfileConfiguration](API_ProfileConfiguration.md) 
+  [Project](API_Project.md) 
+  [Recipe](API_Recipe.md) 
+  [RecipeAction](API_RecipeAction.md) 
+  [RecipeReference](API_RecipeReference.md) 
+  [RecipeStep](API_RecipeStep.md) 
+  [RecipeVersionErrorDetail](API_RecipeVersionErrorDetail.md) 
+  [Rule](API_Rule.md) 
+  [RulesetItem](API_RulesetItem.md) 
+  [S3Location](API_S3Location.md) 
+  [S3TableOutputOptions](API_S3TableOutputOptions.md) 
+  [Sample](API_Sample.md) 
+  [Schedule](API_Schedule.md) 
+  [StatisticOverride](API_StatisticOverride.md) 
+  [StatisticsConfiguration](API_StatisticsConfiguration.md) 
+  [Threshold](API_Threshold.md) 
+  [ValidationConfiguration](API_ValidationConfiguration.md) 
+  [ViewFrame](API_ViewFrame.md) 

# AllowedStatistics
<a name="API_AllowedStatistics"></a>

允许在包含检测到的实体的列上运行的统计信息的配置。如果未定义，则不会对包含检测到的实体的列计算统计信息。

## 目录
<a name="API_AllowedStatistics_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Statistics **   <a name="databrew-Type-AllowedStatistics-Statistics"></a>
允许包含检测到的实体的列的一个或多个列统计信息。  
类型：字符串数组  
数组成员：最少 1 个物品。  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z\_]+$`  
必需：是

## 另请参阅
<a name="API_AllowedStatistics_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/AllowedStatistics) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/AllowedStatistics) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/AllowedStatistics) 

# ColumnSelector
<a name="API_ColumnSelector"></a>

数据集中用于配置文件作业配置的列的选择器。一个选择器包含列名或正则表达式。

## 目录
<a name="API_ColumnSelector_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-ColumnSelector-Name"></a>
数据集中的列的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** Regex **   <a name="databrew-Type-ColumnSelector-Regex"></a>
用于从数据集中选择列的正则表达式。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

## 另请参阅
<a name="API_ColumnSelector_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ColumnSelector) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ColumnSelector) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ColumnSelector) 

# ColumnStatisticsConfiguration
<a name="API_ColumnStatisticsConfiguration"></a>

配置文件作业的列评估配置。ColumnStatisticsConfiguration 可用于选择评估并覆盖特定列的评估参数。

## 目录
<a name="API_ColumnStatisticsConfiguration_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Statistics **   <a name="databrew-Type-ColumnStatisticsConfiguration-Statistics"></a>
评估配置。统计信息可用于选择评估并覆盖评估的参数。  
类型：[StatisticsConfiguration](API_StatisticsConfiguration.md) 对象  
必需：是

 ** Selectors **   <a name="databrew-Type-ColumnStatisticsConfiguration-Selectors"></a>
列选择器列表。选择器可用于从数据集中选择列。当选择器未定义时，配置将应用于所有支持的列。  
类型：[ColumnSelector](API_ColumnSelector.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_ColumnStatisticsConfiguration_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ColumnStatisticsConfiguration) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ColumnStatisticsConfiguration) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ColumnStatisticsConfiguration) 

# ConditionExpression
<a name="API_ConditionExpression"></a>

表示评估为 true 或 false 的单个条件。

条件与食谱操作一起使用。该操作仅对条件求值为 true 的列值执行。

如果食谱需要多个条件，则食谱必须指定多个 `ConditionExpression` 元素。在执行食谱操作之前，每个条件都首先应用于数据集中的行。

## 目录
<a name="API_ConditionExpression_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Condition **   <a name="databrew-Type-ConditionExpression-Condition"></a>
适用于食谱操作的特定条件。有关更多信息，请参阅《AWS Glue DataBrew 开发人员指南》**中的[配方结构](https://docs.aws.amazon.com/databrew/latest/dg/recipes.html#recipes.structure)。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z\_]+$`  
必需：是

 ** TargetColumn **   <a name="databrew-Type-ConditionExpression-TargetColumn"></a>
要应用此条件的列。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 1024。  
必需：是

 ** Value **   <a name="databrew-Type-ConditionExpression-Value"></a>
条件必须对其进行评估才能成功的值。  
类型：字符串  
长度限制：最大长度为 1024。  
必需：否

## 另请参阅
<a name="API_ConditionExpression_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ConditionExpression) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ConditionExpression) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ConditionExpression) 

# CsvOptions
<a name="API_CsvOptions"></a>

表示一组选项，这些选项用于定义 DataBrew 在通过逗号分隔值 (CSV) 文件创建数据集时如何读取该文件。

## 目录
<a name="API_CsvOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Delimiter **   <a name="databrew-Type-CsvOptions-Delimiter"></a>
指定 CSV 文件中使用的分隔符的单个字符。  
类型：字符串  
长度限制：固定长度为 1。  
必需：否

 ** HeaderRow **   <a name="databrew-Type-CsvOptions-HeaderRow"></a>
指定是否将文件中的第一行解析为标题的变量。如果此值为 false，则列名称将自动生成。  
类型：布尔值  
必需：否

## 另请参阅
<a name="API_CsvOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/CsvOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/CsvOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/CsvOptions) 

# CsvOutputOptions
<a name="API_CsvOutputOptions"></a>

表示定义 DataBrew 如何写入逗号分隔值 (CSV) 文件的一组选项。

## 目录
<a name="API_CsvOutputOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Delimiter **   <a name="databrew-Type-CsvOutputOptions-Delimiter"></a>
指定用于创建 CSV 作业输出的分隔符的单个字符。  
类型：字符串  
长度限制：固定长度为 1。  
必需：否

## 另请参阅
<a name="API_CsvOutputOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/CsvOutputOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/CsvOutputOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/CsvOutputOptions) 

# DatabaseInputDefinition
<a name="API_DatabaseInputDefinition"></a>

存储在数据库中的数据集输入文件的连接信息。

## 目录
<a name="API_DatabaseInputDefinition_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** GlueConnectionName **   <a name="databrew-Type-DatabaseInputDefinition-GlueConnectionName"></a>
存储目标数据库连接信息的 AWS Glue 连接。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** DatabaseTableName **   <a name="databrew-Type-DatabaseInputDefinition-DatabaseTableName"></a>
目标数据库中的表。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** QueryString **   <a name="databrew-Type-DatabaseInputDefinition-QueryString"></a>
要针对提供的 AWS Glue 连接运行的自定义 SQL。此 SQL 将用作 DataBrew 项目和作业的输入。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 10000。  
必需：否

 ** TempDirectory **   <a name="databrew-Type-DatabaseInputDefinition-TempDirectory"></a>
表示 DataBrew 可以读取输入数据或写入作业输出的 Amazon S3 位置（存储桶名称、存储桶所有者和对象键）。  
类型：[S3Location](API_S3Location.md) 对象  
必需：否

## 另请参阅
<a name="API_DatabaseInputDefinition_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DatabaseInputDefinition) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DatabaseInputDefinition) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DatabaseInputDefinition) 

# DatabaseOutput
<a name="API_DatabaseOutput"></a>

表示一个 JDBC 数据库输出对象，它定义了要写入 DataBrew 食谱作业的输出目标。

## 目录
<a name="API_DatabaseOutput_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** DatabaseOptions **   <a name="databrew-Type-DatabaseOutput-DatabaseOptions"></a>
表示指定 DataBrew 如何以及在何处写入食谱作业生成的数据库输出的选项。  
类型：[DatabaseTableOutputOptions](API_DatabaseTableOutputOptions.md) 对象  
必需：是

 ** GlueConnectionName **   <a name="databrew-Type-DatabaseOutput-GlueConnectionName"></a>
存储目标数据库连接信息的 AWS Glue 连接。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** DatabaseOutputMode **   <a name="databrew-Type-DatabaseOutput-DatabaseOutputMode"></a>
要写入数据库的输出模式。当前支持的选项：NEW\$1TABLE。  
类型：字符串  
有效值：`NEW_TABLE`  
必需：否

## 另请参阅
<a name="API_DatabaseOutput_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DatabaseOutput) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DatabaseOutput) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DatabaseOutput) 

# DatabaseTableOutputOptions
<a name="API_DatabaseTableOutputOptions"></a>

表示指定 DataBrew 如何以及在何处写入食谱作业生成的数据库输出的选项。

## 目录
<a name="API_DatabaseTableOutputOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** TableName **   <a name="databrew-Type-DatabaseTableOutputOptions-TableName"></a>
DataBrew 将在数据库中创建的表的名称前缀。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** TempDirectory **   <a name="databrew-Type-DatabaseTableOutputOptions-TempDirectory"></a>
表示 DataBrew 可以存储中间结果的 Amazon S3 位置（存储桶名称和对象键）。  
类型：[S3Location](API_S3Location.md) 对象  
必需：否

## 另请参阅
<a name="API_DatabaseTableOutputOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DatabaseTableOutputOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DatabaseTableOutputOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DatabaseTableOutputOptions) 

# DataCatalogInputDefinition
<a name="API_DataCatalogInputDefinition"></a>

表示存储在 AWS Glue Data Catalog 中的元数据在 DataBrew 数据集中的定义方式。

## 目录
<a name="API_DataCatalogInputDefinition_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** DatabaseName **   <a name="databrew-Type-DataCatalogInputDefinition-DatabaseName"></a>
数据目录中数据库的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** TableName **   <a name="databrew-Type-DataCatalogInputDefinition-TableName"></a>
数据目录中数据库表的名称。此表对应于 DataBrew 数据集。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** CatalogId **   <a name="databrew-Type-DataCatalogInputDefinition-CatalogId"></a>
保存存储数据的数据目录的 AWS 账户 的唯一标识符。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** TempDirectory **   <a name="databrew-Type-DataCatalogInputDefinition-TempDirectory"></a>
表示 DataBrew 可以在其中存储中间结果的 Amazon 位置。  
类型：[S3Location](API_S3Location.md) 对象  
必需：否

## 另请参阅
<a name="API_DataCatalogInputDefinition_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DataCatalogInputDefinition) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DataCatalogInputDefinition) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DataCatalogInputDefinition) 

# DataCatalogOutput
<a name="API_DataCatalogOutput"></a>

表示指定 AWS Glue Data Catalog DataBrew 如何以及在何处写入食谱作业生成的输出的选项。

## 目录
<a name="API_DataCatalogOutput_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** DatabaseName **   <a name="databrew-Type-DataCatalogOutput-DatabaseName"></a>
数据目录中数据库的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** TableName **   <a name="databrew-Type-DataCatalogOutput-TableName"></a>
数据目录中表的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** CatalogId **   <a name="databrew-Type-DataCatalogOutput-CatalogId"></a>
保存存储数据的数据目录的 AWS 账户 的唯一标识符。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** DatabaseOptions **   <a name="databrew-Type-DataCatalogOutput-DatabaseOptions"></a>
表示指定 DataBrew 如何以及在何处写入食谱作业生成的数据库输出的选项。  
类型：[DatabaseTableOutputOptions](API_DatabaseTableOutputOptions.md) 对象  
必需：否

 ** Overwrite **   <a name="databrew-Type-DataCatalogOutput-Overwrite"></a>
一个值，如果为 true，则表示为输出指定位置的任何数据将被新输出覆盖。DatabaseOptions 不支持。  
类型：布尔值  
必需：否

 ** S3Options **   <a name="databrew-Type-DataCatalogOutput-S3Options"></a>
表示指定 DataBrew 如何以及在何处写入食谱作业生成的 Amazon S3 输出的选项。  
类型：[S3TableOutputOptions](API_S3TableOutputOptions.md) 对象  
必需：否

## 另请参阅
<a name="API_DataCatalogOutput_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DataCatalogOutput) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DataCatalogOutput) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DataCatalogOutput) 

# Dataset
<a name="API_Dataset"></a>

表示可以由 DataBrew 处理的数据集。

## 目录
<a name="API_Dataset_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Input **   <a name="databrew-Type-Dataset-Input"></a>
有关 DataBrew 如何在 AWS Glue Data Catalog 或 Amazon S3 中查找数据集的信息。  
类型：[Input](API_Input.md) 对象  
必需：是

 ** Name **   <a name="databrew-Type-Dataset-Name"></a>
数据集的唯一名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** AccountId **   <a name="databrew-Type-Dataset-AccountId"></a>
拥有数据集的 AWS 账户的 ID。  
类型：字符串  
长度限制：长度上限为 255。  
必需：否

 ** CreateDate **   <a name="databrew-Type-Dataset-CreateDate"></a>
数据集的创建日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-Dataset-CreatedBy"></a>
创建数据集的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** Format **   <a name="databrew-Type-Dataset-Format"></a>
从 Amazon S3 文件或文件夹创建的数据集的文件格式。  
类型：字符串  
有效值：`CSV | JSON | PARQUET | EXCEL | ORC`  
必需：否

 ** FormatOptions **   <a name="databrew-Type-Dataset-FormatOptions"></a>
定义 DataBrew 如何解释数据集中数据的一组选项。  
类型：[FormatOptions](API_FormatOptions.md) 对象  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-Dataset-LastModifiedBy"></a>
上次修改数据集的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-Dataset-LastModifiedDate"></a>
数据集的上次修改日期和时间。  
类型：时间戳  
必需：否

 ** PathOptions **   <a name="databrew-Type-Dataset-PathOptions"></a>
定义 DataBrew 如何解释数据集的 Amazon S3 路径的一组选项。  
类型：[PathOptions](API_PathOptions.md) 对象  
必需：否

 ** ResourceArn **   <a name="databrew-Type-Dataset-ResourceArn"></a>
数据集的唯一 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** Source **   <a name="databrew-Type-Dataset-Source"></a>
数据集的数据位置：Amazon S3 或 AWS Glue Data Catalog。  
类型：字符串  
有效值：`S3 | DATA-CATALOG | DATABASE`  
必需：否

 ** Tags **   <a name="databrew-Type-Dataset-Tags"></a>
已应用于数据集的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

## 另请参阅
<a name="API_Dataset_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Dataset) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Dataset) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Dataset) 

# DatasetParameter
<a name="API_DatasetParameter"></a>

表示数据集参数，该参数用于定义数据集的 Amazon S3 路径中参数的类型和条件。

## 目录
<a name="API_DatasetParameter_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-DatasetParameter-Name"></a>
在数据集的 Amazon S3 路径中使用的参数的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** Type **   <a name="databrew-Type-DatasetParameter-Type"></a>
数据集参数的类型可以是“String”、“Number”或“Datetime”之一。  
类型：字符串  
有效值：`Datetime | Number | String`  
必需：是

 ** CreateColumn **   <a name="databrew-Type-DatasetParameter-CreateColumn"></a>
可选的布尔值，用于定义是否应使用此参数的捕获值在数据集中创建新列。  
类型：布尔值  
必需：否

 ** DatetimeOptions **   <a name="databrew-Type-DatasetParameter-DatetimeOptions"></a>
其他参数选项，例如格式和时区。对日期时间参数，为必需项。  
类型：[DatetimeOptions](API_DatetimeOptions.md) 对象  
必需：否

 ** Filter **   <a name="databrew-Type-DatasetParameter-Filter"></a>
用于将其他匹配条件应用于参数的可选筛选条件表达式结构。  
类型：[FilterExpression](API_FilterExpression.md) 对象  
必需：否

## 另请参阅
<a name="API_DatasetParameter_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DatasetParameter) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DatasetParameter) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DatasetParameter) 

# DatetimeOptions
<a name="API_DatetimeOptions"></a>

表示其他选项，这些选项用于正确解释数据集 Amazon S3 路径中使用的日期时间参数。

## 目录
<a name="API_DatetimeOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Format **   <a name="databrew-Type-DatetimeOptions-Format"></a>
必需选项，定义 Amazon S3 路径中日期参数使用的日期时间格式。应仅使用受支持的日期时间说明符和分隔字符，所有文本 a-z 或 A-Z 字符都应使用单引号进行转义。例如，"MM.dd.yyyy-'at'-HH:mm"。  
类型：字符串  
长度限制：最小长度为 2。最大长度为 100。  
必需：是

 ** LocaleCode **   <a name="databrew-Type-DatetimeOptions-LocaleCode"></a>
非美国区域设置代码的可选值，正确解释某些日期格式时需要此选项。  
类型：字符串  
长度限制：最小长度为 2。最大长度为 100。  
模式：`^[A-Za-z0-9_\.#@\-]+$`  
必需：否

 ** TimezoneOffset **   <a name="databrew-Type-DatetimeOptions-TimezoneOffset"></a>
Amazon S3 路径中日期时间参数值的时区偏移的可选值。如果此参数的格式包括时区字段，则不应使用。如果未指定偏移，则认为是 UTC。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 6。  
模式：`^(Z|[-+](\d|\d{2}|\d{2}:?\d{2}))$`  
必需：否

## 另请参阅
<a name="API_DatetimeOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/DatetimeOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/DatetimeOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/DatetimeOptions) 

# EntityDetectorConfiguration
<a name="API_EntityDetectorConfiguration"></a>

配置文件作业的实体检测配置。未定义时，禁用实体检测。

## 目录
<a name="API_EntityDetectorConfiguration_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** EntityTypes **   <a name="databrew-Type-EntityDetectorConfiguration-EntityTypes"></a>
要检测的实体类型。可以是以下任一种：  
+ USA\$1SSN
+ EMAIL
+ USA\$1ITIN
+ USA\$1PASSPORT\$1NUMBER
+ PHONE\$1NUMBER
+ USA\$1DRIVING\$1LICENSE
+ BANK\$1ACCOUNT
+ CREDIT\$1CARD
+ IP\$1ADDRESS
+ MAC\$1ADDRESS
+ USA\$1DEA\$1NUMBER
+ USA\$1HCPCS\$1CODE
+ USA\$1NATIONAL\$1PROVIDER\$1IDENTIFIER
+ USA\$1NATIONAL\$1DRUG\$1CODE
+ USA\$1HEALTH\$1INSURANCE\$1CLAIM\$1NUMBER
+ USA\$1MEDICARE\$1BENEFICIARY\$1IDENTIFIER
+ USA\$1CPT\$1CODE
+ PERSON\$1NAME
+ DATE
还支持实体类型组 USA\$1ALL，它包括除了 PERSON\$1NAME 和 DATE 之外的所有上述实体类型。  
类型：字符串数组  
数组成员：最少 1 个物品。  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z_][A-Z\\d_]*$`  
必需：是

 ** AllowedStatistics **   <a name="databrew-Type-EntityDetectorConfiguration-AllowedStatistics"></a>
允许在包含检测到的实体的列上运行的统计信息的配置。如果未定义，则不会对包含检测到的实体的列计算统计信息。  
类型：[AllowedStatistics](API_AllowedStatistics.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_EntityDetectorConfiguration_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/EntityDetectorConfiguration) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/EntityDetectorConfiguration) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/EntityDetectorConfiguration) 

# ExcelOptions
<a name="API_ExcelOptions"></a>

表示一组选项，这些选项要用于定义 DataBrew 在通过 Microsoft Excel 文件创建数据集时如何解释该文件。

## 目录
<a name="API_ExcelOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** HeaderRow **   <a name="databrew-Type-ExcelOptions-HeaderRow"></a>
指定是否将文件中的第一行解析为标题的变量。如果此值为 false，则列名称将自动生成。  
类型：布尔值  
必需：否

 ** SheetIndexes **   <a name="databrew-Type-ExcelOptions-SheetIndexes"></a>
将包含在数据集中的 Excel 文件中的一个或多个工作表编号。  
类型：整数数组  
数组成员：固定数量为 1 项。  
有效范围：最小值为 0。最大值为 200。  
必需：否

 ** SheetNames **   <a name="databrew-Type-ExcelOptions-SheetNames"></a>
将包含在数据集中的 Excel 文件中有一个或多个命名工作表。  
类型：字符串数组  
数组成员：固定数量为 1 项。  
长度限制：长度下限为 1。长度上限为 31。  
必需：否

## 另请参阅
<a name="API_ExcelOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ExcelOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ExcelOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ExcelOptions) 

# FilesLimit
<a name="API_FilesLimit"></a>

表示对应从所连 Amazon S3 路径为数据集选择的 Amazon S3 文件数量施加的限制。

## 目录
<a name="API_FilesLimit_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** MaxFiles **   <a name="databrew-Type-FilesLimit-MaxFiles"></a>
要选择的 Amazon S3 文件的数量。  
类型：整数  
有效范围：最小值为 1。  
必需：是

 ** Order **   <a name="databrew-Type-FilesLimit-Order"></a>
在选择 Amazon S3 文件前，对其进行排序时使用的条件。默认情况下使用 DESCENDING 顺序，即首先选择最近的文件。另一个可能的值是 ASCENDING。  
类型：字符串  
有效值：`DESCENDING | ASCENDING`  
必需：否

 ** OrderedBy **   <a name="databrew-Type-FilesLimit-OrderedBy"></a>
在选择 Amazon S3 文件前，对其进行排序时使用的条件。默认情况下，使用 LAST\$1MODIFIED\$1DATE 作为排序条件。目前，这是唯一允许的值。  
类型：字符串  
有效值：`LAST_MODIFIED_DATE`  
必需：否

## 另请参阅
<a name="API_FilesLimit_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/FilesLimit) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/FilesLimit) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/FilesLimit) 

# FilterExpression
<a name="API_FilterExpression"></a>

表示用于定义参数条件的结构。支持的条件如下所述：《AWS Glue DataBrew 开发人员指南》**中的[动态数据集支持的条件](https://docs.aws.amazon.com/databrew/latest/dg/datasets.multiple-files.html#conditions.for.dynamic.datasets)。

## 目录
<a name="API_FilterExpression_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Expression **   <a name="databrew-Type-FilterExpression-Expression"></a>
包括条件名称并后跟替换变量的表达式，可能与其他条件一同分组并组合使用。例如，“(starts\$1with :prefix1 or starts\$1with :prefix2) and (ends\$1with :suffix1 or ends\$1with :suffix2)”。替换变量应以“:”符号开头。  
类型：字符串  
长度限制：最小长度为 4。最大长度为 1024。  
模式：`^[<>0-9A-Za-z_.,:)(!= ]+$`  
必需：是

 ** ValuesMap **   <a name="databrew-Type-FilterExpression-ValuesMap"></a>
替换变量名称与此筛选条件表达式中所用值的映射。  
类型：字符串到字符串映射  
密钥长度限制：最小长度为 2。最大长度为 128。  
键模式：`^:[A-Za-z0-9_]+$`  
值长度约束：最大长度为 1024。  
必需：是

## 另请参阅
<a name="API_FilterExpression_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/FilterExpression) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/FilterExpression) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/FilterExpression) 

# FormatOptions
<a name="API_FormatOptions"></a>

表示一组选项，这些选项用于定义逗号分隔值 (CSV)、Excel 或 JSON 输入的结构。

## 目录
<a name="API_FormatOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Csv **   <a name="databrew-Type-FormatOptions-Csv"></a>
定义 DataBrew 如何解释 CSV 输入的选项。  
类型：[CsvOptions](API_CsvOptions.md) 对象  
必需：否

 ** Excel **   <a name="databrew-Type-FormatOptions-Excel"></a>
定义 DataBrew 如何解释 Excel 输入的选项。  
类型：[ExcelOptions](API_ExcelOptions.md) 对象  
必需：否

 ** Json **   <a name="databrew-Type-FormatOptions-Json"></a>
定义 DataBrew 如何解释 JSON 输入的选项。  
类型：[JsonOptions](API_JsonOptions.md) 对象  
必需：否

## 另请参阅
<a name="API_FormatOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/FormatOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/FormatOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/FormatOptions) 

# Input
<a name="API_Input"></a>

表示有关 DataBrew 如何在 AWS Glue Data Catalog 或 Amazon S3 中查找数据的信息。

## 目录
<a name="API_Input_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** DatabaseInputDefinition **   <a name="databrew-Type-Input-DatabaseInputDefinition"></a>
存储在数据库中的数据集输入文件的连接信息。  
类型：[DatabaseInputDefinition](API_DatabaseInputDefinition.md) 对象  
必需：否

 ** DataCatalogInputDefinition **   <a name="databrew-Type-Input-DataCatalogInputDefinition"></a>
数据的 AWS Glue Data Catalog 参数。  
类型：[DataCatalogInputDefinition](API_DataCatalogInputDefinition.md) 对象  
必需：否

 ** Metadata **   <a name="databrew-Type-Input-Metadata"></a>
包含特定数据集所需的其他资源信息。  
类型：[Metadata](API_Metadata.md) 对象  
必需：否

 ** S3InputDefinition **   <a name="databrew-Type-Input-S3InputDefinition"></a>
存储数据的 Amazon S3 位置。  
类型：[S3Location](API_S3Location.md) 对象  
必需：否

## 另请参阅
<a name="API_Input_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Input) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Input) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Input) 

# Job
<a name="API_Job"></a>

表示 DataBrew 作业的所有属性。

## 目录
<a name="API_Job_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-Job-Name"></a>
作业的唯一名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 240。  
必需：是

 ** AccountId **   <a name="databrew-Type-Job-AccountId"></a>
拥有作业的 AWS 账户的 ID。  
类型：字符串  
长度限制：长度上限为 255。  
必需：否

 ** CreateDate **   <a name="databrew-Type-Job-CreateDate"></a>
创建作业的日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-Job-CreatedBy"></a>
创建作业的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** DatabaseOutputs **   <a name="databrew-Type-Job-DatabaseOutputs"></a>
表示一个 JDBC 数据库输出对象列表，它定义了要写入 DataBrew 食谱作业的输出目标。  
类型：[DatabaseOutput](API_DatabaseOutput.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** DataCatalogOutputs **   <a name="databrew-Type-Job-DataCatalogOutputs"></a>
代表作业运行时 AWS Glue Data Catalog 输出的一个或多个构件。  
类型：[DataCatalogOutput](API_DataCatalogOutput.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** DatasetName **   <a name="databrew-Type-Job-DatasetName"></a>
作业要处理的数据集。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** EncryptionKeyArn **   <a name="databrew-Type-Job-EncryptionKeyArn"></a>
用于保护作业输出的加密密钥的 Amazon 资源名称（ARN）。有关详细信息，请参阅[对 DataBrew 作业写入的数据进行加密](https://docs.aws.amazon.com/databrew/latest/dg/encryption-security-configuration.html)   
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** EncryptionMode **   <a name="databrew-Type-Job-EncryptionMode"></a>
作业的加密模式包括以下几种：  
+  `SSE-KMS` - 具有由 AWS KMS 管理的密钥的服务器端加密。
+  `SSE-S3` - 使用 Amazon S3 托管密钥进行服务器端加密。
类型：字符串  
有效值：`SSE-KMS | SSE-S3`  
必需：否

 ** JobSample **   <a name="databrew-Type-Job-JobSample"></a>
仅用于配置文件作业的样本配置，其确定运行配置文件作业的行数。如果未提供 `JobSample` 值，则使用默认值。模式参数的默认值为 CUSTOM\$1ROWS，大小参数的默认值为 20000。  
类型：[JobSample](API_JobSample.md) 对象  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-Job-LastModifiedBy"></a>
上次修改作业的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-Job-LastModifiedDate"></a>
作业的修改日期和时间。  
类型：时间戳  
必需：否

 ** LogSubscription **   <a name="databrew-Type-Job-LogSubscription"></a>
作业的 Amazon CloudWatch 日志记录的当前状态。  
类型：字符串  
有效值：`ENABLE | DISABLE`  
必需：否

 ** MaxCapacity **   <a name="databrew-Type-Job-MaxCapacity"></a>
作业处理数据时可以使用的最大节点数。  
类型：整数  
必需：否

 ** MaxRetries **   <a name="databrew-Type-Job-MaxRetries"></a>
作业运行失败后重试此作业的最大次数。  
类型：整数  
有效范围：最小值为 0。  
必需：否

 ** Outputs **   <a name="databrew-Type-Job-Outputs"></a>
代表作业运行时输出的一个或多个构件。  
类型：[Output](API_Output.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** ProjectName **   <a name="databrew-Type-Job-ProjectName"></a>
与作业关联的项目的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** RecipeReference **   <a name="databrew-Type-Job-RecipeReference"></a>
作业运行的一组步骤。  
类型：[RecipeReference](API_RecipeReference.md) 对象  
必需：否

 ** ResourceArn **   <a name="databrew-Type-Job-ResourceArn"></a>
作业的唯一 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** RoleArn **   <a name="databrew-Type-Job-RoleArn"></a>
此作业将担任的角色的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** Tags **   <a name="databrew-Type-Job-Tags"></a>
已应用于作业的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

 ** Timeout **   <a name="databrew-Type-Job-Timeout"></a>
作业的超时（以分钟为单位）。如果作业的运行时间超出此超时时间，作业将以 `TIMEOUT` 状态结束。  
类型：整数  
有效范围：最小值为 0。  
必需：否

 ** Type **   <a name="databrew-Type-Job-Type"></a>
作业类型必须为以下类型之一：  
+  `PROFILE` - 用于分析数据集、确定其大小、数据类型、数据分布等的作业。
+  `RECIPE` - 将一个或多个转换应用于数据集的作业。
类型：字符串  
有效值：`PROFILE | RECIPE`  
必需：否

 ** ValidationConfigurations **   <a name="databrew-Type-Job-ValidationConfigurations"></a>
应用于配置文件作业的验证配置列表。  
类型：[ValidationConfiguration](API_ValidationConfiguration.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_Job_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Job) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Job) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Job) 

# JobRun
<a name="API_JobRun"></a>

表示运行一次 DataBrew 作业。

## 目录
<a name="API_JobRun_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Attempt **   <a name="databrew-Type-JobRun-Attempt"></a>
DataBrew 已经尝试运行作业的次数。  
类型：整数  
必需：否

 ** CompletedOn **   <a name="databrew-Type-JobRun-CompletedOn"></a>
作业完成处理的日期和时间。  
类型：时间戳  
必需：否

 ** DatabaseOutputs **   <a name="databrew-Type-JobRun-DatabaseOutputs"></a>
表示一个 JDBC 数据库输出对象列表，它定义了要写入 DataBrew 食谱作业的输出目标。  
类型：[DatabaseOutput](API_DatabaseOutput.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** DataCatalogOutputs **   <a name="databrew-Type-JobRun-DataCatalogOutputs"></a>
代表作业运行时 AWS Glue Data Catalog 输出的一个或多个构件。  
类型：[DataCatalogOutput](API_DataCatalogOutput.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** DatasetName **   <a name="databrew-Type-JobRun-DatasetName"></a>
作业处理的数据集的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** ErrorMessage **   <a name="databrew-Type-JobRun-ErrorMessage"></a>
一条消息，指示作业运行时遇到的错误（如果有）。  
类型：字符串  
必需：否

 ** ExecutionTime **   <a name="databrew-Type-JobRun-ExecutionTime"></a>
作业运行使用资源的时间长度（以秒为单位）。  
类型：整数  
必需：否

 ** JobName **   <a name="databrew-Type-JobRun-JobName"></a>
在此运行期间正在处理的作业的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 240。  
必需：否

 ** JobSample **   <a name="databrew-Type-JobRun-JobSample"></a>
仅用于配置文件作业的样本配置，其确定运行配置文件作业的行数。如果未提供 `JobSample` 值，则使用默认值。模式参数的默认值为 CUSTOM\$1ROWS，大小参数的默认值为 20000。  
类型：[JobSample](API_JobSample.md) 对象  
必需：否

 ** LogGroupName **   <a name="databrew-Type-JobRun-LogGroupName"></a>
Amazon CloudWatch 日志组的名称，作业在运行时将诊断消息写入其中。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 512。  
必需：否

 ** LogSubscription **   <a name="databrew-Type-JobRun-LogSubscription"></a>
作业运行的 Amazon CloudWatch 日志记录的当前状态。  
类型：字符串  
有效值：`ENABLE | DISABLE`  
必需：否

 ** Outputs **   <a name="databrew-Type-JobRun-Outputs"></a>
作业运行的一个或多个输出构件。  
类型：[Output](API_Output.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** RecipeReference **   <a name="databrew-Type-JobRun-RecipeReference"></a>
作业处理的一组步骤。  
类型：[RecipeReference](API_RecipeReference.md) 对象  
必需：否

 ** RunId **   <a name="databrew-Type-JobRun-RunId"></a>
作业运行的唯一标识符。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** StartedBy **   <a name="databrew-Type-JobRun-StartedBy"></a>
启动作业运行的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** StartedOn **   <a name="databrew-Type-JobRun-StartedOn"></a>
作业运行的开始日期和时间。  
类型：时间戳  
必需：否

 ** State **   <a name="databrew-Type-JobRun-State"></a>
作业运行实体本身的当前状态。  
类型：字符串  
有效值：`STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT`  
必需：否

 ** ValidationConfigurations **   <a name="databrew-Type-JobRun-ValidationConfigurations"></a>
应用于配置文件作业运行的验证配置列表。  
类型：[ValidationConfiguration](API_ValidationConfiguration.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_JobRun_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/JobRun) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/JobRun) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/JobRun) 

# JobSample
<a name="API_JobSample"></a>

仅用于配置文件作业的样本配置，其确定运行配置文件作业的行数。如果未提供 `JobSample` 值，则使用默认值。模式参数的默认值为 CUSTOM\$1ROWS，大小参数的默认值为 20,000。

## 目录
<a name="API_JobSample_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Mode **   <a name="databrew-Type-JobSample-Mode"></a>
一个值，用于确定配置文件作业是在整个数据集上运行还是在指定数量的行上运行。该值必须是以下内容之一：  
+ FULL\$1DATASET - 配置文件作业在整个数据集上运行。
+ CUSTOM\$1ROWS - 配置文件作业在 `Size` 参数中指定的很多行上运行。
类型：字符串  
有效值：`FULL_DATASET | CUSTOM_ROWS`  
必需：否

 ** Size **   <a name="databrew-Type-JobSample-Size"></a>
`Size` 参数仅在模式为 CUSTOM\$1ROWS 时需要。配置文件作业在指定的行数上运行。最大的大小值为 Long.MAX\$1VALUE。  
Long.MAX\$1VALUE = 9223372036854775807  
类型：长整型  
必需：否

## 另请参阅
<a name="API_JobSample_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/JobSample) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/JobSample) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/JobSample) 

# JsonOptions
<a name="API_JsonOptions"></a>

表示特定于 JSON 的选项，这些选项用于定义 AWS Glue DataBrew 如何解释输入。

## 目录
<a name="API_JsonOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** MultiLine **   <a name="databrew-Type-JsonOptions-MultiLine"></a>
指定 JSON 输入是否包含嵌入的新行字符的值。  
类型：布尔值  
必需：否

## 另请参阅
<a name="API_JsonOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/JsonOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/JsonOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/JsonOptions) 

# Metadata
<a name="API_Metadata"></a>

包含特定数据集所需的其他资源信息。

## 目录
<a name="API_Metadata_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** SourceArn **   <a name="databrew-Type-Metadata-SourceArn"></a>
与数据集关联的 Amazon 资源名称（ARN）。目前，DataBrew 仅支持来自 Amazon AppFlow 的 ARN。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

## 另请参阅
<a name="API_Metadata_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Metadata) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Metadata) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Metadata) 

# Output
<a name="API_Output"></a>

表示指定 Amazon S3 DataBrew 如何以及在何处写入食谱作业或配置文件作业生成的输出的选项。

## 目录
<a name="API_Output_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Location **   <a name="databrew-Type-Output-Location"></a>
作业在 Amazon S3 中写入输出的位置。  
类型：[S3Location](API_S3Location.md) 对象  
必需：是

 ** CompressionFormat **   <a name="databrew-Type-Output-CompressionFormat"></a>
用于压缩作业输出文本的压缩算法。  
类型：字符串  
有效值：`GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB`  
必需：否

 ** Format **   <a name="databrew-Type-Output-Format"></a>
作业输出的数据格式。  
类型：字符串  
有效值：`CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER`  
必需：否

 ** FormatOptions **   <a name="databrew-Type-Output-FormatOptions"></a>
表示定义 DataBrew 如何设定作业输出文件格式的选项。  
类型：[OutputFormatOptions](API_OutputFormatOptions.md) 对象  
必需：否

 ** MaxOutputFiles **   <a name="databrew-Type-Output-MaxOutputFiles"></a>
要由作业生成并写入输出文件夹的最大文件数。对于按列分区的输出，MaxOutputFiles 值是每个分区的最大文件数。  
类型：整数  
有效范围：最小值为 1。最大值为 999。  
必需：否

 ** Overwrite **   <a name="databrew-Type-Output-Overwrite"></a>
一个值，如果为 true，则表示为输出指定位置的任何数据将被新输出覆盖。  
类型：布尔值  
必需：否

 ** PartitionColumns **   <a name="databrew-Type-Output-PartitionColumns"></a>
作业输出的一个或多个分区列的名称。  
类型：字符串数组  
数组成员：最多 200 项。  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

## 另请参阅
<a name="API_Output_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Output) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Output) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Output) 

# OutputFormatOptions
<a name="API_OutputFormatOptions"></a>

表示定义逗号分隔值 (CSV) 作业输出结构的一组选项。

## 目录
<a name="API_OutputFormatOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Csv **   <a name="databrew-Type-OutputFormatOptions-Csv"></a>
表示定义逗号分隔值 (CSV) 作业输出结构的一组选项。  
类型：[CsvOutputOptions](API_CsvOutputOptions.md) 对象  
必需：否

## 另请参阅
<a name="API_OutputFormatOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/OutputFormatOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/OutputFormatOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/OutputFormatOptions) 

# PathOptions
<a name="API_PathOptions"></a>

表示一组选项，这些选项用于定义 DataBrew 如何为数据集中的给定 Amazon S3 路径选择文件。

## 目录
<a name="API_PathOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** FilesLimit **   <a name="databrew-Type-PathOptions-FilesLimit"></a>
如果提供，此结构将限制应该选择的文件数量。  
类型：[FilesLimit](API_FilesLimit.md) 对象  
必需：否

 ** LastModifiedDateCondition **   <a name="databrew-Type-PathOptions-LastModifiedDateCondition"></a>
如果提供，此结构定义一个日期范围，用于根据 Amazon S3 中 Amazon S3 对象的 LastModifiedDate 属性匹配该对象。  
类型：[FilterExpression](API_FilterExpression.md) 对象  
必需：否

 ** Parameters **   <a name="databrew-Type-PathOptions-Parameters"></a>
将数据集的 Amazon S3 路径中使用的参数名称映射到其定义的结构。  
类型：字符串到 [DatasetParameter](API_DatasetParameter.md) 对象的映射  
映射条目：最多 10 项。  
密钥长度限制：最小长度为 1。最大长度为 255。  
必需：否

## 另请参阅
<a name="API_PathOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/PathOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/PathOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/PathOptions) 

# ProfileConfiguration
<a name="API_ProfileConfiguration"></a>

配置文件作业的配置。配置可用于选择列、进行评估并覆盖评估的默认参数。未定义配置时，配置文件作业将对所有支持的列应用默认设置。

## 目录
<a name="API_ProfileConfiguration_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** ColumnStatisticsConfigurations **   <a name="databrew-Type-ProfileConfiguration-ColumnStatisticsConfigurations"></a>
列评估的配置列表。ColumnStatisticsConfigurations 可用于选择评估并覆盖特定列的评估参数。未定义 ColumnStatisticsConfigurations 时，配置文件作业将剖析所有受支持的列并运行所有受支持的评估。  
类型：[ColumnStatisticsConfiguration](API_ColumnStatisticsConfiguration.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** DatasetStatisticsConfiguration **   <a name="databrew-Type-ProfileConfiguration-DatasetStatisticsConfiguration"></a>
列间评估的配置。配置可用于选择评估并覆盖评估的参数。未定义配置时，配置文件作业将运行所有受支持的列间评估。  
类型：[StatisticsConfiguration](API_StatisticsConfiguration.md) 对象  
必需：否

 ** EntityDetectorConfiguration **   <a name="databrew-Type-ProfileConfiguration-EntityDetectorConfiguration"></a>
配置文件作业的实体检测配置。未定义时，禁用实体检测。  
类型：[EntityDetectorConfiguration](API_EntityDetectorConfiguration.md) 对象  
必需：否

 ** ProfileColumns **   <a name="databrew-Type-ProfileConfiguration-ProfileColumns"></a>
列选择器列表。ProfileColumns 可用于从数据集中选择列。未定义 ProfileColumns 时，配置文件作业将剖析所有受支持的列。  
类型：[ColumnSelector](API_ColumnSelector.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_ProfileConfiguration_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ProfileConfiguration) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ProfileConfiguration) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ProfileConfiguration) 

# Project
<a name="API_Project"></a>

表示 DataBrew 项目的所有属性。

## 目录
<a name="API_Project_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-Project-Name"></a>
项目的唯一名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** RecipeName **   <a name="databrew-Type-Project-RecipeName"></a>
将在项目会话期间开发的食谱的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** AccountId **   <a name="databrew-Type-Project-AccountId"></a>
拥有项目的 AWS 账户的 ID。  
类型：字符串  
长度限制：长度上限为 255。  
必需：否

 ** CreateDate **   <a name="databrew-Type-Project-CreateDate"></a>
项目的创建日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-Project-CreatedBy"></a>
创建项目的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** DatasetName **   <a name="databrew-Type-Project-DatasetName"></a>
项目要执行操作的数据集。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-Project-LastModifiedBy"></a>
上次修改项目的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-Project-LastModifiedDate"></a>
项目的上次修改日期和时间。  
类型：时间戳  
必需：否

 ** OpenDate **   <a name="databrew-Type-Project-OpenDate"></a>
打开项目的日期和时间。  
类型：时间戳  
必需：否

 ** OpenedBy **   <a name="databrew-Type-Project-OpenedBy"></a>
打开项目供使用的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** ResourceArn **   <a name="databrew-Type-Project-ResourceArn"></a>
项目的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** RoleArn **   <a name="databrew-Type-Project-RoleArn"></a>
此项目应担任的角色的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** Sample **   <a name="databrew-Type-Project-Sample"></a>
应用于数据的样本大小和采样类型。如果未指定此参数，则样本将包含数据集中的前 500 行。  
类型：[Sample](API_Sample.md) 对象  
必需：否

 ** Tags **   <a name="databrew-Type-Project-Tags"></a>
已应用于项目的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

## 另请参阅
<a name="API_Project_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Project) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Project) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Project) 

# Recipe
<a name="API_Recipe"></a>

表示要对 DataBrew 数据集执行的一项或多项操作。

## 目录
<a name="API_Recipe_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-Recipe-Name"></a>
食谱的唯一名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** CreateDate **   <a name="databrew-Type-Recipe-CreateDate"></a>
创建配方的日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-Recipe-CreatedBy"></a>
创建配方的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** Description **   <a name="databrew-Type-Recipe-Description"></a>
对食谱的描述。  
类型：字符串  
长度限制：最大长度为 1024。  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-Recipe-LastModifiedBy"></a>
上次修改配方的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-Recipe-LastModifiedDate"></a>
配方的上次修改日期和时间。  
类型：时间戳  
必需：否

 ** ProjectName **   <a name="databrew-Type-Recipe-ProjectName"></a>
与配方关联的项目的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** PublishedBy **   <a name="databrew-Type-Recipe-PublishedBy"></a>
发布配方的用户 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** PublishedDate **   <a name="databrew-Type-Recipe-PublishedDate"></a>
发布配方的日期和时间。  
类型：时间戳  
必需：否

 ** RecipeVersion **   <a name="databrew-Type-Recipe-RecipeVersion"></a>
食谱版本的标识符。必须是以下类型之一：  
+ 数字版本（`X.Y`）：`X` 和 `Y` 代表主要版本号和次要版本号。每个数字的最大长度为 6 位数，且两者都不能为负值。`X` 和 `Y` 都是必需项，而“0.0”不是有效版本。
+  `LATEST_WORKING`：DataBrew 项目中正在开发的最新有效版本。
+  `LATEST_PUBLISHED`：最新发布的版本。
类型：字符串  
长度限制：长度下限为 1。最大长度为 16。  
必需：否

 ** ResourceArn **   <a name="databrew-Type-Recipe-ResourceArn"></a>
配方的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** Steps **   <a name="databrew-Type-Recipe-Steps"></a>
由食谱定义的步骤列表。  
类型：[RecipeStep](API_RecipeStep.md) 对象数组  
必需：否

 ** Tags **   <a name="databrew-Type-Recipe-Tags"></a>
已应用于食谱的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

## 另请参阅
<a name="API_Recipe_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Recipe) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Recipe) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Recipe) 

# RecipeAction
<a name="API_RecipeAction"></a>

表示用于将更改应用于 DataBrew 数据集的转换和关联参数。有关更多信息，请参阅[配方操作参考](https://docs.aws.amazon.com/databrew/latest/dg/recipe-actions-reference.html)。

## 目录
<a name="API_RecipeAction_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Operation **   <a name="databrew-Type-RecipeAction-Operation"></a>
要对数据执行的有效 DataBrew 转换的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z\_]+$`  
必需：是

 ** Parameters **   <a name="databrew-Type-RecipeAction-Parameters"></a>
转换的上下文参数。  
类型：字符串到字符串映射  
密钥长度限制：最小长度为 1。最大长度为 128。  
键模式：`^[A-Za-z0-9]+$`  
值长度限制：最小长度为 1。最大长度为 32768。  
必需：否

## 另请参阅
<a name="API_RecipeAction_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/RecipeAction) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/RecipeAction) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/RecipeAction) 

# RecipeReference
<a name="API_RecipeReference"></a>

表示 DataBrew 配方的名称和版本。

## 目录
<a name="API_RecipeReference_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-RecipeReference-Name"></a>
食谱的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** RecipeVersion **   <a name="databrew-Type-RecipeReference-RecipeVersion"></a>
食谱版本的标识符。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 16。  
必需：否

## 另请参阅
<a name="API_RecipeReference_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/RecipeReference) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/RecipeReference) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/RecipeReference) 

# RecipeStep
<a name="API_RecipeStep"></a>

代表要执行的 DataBrew 食谱中的单个步骤。

## 目录
<a name="API_RecipeStep_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Action **   <a name="databrew-Type-RecipeStep-Action"></a>
在食谱步骤中要执行的特定操作。  
类型：[RecipeAction](API_RecipeAction.md) 对象  
必需：是

 ** ConditionExpressions **   <a name="databrew-Type-RecipeStep-ConditionExpressions"></a>
为了使食谱步骤取得成功，必须满足一个或多个条件。  
必须满足数组中的所有条件。换句话说，必须使用逻辑 AND 操作来组合所有条件。
类型：[ConditionExpression](API_ConditionExpression.md) 对象数组  
必需：否

## 另请参阅
<a name="API_RecipeStep_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/RecipeStep) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/RecipeStep) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/RecipeStep) 

# RecipeVersionErrorDetail
<a name="API_RecipeVersionErrorDetail"></a>

表示尝试删除多个配方版本时遇到的任何错误。

## 目录
<a name="API_RecipeVersionErrorDetail_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** ErrorCode **   <a name="databrew-Type-RecipeVersionErrorDetail-ErrorCode"></a>
错误的 HTTP 状态代码。  
类型：字符串  
模式：`^[1-5][0-9][0-9]$`  
必需：否

 ** ErrorMessage **   <a name="databrew-Type-RecipeVersionErrorDetail-ErrorMessage"></a>
错误消息的文本。  
类型：字符串  
必需：否

 ** RecipeVersion **   <a name="databrew-Type-RecipeVersionErrorDetail-RecipeVersion"></a>
与此错误关联的配方版本的标识符。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 16。  
必需：否

## 另请参阅
<a name="API_RecipeVersionErrorDetail_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/RecipeVersionErrorDetail) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/RecipeVersionErrorDetail) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/RecipeVersionErrorDetail) 

# Rule
<a name="API_Rule"></a>

表示应在此数据集范围内验证的单个数据质量要求。

## 目录
<a name="API_Rule_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** CheckExpression **   <a name="databrew-Type-Rule-CheckExpression"></a>
包括列引用、条件名称并后跟变量引用的表达式，可能与其他条件一同分组并组合使用。例如 `(:col1 starts_with :prefix1 or :col1 starts_with :prefix2) and (:col1 ends_with :suffix1 or :col1 ends_with :suffix2)`。列和值引用是应以“:”符号开头的替代变量。根据上下文，替代变量的值可以是实际值或列名。这些值在 SubstitutionMap 中定义。如果 CheckExpression 以列引用开头，则规则中的 ColumnSelectors 应为 null。如果已经定义了 ColumnSelectors，则条件的左侧不应有列引用，例如 `is_between :val1 and :val2`。  
有关更多信息，请参阅[可用检查](https://docs.aws.amazon.com/databrew/latest/dg/profile.data-quality-available-checks.html)。  
类型：字符串  
长度限制：最小长度为 4。最大长度为 1024。  
模式：`^[<>0-9A-Za-z_.,:)(!= ]+$`  
必需：是

 ** Name **   <a name="databrew-Type-Rule-Name"></a>
规则的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 128。  
必需：是

 ** ColumnSelectors **   <a name="databrew-Type-Rule-ColumnSelectors"></a>
列选择器列表。选择器可用于使用数据集中的名称或正则表达式选择列。规则将应用于选定的列。  
类型：[ColumnSelector](API_ColumnSelector.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

 ** Disabled **   <a name="databrew-Type-Rule-Disabled"></a>
指定是否禁用规则的值。禁用规则后，配置文件作业将不会在作业运行期间对其进行验证。默认值为 false。  
类型：布尔值  
必需：否

 ** SubstitutionMap **   <a name="databrew-Type-Rule-SubstitutionMap"></a>
替换变量名称与此检验表达式中所用值的映射。变量名称应以“:”（冒号）开头。变量值可以是实际值或列名称。为了区分两者，列名称应该用反引号括起来，例如，`":col1": "`Column A`".`  
类型：字符串到字符串映射  
密钥长度限制：最小长度为 2。最大长度为 128。  
键模式：`^:[A-Za-z0-9_]+$`  
值长度约束：最大长度为 1024。  
必需：否

 ** Threshold **   <a name="databrew-Type-Rule-Threshold"></a>
与非聚合校验表达式一起使用的阈值。非聚合校验表达式将应用于特定列中的每一行，阈值将用于确定验证是否成功。  
类型：[Threshold](API_Threshold.md) 对象  
必需：否

## 另请参阅
<a name="API_Rule_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Rule) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Rule) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Rule) 

# RulesetItem
<a name="API_RulesetItem"></a>

包含关于规则集的元数据。

## 目录
<a name="API_RulesetItem_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-RulesetItem-Name"></a>
规则集的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** TargetArn **   <a name="databrew-Type-RulesetItem-TargetArn"></a>
与规则集关联的资源（数据集）的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：是

 ** AccountId **   <a name="databrew-Type-RulesetItem-AccountId"></a>
拥有规则集的 AWS 账户的 ID。  
类型：字符串  
长度限制：长度上限为 255。  
必需：否

 ** CreateDate **   <a name="databrew-Type-RulesetItem-CreateDate"></a>
规则集的创建日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-RulesetItem-CreatedBy"></a>
创建规则集的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** Description **   <a name="databrew-Type-RulesetItem-Description"></a>
规则集的描述。  
类型：字符串  
长度限制：最大长度为 1024。  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-RulesetItem-LastModifiedBy"></a>
上次修改规则集的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-RulesetItem-LastModifiedDate"></a>
规则集的修改日期和时间。  
类型：时间戳  
必需：否

 ** ResourceArn **   <a name="databrew-Type-RulesetItem-ResourceArn"></a>
规则集的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** RuleCount **   <a name="databrew-Type-RulesetItem-RuleCount"></a>
规则集中定义的规则数量。  
类型：整数  
有效范围：最小值为 0。  
必需：否

 ** Tags **   <a name="databrew-Type-RulesetItem-Tags"></a>
已应用于规则集的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

## 另请参阅
<a name="API_RulesetItem_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/RulesetItem) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/RulesetItem) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/RulesetItem) 

# S3Location
<a name="API_S3Location"></a>

表示 DataBrew 可以读取输入数据或写入作业输出的 Amazon S3 位置（存储桶名称、存储桶所有者和对象键）。

## 目录
<a name="API_S3Location_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Bucket **   <a name="databrew-Type-S3Location-Bucket"></a>
Amazon S3 桶名称。  
类型：字符串  
长度约束：最小长度为 3。最大长度为 63。  
必需：是

 ** BucketOwner **   <a name="databrew-Type-S3Location-BucketOwner"></a>
存储桶拥有者的 AWS 账户 ID。  
类型：字符串  
长度限制：固定长度为 12。  
模式：`^[0-9]{12}$`  
必需：否

 ** Key **   <a name="databrew-Type-S3Location-Key"></a>
存储桶中对象的唯一名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 1280。  
必需：否

## 另请参阅
<a name="API_S3Location_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/S3Location) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/S3Location) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/S3Location) 

# S3TableOutputOptions
<a name="API_S3TableOutputOptions"></a>

表示指定 DataBrew 如何以及在何处写入食谱作业生成的 Amazon S3 输出的选项。

## 目录
<a name="API_S3TableOutputOptions_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Location **   <a name="databrew-Type-S3TableOutputOptions-Location"></a>
表示 DataBrew 可以写入作业输出的 Amazon S3 位置（存储桶名称和对象键）。  
类型：[S3Location](API_S3Location.md) 对象  
必需：是

## 另请参阅
<a name="API_S3TableOutputOptions_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/S3TableOutputOptions) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/S3TableOutputOptions) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/S3TableOutputOptions) 

# Sample
<a name="API_Sample"></a>

表示 DataBrew 用于交互式数据分析的样本量和采样类型。

## 目录
<a name="API_Sample_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Type **   <a name="databrew-Type-Sample-Type"></a>
DataBrew 从数据集中获取行的方式。  
类型：字符串  
有效值：`FIRST_N | LAST_N | RANDOM`  
必需：是

 ** Size **   <a name="databrew-Type-Sample-Size"></a>
示例中的行数。  
类型：整数  
有效范围：最小值为 1。最大值为 5000。  
必需：否

## 另请参阅
<a name="API_Sample_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Sample) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Sample) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Sample) 

# Schedule
<a name="API_Schedule"></a>

表示要运行作业的一个或多个日期和时间。

## 目录
<a name="API_Schedule_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Name **   <a name="databrew-Type-Schedule-Name"></a>
计划的名称。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 255。  
必需：是

 ** AccountId **   <a name="databrew-Type-Schedule-AccountId"></a>
拥有计划的 AWS 账户的 ID。  
类型：字符串  
长度限制：长度上限为 255。  
必需：否

 ** CreateDate **   <a name="databrew-Type-Schedule-CreateDate"></a>
计划的创建日期和时间。  
类型：时间戳  
必需：否

 ** CreatedBy **   <a name="databrew-Type-Schedule-CreatedBy"></a>
创建计划的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** CronExpression **   <a name="databrew-Type-Schedule-CronExpression"></a>
作业运行的日期和时间。有关更多信息，请参阅《AWS Glue DataBrew 开发人员指南》**中的[为配方作业使用 cron 表达式](https://docs.aws.amazon.com/databrew/latest/dg/jobs.recipe.html#jobs.cron)。  
类型：字符串  
长度限制：长度下限为 1。最大长度为 512。  
必需：否

 ** JobNames **   <a name="databrew-Type-Schedule-JobNames"></a>
按时间表运行的作业列表。  
类型：字符串数组  
数组成员：最多 50 项。  
长度限制：长度下限为 1。最大长度为 240。  
必需：否

 ** LastModifiedBy **   <a name="databrew-Type-Schedule-LastModifiedBy"></a>
上次修改计划的用户的 Amazon 资源名称（ARN）。  
类型：字符串  
必需：否

 ** LastModifiedDate **   <a name="databrew-Type-Schedule-LastModifiedDate"></a>
上次修改计划的日期和时间。  
类型：时间戳  
必需：否

 ** ResourceArn **   <a name="databrew-Type-Schedule-ResourceArn"></a>
计划的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：否

 ** Tags **   <a name="databrew-Type-Schedule-Tags"></a>
已应用于时间表的元数据标签。  
类型：字符串到字符串映射  
映射条目：最多 200 项。  
密钥长度限制：最小长度为 1。最大长度为 128。  
值长度限制：最大长度为 256。  
必需：否

## 另请参阅
<a name="API_Schedule_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Schedule) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Schedule) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Schedule) 

# StatisticOverride
<a name="API_StatisticOverride"></a>

覆盖配置文件作业的特定评估。

## 目录
<a name="API_StatisticOverride_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Parameters **   <a name="databrew-Type-StatisticOverride-Parameters"></a>
包含评估参数覆盖的映射。  
类型：字符串到字符串映射  
密钥长度限制：最小长度为 1。最大长度为 128。  
键模式：`^[A-Za-z0-9]+$`  
值长度限制：最小长度为 1。最大长度为 32768。  
必需：是

 ** Statistic **   <a name="databrew-Type-StatisticOverride-Statistic"></a>
评估的名称  
类型：字符串  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z\_]+$`  
必需：是

## 另请参阅
<a name="API_StatisticOverride_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/StatisticOverride) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/StatisticOverride) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/StatisticOverride) 

# StatisticsConfiguration
<a name="API_StatisticsConfiguration"></a>

配置文件作业的评估配置。此配置可用于选择评估并覆盖选定评估的参数。

## 目录
<a name="API_StatisticsConfiguration_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** IncludedStatistics **   <a name="databrew-Type-StatisticsConfiguration-IncludedStatistics"></a>
包含的评估列表。未定义列表时，将包括所有受支持的评估。  
类型：字符串数组  
数组成员：最少 1 个物品。  
长度限制：长度下限为 1。最大长度为 128。  
模式：`^[A-Z\_]+$`  
必需：否

 ** Overrides **   <a name="databrew-Type-StatisticsConfiguration-Overrides"></a>
评估的覆盖列表。  
类型：[StatisticOverride](API_StatisticOverride.md) 对象数组  
数组成员：最少 1 个物品。  
必需：否

## 另请参阅
<a name="API_StatisticsConfiguration_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/StatisticsConfiguration) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/StatisticsConfiguration) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/StatisticsConfiguration) 

# Threshold
<a name="API_Threshold"></a>

与非聚合校验表达式一起使用的阈值。非聚合校验表达式将应用于特定列中的每一行。然后，该阈值将用于确定验证是否成功。

## 目录
<a name="API_Threshold_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** Value **   <a name="databrew-Type-Threshold-Value"></a>
阈值的值。  
类型：双精度  
有效范围：最小值为 0。  
必需：是

 ** Type **   <a name="databrew-Type-Threshold-Type"></a>
阈值的类型。用于将满足规则的实际行数与阈值进行比较。  
类型：字符串  
有效值：`GREATER_THAN_OR_EQUAL | LESS_THAN_OR_EQUAL | GREATER_THAN | LESS_THAN`  
必需：否

 ** Unit **   <a name="databrew-Type-Threshold-Unit"></a>
阈值单位。可以是用于验证的完整样本量的 COUNT（计数）或 PERCENTAGE（百分比）。  
类型：字符串  
有效值：`COUNT | PERCENTAGE`  
必需：否

## 另请参阅
<a name="API_Threshold_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/Threshold) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/Threshold) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/Threshold) 

# ValidationConfiguration
<a name="API_ValidationConfiguration"></a>

数据质量验证的配置。用于选择要在配置文件作业中使用的规则集和验证模式。当 ValidationConfiguration 为 null 时，配置文件作业将在没有数据质量验证的情况下运行。

## 目录
<a name="API_ValidationConfiguration_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** RulesetArn **   <a name="databrew-Type-ValidationConfiguration-RulesetArn"></a>
要在配置文件作业中验证的规则集的 Amazon 资源名称（ARN）。选定规则集的 TargetArn 应与配置文件作业关联的数据集的 Amazon 资源名称（ARN）相同。  
类型：字符串  
长度约束：最小长度为 20。最大长度为 2048。  
必需：是

 ** ValidationMode **   <a name="databrew-Type-ValidationConfiguration-ValidationMode"></a>
数据质量验证模式。默认模式为“CHECK\$1ALL”，用于验证选定规则集中定义的所有规则。  
类型：字符串  
有效值：`CHECK_ALL`  
必需：否

## 另请参阅
<a name="API_ValidationConfiguration_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ValidationConfiguration) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ValidationConfiguration) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ValidationConfiguration) 

# ViewFrame
<a name="API_ViewFrame"></a>

表示操作期间正在转换的数据。

## 目录
<a name="API_ViewFrame_Contents"></a>

**注意**  
下表中首先描述了必需参数。

 ** StartColumnIndex **   <a name="databrew-Type-ViewFrame-StartColumnIndex"></a>
要在视图框架中返回的列范围的起始索引。  
类型：整数  
有效范围：最小值为 0。  
必需：是

 ** Analytics **   <a name="databrew-Type-ViewFrame-Analytics"></a>
控制是启用还是禁用分析计算。默认情况下启用。  
类型：字符串  
有效值：`ENABLE | DISABLE`  
必需：否

 ** ColumnRange **   <a name="databrew-Type-ViewFrame-ColumnRange"></a>
要包含在视图框架中的列数，从 `StartColumnIndex` 值开始，忽略 `HiddenColumns` 列表中的任何列。  
类型：整数  
有效范围：最小值为 0。最大值为 20。  
必需：否

 ** HiddenColumns **   <a name="databrew-Type-ViewFrame-HiddenColumns"></a>
要在视图框架中隐藏的列的列表。  
类型：字符串数组  
长度限制：长度下限为 1。最大长度为 255。  
必需：否

 ** RowRange **   <a name="databrew-Type-ViewFrame-RowRange"></a>
要在视图框架中包含的行数，从 `StartRowIndex` 值开始。  
类型：整数  
必需：否

 ** StartRowIndex **   <a name="databrew-Type-ViewFrame-StartRowIndex"></a>
要在视图框架中返回的行范围的起始索引。  
类型：整数  
有效范围：最小值为 0。  
必需：否

## 另请参阅
<a name="API_ViewFrame_SeeAlso"></a>

有关在特定语言的 AWS SDK 中使用此 API 的更多信息，请参阅以下内容：
+  [适用于 C\$1\$1 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForCpp/databrew-2017-07-25/ViewFrame) 
+  [适用于 Java V2 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForJavaV2/databrew-2017-07-25/ViewFrame) 
+  [适用于 Ruby V3 的 AWS SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/databrew-2017-07-25/ViewFrame) 