Qualità dei dati API - AWS Glue
 —  tipi di dati  —DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityAnalyzerResultDataQualityObservationMetricBasedObservationDataQualityMetricValuesDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteriaStatisticAnnotationTimestampedInclusionAnnotationAnnotationErrorDatapointInclusionAnnotationStatisticSummaryListStatisticSummaryRunIdentifierStatisticModelResult —  operazioni  —StartDataQualityRulesetEvaluationRun (start_data_quality_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun (cancel_data_quality_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun (get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns (list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun (start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun (cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun (get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns (list_data_quality_rule_recommendation_runs)GetDataQualityResult (get_data_quality_result)BatchGetDataQualityResult (batch_get_data_quality_result)ListDataQualityResults (list_data_quality_results)CreateDataQualityRuleset (create_data_quality_ruleset)DeleteDataQualityRuleset (delete_data_quality_ruleset)GetDataQualityRuleset (get_data_quality_ruleset)ListDataQualityRulesets (list_data_quality_rulesets)UpdateDataQualityRuleset (update_data_quality_ruleset)ListDataQualityStatistics (list_data_quality_statistics)TimestampFilterCreateDataQualityRulesetRequestGetDataQualityRulesetResponseGetDataQualityResultResponseStartDataQualityRuleRecommendationRunRequestGetDataQualityRuleRecommendationRunResponseBatchPutDataQualityStatisticAnnotation (batch_put_data_quality_statistic_annotation)GetDataQualityModel (get_data_quality_model)GetDataQualityModelResult (get_data_quality_model_result)ListDataQualityStatisticAnnotations (list_data_quality_statistic_annotations)PutDataQualityProfileAnnotation (put_data_quality_profile_annotation)

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Qualità dei dati API

La qualità dei dati API descrive i tipi di dati sulla qualità dei dati e include i set di regole, le esecuzioni e le valutazioni sulla qualità dei dati API per la creazione, l'eliminazione o l'aggiornamento.

Tipi di dati

DataSource struttura

Una fonte di dati (una AWS Glue tabella) per la quale desideri ottenere risultati sulla qualità dei dati.

Campi
  • GlueTable: obbligatorio: un oggetto GlueTable.

    Una AWS Glue tabella.

DataQualityRulesetListDetails struttura

Descrive un set di regole di qualità dei dati restituito da GetDataQualityRuleset.

Campi
  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole di qualità dei dati.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole di qualità dei dati.

  • CreatedOn: timestamp.

    La data e l'ora di creazione del set di regole della qualità dei dati.

  • LastModifiedOn: timestamp.

    La data e l'ora di modifica del set di regole della qualità dei dati.

  • TargetTable: un oggetto DataQualityTargetTable.

    Un oggetto che rappresenta una AWS Glue tabella.

  • RecommendationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Quando un set di regole è stato creato da un'esecuzione di raccomandazione, questo ID di esecuzione viene generato per collegare i due.

  • RuleCount: numero (intero).

    Il numero di regole nel set di regole.

DataQualityTargetTable struttura

Un oggetto che rappresenta una AWS Glue tabella.

Campi
  • TableNameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome della AWS Glue tabella.

  • DatabaseNameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del database in cui esiste la AWS Glue tabella.

  • CatalogId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del catalogo in cui esiste la AWS Glue tabella.

DataQualityRulesetEvaluationRunDescription struttura

Descrive il risultato di un'esecuzione di valutazione del set di regole della qualità dei dati.

Campi
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

  • Status— UTF -8 stringhe (valori validi: STARTING | RUNNING | | STOPPING | STOPPED | SUCCEEDED | FAILED |TIMEOUT).

    Lo stato di questa esecuzione.

  • StartedOn: timestamp.

    La data e l'ora di inizio dell'esecuzione.

  • DataSource: un oggetto DataSource.

    L'origine dati (una AWS Glue tabella) associata all'esecuzione.

DataQualityRulesetEvaluationRunFilter struttura

I criteri di filtro.

Campi
  • DataSource: obbligatorio: un oggetto DataSource.

    Filtro basato su una fonte di dati (una AWS Glue tabella) associata all'esecuzione.

  • StartedBefore: timestamp.

    Filtra i risultati in base alle esecuzioni iniziate prima di questo momento.

  • StartedAfter: timestamp.

    Filtra i risultati in base alle esecuzioni iniziate dopo questo momento.

DataQualityEvaluationRunAdditionalRunOptions struttura

Opzioni di esecuzione aggiuntive che è possibile specificare per l'esecuzione di una valutazione.

Campi
  • CloudWatchMetricsEnabled: booleano.

    Se abilitare o meno le CloudWatch metriche.

  • ResultsS3Prefix— UTF -8 stringhe.

    Prefisso per Amazon S3 per archiviare i risultati.

  • CompositeRuleEvaluationMethod— UTF -8 stringhe (valori validi: COLUMN |ROW).

    Imposta il metodo di valutazione per le regole composite nel set di regole su/ROWCOLUMN

DataQualityRuleRecommendationRunDescription struttura

Descrive il risultato dell'esecuzione di una raccomandazione per una regola di qualità dei dati.

Campi
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

  • Status— UTF -8 stringhe (valori validi: STARTING | RUNNING | | STOPPING | STOPPED | SUCCEEDED | FAILED |TIMEOUT).

    Lo stato di questa esecuzione.

  • StartedOn: timestamp.

    La data e l'ora in cui è stata avviata questa esecuzione.

  • DataSource: un oggetto DataSource.

    L'origine dati (AWS Glue tabella) associata all'esecuzione della raccomandazione.

DataQualityRuleRecommendationRunFilter struttura

Un filtro per elencare le esecuzioni delle raccomandazioni per la qualità dei dati.

Campi
  • DataSource: obbligatorio: un oggetto DataSource.

    Filtro basato su una fonte di dati specificata (AWS Glue tabella).

  • StartedBefore: timestamp.

    Filtra in base all'ora per i risultati avviati prima dell'ora indicata.

  • StartedAfter: timestamp.

    Filtra in base all'ora per i risultati avviati dopo l'ora indicata.

DataQualityResult struttura

Descrive un risultato di qualità dei dati.

Campi
  • ResultId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Un ID di risultato univoco per il risultato della qualità dei dati.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo per il risultato sulla qualità dei dati.

  • Score: numero (doppio), non superiore a 1,0.

    Un punteggio aggregato della qualità dei dati. Rappresenta il rapporto tra le regole inviate e il numero totale di regole.

  • DataSource: un oggetto DataSource.

    La tabella associata al risultato della qualità dei dati, se presente.

  • RulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole associato al risultato della qualità dei dati.

  • EvaluationContext— UTF -8 stringhe.

    Nel contesto di un lavoro in AWS Glue Studio, a ogni nodo dell'area di disegno viene in genere assegnato un nome e i nodi di qualità dei dati avranno dei nomi. Nel caso di più nodi, evaluationContext può differenziare i nodi.

  • StartedOn: timestamp.

    La data e ora di inizio di questa esecuzione della qualità dei dati.

  • CompletedOn: timestamp.

    La data e ora di completamento dell'esecuzione della qualità dei dati.

  • JobName— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Il nome del processo associato al risultato della qualità dei dati, se presente.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione del processo associato al risultato della qualità dei dati, se presente.

  • RulesetEvaluationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione univoco per la valutazione del set di regole per questo risultato di qualità dei dati.

  • RuleResults: una matrice di oggetti DataQualityRuleResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityRuleResult che rappresentano i risultati per ogni regola.

  • AnalyzerResults: una matrice di oggetti DataQualityAnalyzerResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityAnalyzerResult che rappresentano i risultati per ogni analizzatore.

  • Observations: una matrice di oggetti DataQualityObservation, non superiore a 50 strutture.

    Un elenco di oggetti DataQualityObservation che rappresentano le osservazioni generate dopo la valutazione di regole e analizzatori.

DataQualityAnalyzerResult struttura

Descrive il risultato della valutazione di un analizzatore della qualità dei dati.

Campi
  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome dell'analizzatore della qualità dei dati.

  • Description— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    Una descrizione dell'analizzatore della qualità dei dati.

  • EvaluationMessage— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    Un messaggio di valutazione.

  • EvaluatedMetrics: una matrice della mappa di coppie chiave-valore.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 255 byte, che corrisponde a. Single-line string pattern

    Ogni valore è un numero (doppio).

    Una mappa di metriche associate alla valutazione dell'analizzatore.

DataQualityObservation struttura

Descrive l'osservazione generata dopo la valutazione delle regole e degli analizzatori.

Campi
  • Description— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    Una descrizione dell'osservazione della qualità dei dati.

  • MetricBasedObservation: un oggetto MetricBasedObservation.

    Un oggetto di tipo MetricBasedObservation che rappresenta l'osservazione basata su metriche di qualità dei dati valutate.

MetricBasedObservation struttura

Descrive l'osservazione basata su metriche generata sulla base di metriche valutate sulla qualità dei dati.

Campi
  • MetricName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome della metrica di qualità dei dati utilizzata per generare l'osservazione.

  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • MetricValues: un oggetto DataQualityMetricValues.

    Un oggetto di tipo DataQualityMetricValues che rappresenta l'analisi del valore della metrica di qualità dei dati.

  • NewRules— Una matrice di UTF -8 stringhe.

    Un elenco di nuove regole sulla qualità dei dati generate come parte dell'osservazione basata sul valore della metrica di qualità dei dati.

DataQualityMetricValues struttura

Descrive il valore della metrica di qualità dei dati in base all'analisi dei dati storici.

Campi
  • ActualValue: numero (doppio).

    Il valore effettivo della metrica di qualità dei dati.

  • ExpectedValue: numero (doppio).

    Il valore atteso della metrica di qualità dei dati in base all'analisi dei dati storici.

  • LowerLimit: numero (doppio).

    Il limite inferiore del valore della metrica di qualità dei dati in base all'analisi dei dati storici.

  • UpperLimit: numero (doppio).

    Il limite superiore del valore della metrica di qualità dei dati in base all'analisi dei dati storici.

DataQualityRuleResult struttura

Descrive il risultato della valutazione del set di regole della qualità dei dati.

Campi
  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della regola di qualità dei dati.

  • Description— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    Una descrizione della regola di qualità dei dati.

  • EvaluationMessage— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    Un messaggio di valutazione.

  • Result— UTF -8 stringhe (valori validi: PASS | FAIL |ERROR).

    Lo stato positivo o negativo per la regola.

  • EvaluatedMetrics: una matrice della mappa di coppie chiave-valore.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 255 byte, che corrisponde a. Single-line string pattern

    Ogni valore è un numero (doppio).

    Una mappa dei parametri associati alla valutazione della regola.

  • EvaluatedRule— UTF -8 stringhe, di lunghezza non superiore a 2048 byte, corrispondente a. URI address multi-line string pattern

    La regola valutata.

DataQualityResultDescription struttura

Descrive un risultato di qualità dei dati.

Campi
  • ResultId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID del risultato univoco per questo risultato della qualità dei dati.

  • DataSource: un oggetto DataSource.

    Il nome della tabella associata al risultato della qualità dei dati.

  • JobName— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome del processo associato al risultato della qualità dei dati.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione del processo associato al risultato della qualità dei dati.

  • StartedOn: timestamp.

    L'ora di inizio dell'esecuzione per questo risultato di qualità dei dati.

DataQualityResultFilterCriteria struttura

Criteri utilizzati per restituire i risultati della qualità dei dati.

Campi
  • DataSource: un oggetto DataSource.

    Filtra i risultati in base all'origine dati specificata. Ad esempio, recuperare tutti i risultati per una AWS Glue tabella.

  • JobName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Filtra i risultati in base al nome del processo specificato.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Filtra i risultati in base all'ID di esecuzione del processo specificato.

  • StartedAfter: timestamp.

    Filtra i risultati in base alle esecuzioni iniziate dopo questo momento.

  • StartedBefore: timestamp.

    Filtra i risultati in base alle esecuzioni iniziate prima di questo momento.

DataQualityRulesetFilterCriteria struttura

I criteri utilizzati per filtrare i set di regole della qualità dei dati.

Campi
  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome del criterio di filtro del set di regole.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    La descrizione dei criteri di filtro del set di regole.

  • CreatedBefore: timestamp.

    Filtra i set di regole creati prima di questa data.

  • CreatedAfter: timestamp.

    Filtra i set di regole creati dopo questa data.

  • LastModifiedBefore: timestamp.

    Filtra i set di regole modificati per l'ultima volta prima di questa data.

  • LastModifiedAfter: timestamp.

    Filtra i set di regole modificati per l'ultima volta dopo questa data.

  • TargetTable: un oggetto DataQualityTargetTable.

    Il nome e il nome del database della tabella di destinazione.

StatisticAnnotation struttura

Un'annotazione statistica.

Campi
  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • StatisticRecordedOn: timestamp.

    Il timestamp in cui è stata registrata la statistica annotata.

  • InclusionAnnotation: un oggetto TimestampedInclusionAnnotation.

    L'annotazione di inclusione applicata alla statistica.

TimestampedInclusionAnnotation struttura

Un'annotazione di inclusione con data e ora.

Campi
  • Value— UTF -8 stringhe (valori validi: |). INCLUDE EXCLUDE

    Il valore dell'annotazione di inclusione.

  • LastModifiedOn: timestamp.

    Il timestamp dell'ultima modifica dell'annotazione di inclusione.

AnnotationError struttura

Un'annotazione fallita.

Campi
  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo per l'annotazione non riuscita.

  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico per l'annotazione non riuscita.

  • FailureReason: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Il motivo per cui l'annotazione non è riuscita.

DatapointInclusionAnnotation struttura

Un'annotazione di inclusione.

Campi
  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo di qualità dei dati a cui appartiene la statistica.

  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • InclusionAnnotation— UTF -8 stringhe (valori validi: INCLUDE |EXCLUDE).

    Il valore di annotazione di inclusione da applicare alla statistica.

StatisticSummaryList elenco

elenco di StatisticSummary.

Un array di oggetti StatisticSummary.

elenco di StatisticSummary.

StatisticSummary struttura

Informazioni di riepilogo su una statistica.

Campi
  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

  • RunIdentifier: un oggetto RunIdentifier.

    L'identificatore di esecuzione

  • StatisticName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Custom string pattern #32

    Il nome della statistica.

  • DoubleValue: numero (doppio).

    Il valore della statistica.

  • EvaluationLevel— UTF -8 stringhe (valori validi: Dataset="DATASET" | Column="COLUMN" |Multicolumn="MULTICOLUMN").

    Il livello di valutazione della statistica. Valori possibili:Dataset,Column,Multicolumn.

  • ColumnsReferenced— Un array di UTF -8 stringhe.

    L'elenco delle colonne a cui fa riferimento la statistica.

  • ReferencedDatasets— Un array di UTF -8 stringhe.

    L'elenco dei set di dati a cui fa riferimento la statistica.

  • StatisticProperties: una matrice della mappa di coppie chiave-valore.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 255 byte, che corrisponde a. Single-line string pattern

    Ogni valore è una stringa Description, non superiore a 2.048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    AStatisticPropertiesMap, che contiene un e NameString DescriptionString

  • RecordedOn: timestamp.

    Il timestamp in cui è stata registrata la statistica.

  • InclusionAnnotation: un oggetto TimestampedInclusionAnnotation.

    L'annotazione di inclusione per la statistica.

RunIdentifier struttura

Un identificatore di corsa.

Campi
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID Run.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID Job Run.

StatisticModelResult struttura

Il risultato del modello statistico.

Campi
  • LowerBound: numero (doppio).

    Il limite inferiore.

  • UpperBound: numero (doppio).

    Il limite superiore.

  • PredictedValue: numero (doppio).

    Il valore previsto.

  • ActualValue: numero (doppio).

    Il valore effettivo.

  • Date: timestamp.

    La data.

  • InclusionAnnotation— UTF -8 stringhe (valori validi: INCLUDE |EXCLUDE).

    L'annotazione di inclusione.

Operazioni

StartDataQualityRulesetEvaluationRun azione (Python: start_data_quality_ruleset_evaluation_run)

Una volta ottenuta una definizione del set di regole (consigliata o personalizzata), si chiama questa operazione per valutare il set di regole rispetto a una fonte di dati (tabella).AWS Glue La valutazione calcola i risultati che è possibile recuperare con. GetDataQualityResult API

Richiesta
  • DataSource: obbligatorio: un oggetto DataSource.

    L'origine dati (AWS Glue tabella) associata a questa esecuzione.

  • RoleRichiesto: UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Viene utilizzato per l'idempotenza e si consiglia di impostarlo su un ID casuale (come aUUID) per evitare di creare o avviare più istanze della stessa risorsa.

  • AdditionalRunOptions: un oggetto DataQualityEvaluationRunAdditionalRunOptions.

    Opzioni di esecuzione aggiuntive che è possibile specificare per l'esecuzione di una valutazione.

  • RulesetNamesObbligatorio: un array di UTF -8 stringhe, non meno di 1 o più di 10 stringhe.

    Un elenco di nomi di set di regole.

  • AdditionalDataSources: una matrice della mappa di coppie chiave-valore.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 255 byte, che corrisponde a. Single-line string pattern

    Ogni valore è un oggetto DataSource.

    Una mappa di stringhe di riferimento a origini dati aggiuntive che è possibile specificare per l'esecuzione di una valutazione.

Risposta
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Errori
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun azione (Python: cancel_data_quality_ruleset_evaluation_run)

Annulla un'esecuzione in cui un set di regole viene valutato rispetto a un'origine dati.

Richiesta
  • RunIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun azione (Python: get_data_quality_ruleset_evaluation_run)

Richiama un'esecuzione in cui un set di regole viene valutato rispetto a un'origine dati.

Richiesta
  • RunIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Risposta
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

  • DataSource: un oggetto DataSource.

    L'origine dati (una AWS Glue tabella) associata a questa esecuzione di valutazione.

  • Role— UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • AdditionalRunOptions: un oggetto DataQualityEvaluationRunAdditionalRunOptions.

    Opzioni di esecuzione aggiuntive che è possibile specificare per l'esecuzione di una valutazione.

  • Status— UTF -8 stringhe (valori validi: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED |TIMEOUT).

    Lo stato di questa esecuzione.

  • ErrorString— UTF -8 stringhe.

    Le stringhe di errore associate all'esecuzione.

  • StartedOn: timestamp.

    La data e l'ora in cui è stata avviata questa esecuzione.

  • LastModifiedOn: timestamp.

    Un Timestamp. L'ultimo momento in cui questa raccomandazione della regola di qualità dei dati è stata modificata.

  • CompletedOn: timestamp.

    La data e l'ora in cui è stata completata questa esecuzione.

  • ExecutionTime: numero (intero).

    La quantità di tempo (in secondi) durante la quale l'esecuzione ha utilizzato le risorse.

  • RulesetNames— Un array di UTF -8 stringhe, non meno di 1 o più di 10 stringhe.

    Un elenco di nomi dei set di regole per l'esecuzione. Attualmente, questo parametro accetta un solo nome di set di regole.

  • ResultIds— Un array di UTF -8 stringhe, non meno di 1 o più di 10 stringhe.

    Un elenco di risultati IDs relativi alla qualità dei dati per l'esecuzione.

  • AdditionalDataSources: una matrice della mappa di coppie chiave-valore.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 255 byte, che corrisponde a. Single-line string pattern

    Ogni valore è un oggetto DataSource.

    Una mappa di stringhe di riferimento a origini dati aggiuntive che è possibile specificare per l'esecuzione di una valutazione.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns azione (Python: list_data_quality_ruleset_evaluation_runs)

Elenca tutte le esecuzioni che soddisfano i criteri di filtro, in cui un set di regole viene valutato rispetto a un'origine dati.

Richiesta
  • Filter: un oggetto DataQualityRulesetEvaluationRunFilter.

    I criteri di filtro.

  • NextTokenUTF— -8 stringhe.

    Un token di paginazione per partizionare i risultati.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire.

Risposta
  • Runs: una matrice di oggetti DataQualityRulesetEvaluationRunDescription.

    Un elenco di oggetti DataQualityRulesetEvaluationRunDescription che rappresentano le esecuzioni del set di regole della qualità dei dati.

  • NextToken— UTF -8 corde.

    Un token di impaginazione, se sono disponibili altri risultati.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun azione (Python: start_data_quality_rule_recommendation_run)

Avvia un'esecuzione di raccomandazioni che viene utilizzata per generare regole quando non sai quali regole scrivere. AWS Glue Data Quality analizza i dati e fornisce consigli per un potenziale set di regole. Puoi quindi classificare il set di regole e modificare il set di regole generato a tuo piacimento.

Le esecuzioni di consigli vengono eliminate automaticamente dopo 90 giorni.

Richiesta

La richiesta della richiesta di raccomandazione sulla regola della qualità dei dati.

  • DataSource: obbligatorio: un oggetto DataSource.

    L'origine dati (AWS Glue tabella) associata a questa esecuzione.

  • RoleRichiesto: UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • CreatedRulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un nome per il set di regole.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Viene utilizzato per l'idempotenza e si consiglia di impostarlo su un ID casuale (come aUUID) per evitare di creare o avviare più istanze della stessa risorsa.

Risposta
  • RunId— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun azione (Python: cancel_data_quality_rule_recommendation_run)

Annulla l'esecuzione della raccomandazione specificata utilizzata per generare le regole.

Richiesta
  • RunIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun azione (Python: get_data_quality_rule_recommendation_run)

Ottiene l'esecuzione della raccomandazione specificata utilizzata per generare le regole.

Richiesta
  • RunIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

Risposta

Viene eseguita la risposta alla raccomandazione relativa alla regola Data Quality.

  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

  • DataSource: un oggetto DataSource.

    L'origine dati (una AWS Glue tabella) associata a questa esecuzione.

  • Role— UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • Status— UTF -8 stringhe (valori validi: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED |TIMEOUT).

    Lo stato di questa esecuzione.

  • ErrorString— UTF -8 stringhe.

    Le stringhe di errore associate all'esecuzione.

  • StartedOn: timestamp.

    La data e l'ora in cui è stata avviata questa esecuzione.

  • LastModifiedOn: timestamp.

    Un Timestamp. L'ultimo momento in cui questa raccomandazione della regola di qualità dei dati è stata modificata.

  • CompletedOn: timestamp.

    La data e l'ora in cui è stata completata questa esecuzione.

  • ExecutionTime: numero (intero).

    La quantità di tempo (in secondi) durante la quale l'esecuzione ha utilizzato le risorse.

  • RecommendedRuleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Una volta completata l'esecuzione di una raccomandazione della regola di avvio, viene creato un set di regole consigliato (una serie di regole). Questo membro dispone di tali regole nel formato Data Quality Definition Language (DQDL).

  • CreatedRulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole che è stato creato dall'esecuzione.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRuns azione (Python: list_data_quality_rule_recommendation_runs)

Elenca le esecuzioni delle raccomandazioni che soddisfano i criteri di filtro.

Richiesta
  • Filter: un oggetto DataQualityRuleRecommendationRunFilter.

    I criteri di filtro.

  • NextTokenUTF— -8 stringhe.

    Un token di paginazione per partizionare i risultati.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire.

Risposta
  • Runs: una matrice di oggetti DataQualityRuleRecommendationRunDescription.

    Elenco di oggetti DataQualityRuleRecommendationRunDescription.

  • NextToken— UTF -8 corde.

    Un token di impaginazione, se sono disponibili altri risultati.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult azione (Python: get_data_quality_result)

Recupera il risultato di una valutazione della regola della qualità dei dati.

Richiesta
  • ResultIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un ID di risultato univoco per il risultato della qualità dei dati.

Risposta

La risposta per il risultato sulla qualità dei dati.

  • ResultId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un ID di risultato univoco per il risultato della qualità dei dati.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo per il risultato sulla qualità dei dati.

  • Score: numero (doppio), non superiore a 1,0.

    Un punteggio aggregato della qualità dei dati. Rappresenta il rapporto tra le regole inviate e il numero totale di regole.

  • DataSource: un oggetto DataSource.

    La tabella associata al risultato della qualità dei dati, se presente.

  • RulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole associato al risultato della qualità dei dati.

  • EvaluationContext— UTF -8 stringhe.

    Nel contesto di un lavoro in AWS Glue Studio, a ogni nodo dell'area di disegno viene in genere assegnato un nome e i nodi di qualità dei dati avranno dei nomi. Nel caso di più nodi, evaluationContext può differenziare i nodi.

  • StartedOn: timestamp.

    La data e ora di inizio dell'esecuzione di questo risultato della qualità dei dati.

  • CompletedOn: timestamp.

    La data e ora di completamento dell'esecuzione di questo risultato della qualità dei dati.

  • JobName— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Il nome del processo associato al risultato della qualità dei dati, se presente.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione del processo associato al risultato della qualità dei dati, se presente.

  • RulesetEvaluationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione univoco associato alla valutazione del set di regole.

  • RuleResults: una matrice di oggetti DataQualityRuleResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityRuleResult che rappresentano i risultati per ogni regola.

  • AnalyzerResults: una matrice di oggetti DataQualityAnalyzerResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityAnalyzerResult che rappresentano i risultati per ogni analizzatore.

  • Observations: una matrice di oggetti DataQualityObservation, non superiore a 50 strutture.

    Un elenco di oggetti DataQualityObservation che rappresentano le osservazioni generate dopo la valutazione di regole e analizzatori.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult azione (Python: batch_get_data_quality_result)

Recupera un elenco di risultati di qualità dei dati per il risultato specificato. IDs

Richiesta
  • ResultIdsObbligatorio: un array di UTF -8 stringhe, non meno di 1 o più di 100 stringhe.

    Un elenco di risultati univoci IDs per i risultati di qualità dei dati.

Risposta
  • Results: obbligatorio: una matrice di oggetti DataQualityResult.

    Un elenco di oggetti DataQualityResult che rappresentano i risultati della qualità dei dati.

  • ResultsNotFound— Un array di UTF -8 stringhe, non meno di 1 o più di 100 stringhe.

    Un elenco di risultati IDs per i quali non sono stati trovati risultati.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults azione (Python: list_data_quality_results)

Restituisce tutti i risultati di esecuzione della qualità dei dati per il tuo account.

Richiesta
  • Filter: un oggetto DataQualityResultFilterCriteria.

    I criteri di filtro.

  • NextTokenUTF— -8 stringhe.

    Un token di paginazione per partizionare i risultati.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire.

Risposta
  • Results: obbligatorio: una matrice di oggetti DataQualityResultDescription.

    Elenco di oggetti DataQualityResultDescription.

  • NextToken— UTF -8 corde.

    Un token di impaginazione, se sono disponibili altri risultati.

Errori
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset azione (Python: create_data_quality_ruleset)

Crea un set di regole per la qualità dei dati con regole applicate a una tabella specificata. DQDL AWS Glue

Il set di regole viene creato utilizzando il Data Quality Definition Language (). DQDL Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

Richiesta

Una richiesta per creare un set di regole per la qualità dei dati.

  • NameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un nome univoco per il set di regole di qualità dei dati.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole di qualità dei dati.

  • RulesetObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

  • Tags: una matrice di mappe con coppie chiave-valore, non superiore alle 50 coppie.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 128 byte.

    Ogni valore è una stringa di UTF -8, lunga non più di 256 byte.

    Un elenco di tag applicati al set di regole di qualità dei dati.

  • TargetTable: un oggetto DataQualityTargetTable.

    Una tabella di destinazione associata al set di regole di qualità dei dati.

  • RecommendationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un ID di esecuzione univoco per l'esecuzione della raccomandazione.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Viene utilizzato per l'idempotenza e si consiglia di impostarlo su un ID casuale (come aUUID) per evitare di creare o avviare più istanze della stessa risorsa.

Risposta
  • Name— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Un nome univoco per il set di regole di qualità dei dati.

Errori
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset azione (Python: delete_data_quality_ruleset)

Elimina un set di regole di qualità dei dati.

Richiesta
  • NameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un nome per il set di regole di qualità dei dati.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset azione (Python: get_data_quality_ruleset)

Restituisce un set di regole esistente per identificatore o nome.

Richiesta
  • NameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole.

Risposta

Restituisce la risposta del set di regole sulla qualità dei dati.

  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole.

  • Ruleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

  • TargetTable: un oggetto DataQualityTargetTable.

    Il nome e il nome del database della tabella di destinazione.

  • CreatedOn: timestamp.

    Un Timestamp. La data e l'ora di creazione del set di regole di qualità dei dati.

  • LastModifiedOn: timestamp.

    Un Timestamp. L'ultimo momento in cui questo set di regole di qualità dei dati è stato modificato.

  • RecommendationRunId— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Quando un set di regole è stato creato da un'esecuzione di raccomandazione, questo ID di esecuzione viene generato per collegare i due.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets azione (Python: list_data_quality_rulesets)

Restituisce un elenco impaginato di set di regole per l'elenco di tabelle specificato. AWS Glue

Richiesta
  • NextToken— -8 stringhe. UTF

    Un token di paginazione per partizionare i risultati.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire.

  • Filter: un oggetto DataQualityRulesetFilterCriteria.

    I criteri di filtro.

  • Tags: una matrice di mappe con coppie chiave-valore, non superiore alle 50 coppie.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 128 byte.

    Ogni valore è una stringa di UTF -8, lunga non più di 256 byte.

    Un elenco di tag di coppie chiave-valore.

Risposta
  • Rulesets: una matrice di oggetti DataQualityRulesetListDetails.

    Un elenco impaginato di set di regole per l'elenco di tabelle specificato. AWS Glue

  • NextToken— -8 stringhe. UTF

    Un token di impaginazione, se sono disponibili altri risultati.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset azione (Python: update_data_quality_ruleset)

Aggiorna il set di regole di qualità dei dati specificato.

Richiesta
  • NameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole di qualità dei dati.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole.

  • Ruleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

Risposta
  • Name— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Il nome del set di regole di qualità dei dati.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole.

  • Ruleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

Errori
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

ListDataQualityStatistics azione (Python: list_data_quality_statistics)

Recupera un elenco di statistiche sulla qualità dei dati.

Richiesta
  • StatisticId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

  • TimestampFilter: un oggetto TimestampFilter.

    Un filtro con timestamp.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire in questa richiesta.

  • NextToken— UTF -8 stringhe.

    Un token di impaginazione per richiedere la pagina successiva di risultati.

Risposta
  • Statistics: una matrice di oggetti StatisticSummary.

    Un StatisticSummaryList.

  • NextToken— UTF -8 stringhe.

    Un token di impaginazione per richiedere la pagina successiva di risultati.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

TimestampFilter struttura

Un filtro timestamp.

Campi
  • RecordedBefore: timestamp.

    Il timestamp prima del quale le statistiche devono essere incluse nei risultati.

  • RecordedAfter: timestamp.

    Il timestamp dopo il quale le statistiche devono essere incluse nei risultati.

CreateDataQualityRulesetRequest struttura

Una richiesta per creare un set di regole per la qualità dei dati.

Campi
  • NameObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un nome univoco per il set di regole di qualità dei dati.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole di qualità dei dati.

  • RulesetObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

  • Tags: una matrice di mappe con coppie chiave-valore, non superiore alle 50 coppie.

    Ogni chiave è una stringa di UTF -8, lunga non meno di 1 o più di 128 byte.

    Ogni valore è una stringa di UTF -8, lunga non più di 256 byte.

    Un elenco di tag applicati al set di regole di qualità dei dati.

  • TargetTable: un oggetto DataQualityTargetTable.

    Una tabella di destinazione associata al set di regole di qualità dei dati.

  • RecommendationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un ID di esecuzione univoco per l'esecuzione della raccomandazione.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Viene utilizzato per l'idempotenza e si consiglia di impostarlo su un ID casuale (come aUUID) per evitare di creare o avviare più istanze della stessa risorsa.

GetDataQualityRulesetResponse struttura

Restituisce la risposta del set di regole sulla qualità dei dati.

Campi
  • Name— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una descrizione del set di regole.

  • Ruleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Un set di regole del Data Quality Definition Language (DQDL). Per ulteriori informazioni, consulta la guida per gli AWS Glue sviluppatori.

  • TargetTable: un oggetto DataQualityTargetTable.

    Il nome e il nome del database della tabella di destinazione.

  • CreatedOn: timestamp.

    Un Timestamp. La data e l'ora di creazione del set di regole di qualità dei dati.

  • LastModifiedOn: timestamp.

    Un Timestamp. L'ultimo momento in cui questo set di regole di qualità dei dati è stato modificato.

  • RecommendationRunId— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Quando un set di regole è stato creato da un'esecuzione di raccomandazione, questo ID di esecuzione viene generato per collegare i due.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

GetDataQualityResultResponse struttura

La risposta al risultato sulla qualità dei dati.

Campi
  • ResultId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un ID di risultato univoco per il risultato della qualità dei dati.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo per il risultato sulla qualità dei dati.

  • Score: numero (doppio), non superiore a 1,0.

    Un punteggio aggregato della qualità dei dati. Rappresenta il rapporto tra le regole inviate e il numero totale di regole.

  • DataSource: un oggetto DataSource.

    La tabella associata al risultato della qualità dei dati, se presente.

  • RulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole associato al risultato della qualità dei dati.

  • EvaluationContext— UTF -8 stringhe.

    Nel contesto di un lavoro in AWS Glue Studio, a ogni nodo dell'area di disegno viene in genere assegnato un nome e i nodi di qualità dei dati avranno dei nomi. Nel caso di più nodi, evaluationContext può differenziare i nodi.

  • StartedOn: timestamp.

    La data e ora di inizio dell'esecuzione di questo risultato della qualità dei dati.

  • CompletedOn: timestamp.

    La data e ora di completamento dell'esecuzione di questo risultato della qualità dei dati.

  • JobName— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    Il nome del processo associato al risultato della qualità dei dati, se presente.

  • JobRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione del processo associato al risultato della qualità dei dati, se presente.

  • RulesetEvaluationRunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    L'ID di esecuzione univoco associato alla valutazione del set di regole.

  • RuleResults: una matrice di oggetti DataQualityRuleResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityRuleResult che rappresentano i risultati per ogni regola.

  • AnalyzerResults: una matrice di oggetti DataQualityAnalyzerResult, non superiore a 2000 strutture.

    Un elenco di oggetti DataQualityAnalyzerResult che rappresentano i risultati per ogni analizzatore.

  • Observations: una matrice di oggetti DataQualityObservation, non superiore a 50 strutture.

    Un elenco di oggetti DataQualityObservation che rappresentano le osservazioni generate dopo la valutazione di regole e analizzatori.

StartDataQualityRuleRecommendationRunRequest struttura

La richiesta della richiesta di raccomandazione sulla regola della qualità dei dati.

Campi
  • DataSource: obbligatorio: un oggetto DataSource.

    L'origine dati (AWS Glue tabella) associata a questa esecuzione.

  • RoleRichiesto: UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • CreatedRulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Un nome per il set di regole.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Viene utilizzato per l'idempotenza e si consiglia di impostarlo su un ID casuale (come aUUID) per evitare di creare o avviare più istanze della stessa risorsa.

GetDataQualityRuleRecommendationRunResponse struttura

Viene eseguita la risposta alla raccomandazione sulla regola Data Quality.

Campi
  • RunId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'identificatore univoco dell'esecuzione associato a questa esecuzione di attività.

  • DataSource: un oggetto DataSource.

    L'origine dati (una AWS Glue tabella) associata a questa esecuzione.

  • Role— UTF -8 stringhe.

    Un IAM ruolo fornito per crittografare i risultati dell'esecuzione.

  • NumberOfWorkers: numero (intero).

    Il numero di worker G.1X da utilizzare nell'esecuzione. Il predefinito è 5.

  • Timeout: numero (intero), almeno 1.

    Il timeout per una esecuzione (in minuti). Questo è il tempo massimo durante il quale un'esecuzione può utilizzare le risorse prima di essere terminata e passare allo stato TIMEOUT. Il valore di default è 2.880 minuti (48 ore).

  • Status— UTF -8 stringhe (valori validi: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED |TIMEOUT).

    Lo stato di questa esecuzione.

  • ErrorString— UTF -8 stringhe.

    Le stringhe di errore associate all'esecuzione.

  • StartedOn: timestamp.

    La data e l'ora in cui è stata avviata questa esecuzione.

  • LastModifiedOn: timestamp.

    Un Timestamp. L'ultimo momento in cui questa raccomandazione della regola di qualità dei dati è stata modificata.

  • CompletedOn: timestamp.

    La data e l'ora in cui è stata completata questa esecuzione.

  • ExecutionTime: numero (intero).

    La quantità di tempo (in secondi) durante la quale l'esecuzione ha utilizzato le risorse.

  • RecommendedRuleset— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 65536 byte.

    Una volta completata l'esecuzione di una raccomandazione della regola di avvio, viene creato un set di regole consigliato (una serie di regole). Questo membro dispone di tali regole nel formato Data Quality Definition Language (DQDL).

  • CreatedRulesetName— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Il nome del set di regole che è stato creato dall'esecuzione.

  • DataQualitySecurityConfiguration— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il nome della configurazione di sicurezza creata con l'opzione di crittografia della qualità dei dati.

BatchPutDataQualityStatisticAnnotation azione (Python: batch_put_data_quality_statistic_annotation)

Annota i punti dati nel tempo per una statistica specifica sulla qualità dei dati.

Richiesta
  • InclusionAnnotations: obbligatorio: una matrice di oggetti DatapointInclusionAnnotation.

    Un elenco di. DatapointInclusionAnnotation

  • ClientToken— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    Token client.

Risposta
  • FailedInclusionAnnotations: una matrice di oggetti AnnotationError.

    Un elenco AnnotationError di.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • ResourceNumberLimitExceededException

GetDataQualityModel azione (Python: get_data_quality_model)

Recupera lo stato di addestramento del modello insieme a ulteriori informazioni (,,). CompletedOn StartedOn FailureReason

Richiesta
  • StatisticId— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    L'ID statistico.

  • ProfileIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

Risposta
  • Status— UTF -8 stringhe (valori validi: RUNNING | SUCCEEDED |FAILED).

    Lo stato di addestramento del modello di qualità dei dati.

  • StartedOn: timestamp.

    Il timestamp in cui è iniziata la formazione sul modello di qualità dei dati.

  • CompletedOn: timestamp.

    Il timestamp di completamento della formazione sul modello di qualità dei dati.

  • FailureReason— UTF -8 stringhe, di lunghezza non inferiore a 1 o più di 255 byte, corrispondente a. Single-line string pattern

    Il motivo del fallimento dell'allenamento.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityModelResult azione (Python: get_data_quality_model_result)

Recupera le previsioni di una statistica per un determinato ID di profilo.

Richiesta
  • StatisticIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID statistico.

  • ProfileIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

Risposta
  • CompletedOn: timestamp.

    Il timestamp di completamento della formazione sul modello di qualità dei dati.

  • Model: una matrice di oggetti StatisticModelResult.

    Un elenco di StatisticModelResult

Errori
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityStatisticAnnotations azione (Python: list_data_quality_statistic_annotations)

Recupera le annotazioni per una statistica sulla qualità dei dati.

Richiesta
  • StatisticId— UTF -8 stringhe, lunghe non meno di 1 o più di 255 byte, corrispondenti a. Single-line string pattern

    L'ID statistico.

  • ProfileId— UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo.

  • TimestampFilter: un oggetto TimestampFilter.

    Un filtro con timestamp.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Numero massimo di risultati da restituire in questa richiesta.

  • NextToken— UTF -8 stringhe.

    Un token di impaginazione per recuperare il prossimo set di risultati.

Risposta
  • Annotations: una matrice di oggetti StatisticAnnotation.

    Un elenco di quelli StatisticAnnotation applicati alla statistica

  • NextToken— UTF -8 stringhe.

    Un token di impaginazione per recuperare il prossimo set di risultati.

Errori
  • InvalidInputException

  • InternalServiceException

PutDataQualityProfileAnnotation azione (Python: put_data_quality_profile_annotation)

Annota tutti i punti dati di un profilo.

Richiesta
  • ProfileIdObbligatorio: UTF -8 stringhe, di lunghezza non inferiore a 1 o superiore a 255 byte, corrispondente a. Single-line string pattern

    L'ID del profilo di monitoraggio della qualità dei dati da annotare.

  • InclusionAnnotationObbligatorio: UTF -8 stringhe (valori validi: INCLUDE |EXCLUDE).

    Il valore di annotazione di inclusione da applicare al profilo.

Risposta
  • Nessun parametro di risposta.

Errori
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException