Benutzerdefinierte Analyseregel in AWS Clean Rooms - AWS Clean Rooms

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerdefinierte Analyseregel in AWS Clean Rooms

Anmerkung

Gilt für: AWS Clean Rooms SQL Analyse-Engine | Apache Spark-Analyse-Engine

In AWS Clean Rooms ist eine benutzerdefinierte Analyseregel eine neue Art von Analyseregel, mit der benutzerdefinierte Abfragen für die konfigurierte Tabelle ausgeführt werden können. Benutzerdefinierte SQL Abfragen sind weiterhin darauf beschränkt, nur die SELECT Befehl, kann aber mehr SQL Konstrukte als Aggregations - und Listenabfragen verwenden (z. B. Fensterfunktionen, OUTER JOINCTEs, oder Unterabfragen; eine vollständige Liste finden Sie in der AWS Clean Rooms SQLReferenz). Benutzerdefinierte SQL Abfragen müssen nicht wie Aggregations - und Listenabfragen einer Abfragestruktur folgen.

Die benutzerdefinierte Analyseregel unterstützt komplexere Anwendungsfälle als solche, die von der Aggregations- und Listenanalyseregel unterstützt werden können, z. B. benutzerdefinierte Attributionsanalysen, Benchmarking, Inkrementalitätsanalysen und Zielgruppenerkennung. Dies gilt zusätzlich zu einer Vielzahl von Anwendungsfällen, die von der Aggregations- und Listenanalyseregel unterstützt werden.

Die benutzerdefinierte Analyseregel unterstützt auch den differenziellen Datenschutz. Differential Privacy ist ein mathematisch strenges Rahmenwerk für den Datenschutz. Weitere Informationen finden Sie unter AWS Clean Rooms Differenzierter Datenschutz. Wenn Sie eine Analysevorlage erstellen, überprüft AWS Clean Rooms Differential Privacy die Vorlage, um festzustellen, ob sie mit der allgemeinen Abfragestruktur für Differential Privacy kompatibel ist. AWS Clean Rooms Durch diese Überprüfung wird sichergestellt, dass Sie keine Analysevorlage erstellen, die in einer durch Differential Privacy geschützten Tabelle nicht zulässig ist.

Um die benutzerdefinierte Analyseregel zu konfigurieren, können Datenbesitzer festlegen, dass bestimmte benutzerdefinierte Abfragen, die in Analysevorlagen gespeichert sind, für ihre konfigurierten Tabellen ausgeführt werden. Datenbesitzer überprüfen Analysevorlagen, bevor sie sie der zulässigen Analysesteuerung in der benutzerdefinierten Analyseregel hinzufügen. Analysevorlagen sind nur in der Kollaboration verfügbar und sichtbar, in der sie erstellt wurden (auch wenn die Tabelle mit anderen Kollaborationen verknüpft ist). Sie können nur von dem Mitglied ausgeführt werden, das in dieser Kollaboration Abfragen durchführen kann.

Alternativ können sich Mitglieder dafür entscheiden, anderen Mitgliedern (Abfrageanbietern) zu gestatten, Abfragen ohne Überprüfung zu erstellen. Mitglieder fügen in der benutzerdefinierten Analyseregel Konten von Abfrageanbietern hinzu, die über die zulässigen Abfrageanbieter verfügen. Wenn der Abfrageanbieter das Mitglied ist, das Abfragen durchführen kann, könnten sie jede Abfrage direkt in der konfigurierten Tabelle ausführen. Abfrageanbieter könnten Abfragen auch erstellen, indem sie Analysevorlagen erstellen. Alle Abfragen, die von den Abfrageanbietern erstellt wurden, dürfen automatisch für die Tabelle in allen Kollaborationen ausgeführt werden, in denen die AWS-Konto vorhanden und die Tabelle verknüpft ist.

Datenbesitzer können nur Analysevorlagen oder Konten erlauben, Abfragen zu erstellen, nicht beides. Wenn der Datenbesitzer dieses Feld leer lässt, kann das Mitglied, das Abfragen durchführen kann, keine Abfragen für die konfigurierte Tabelle ausführen.

Benutzerdefinierte Analyseregel, vordefinierte Struktur

Das folgende Beispiel enthält eine vordefinierte Struktur, die zeigt, wie Sie eine benutzerdefinierte Analyseregel mit aktiviertem differenziellen Datenschutz abschließen. Der userIdentifier Wert ist die Spalte, die Ihre Benutzer eindeutig identifiziert, z. B. user_id. Wenn Sie in einer Kollaboration zwei oder mehr Tabellen mit aktiviertem differenziellen Datenschutz haben, AWS Clean Rooms müssen Sie in beiden Analyseregeln dieselbe Spalte wie die Benutzer-ID-Spalte konfigurieren, um eine konsistente Definition der Benutzer in allen Tabellen aufrechtzuerhalten.

{ "allowedAnalyses": ["ANY_QUERY"] | string[], "allowedAnalysisProviders": [], "differentialPrivacy": { "columns": [ { "name": "userIdentifier" } ] } }

Führen Sie dazu einen der folgenden Schritte aus:

  • Fügen Sie der Steuerung „Zulässige Analysen“ eine Analysevorlage ARNs hinzu. In diesem Fall ist das allowedAnalysisProviders Steuerelement nicht enthalten.

    { allowedAnalyses: string[] }
  • Fügt AWS-Konto IDs dem allowedAnalysisProviders Steuerelement ein Mitglied hinzu. In diesem Fall fügen Sie dem allowedAnalyses Steuerelement etwas ANY_QUERY hinzu.

    { allowedAnalyses: ["ANY_QUERY"], allowedAnalysisProviders: string[] }

Beispiel für eine benutzerdefinierte Analyseregel

Das folgende Beispiel zeigt, wie zwei Unternehmen AWS Clean Rooms mithilfe der benutzerdefinierten Analyseregel zusammenarbeiten können.

Unternehmen A verfügt über Kunden- und Vertriebsdaten. Unternehmen A ist daran interessiert, die Umsatzsteigerung einer Werbekampagne auf der Website von Unternehmen B zu verstehen. Unternehmen B verfügt über Zuschauerdaten und Segmentattribute, die für Unternehmen nützlich sind (z. B. das Gerät, mit dem sie sich die Werbung angesehen haben).

Unternehmen A hat eine spezielle Inkrementalitätsabfrage, die im Rahmen der Zusammenarbeit ausgeführt werden soll.

Um eine Zusammenarbeit zu erstellen und gemeinsam eine benutzerdefinierte Analyse durchzuführen, gehen die Unternehmen wie folgt vor:

  1. Unternehmen A erstellt eine Kollaboration und erstellt eine Mitgliedschaft. Die Kollaboration hat Firma B als weiteres Mitglied der Kollaboration. Unternehmen A aktiviert die Abfrageprotokollierung in der Kollaboration und sie aktiviert die Abfrageprotokollierung in ihrem Konto.

  2. Unternehmen B erstellt eine Mitgliedschaft in der Kollaboration. Es aktiviert die Abfrageprotokollierung in seinem Konto.

  3. Firma A erstellt eine CRM konfigurierte Tabelle

  4. Unternehmen A fügt der konfigurierten Verkaufstabelle eine leere benutzerdefinierte Analyseregel hinzu.

  5. Firma A ordnet der Zusammenarbeit eine für den Vertrieb konfigurierte Tabelle zu.

  6. Unternehmen B erstellt eine für die Zuschauerzahl konfigurierte Tabelle.

  7. Unternehmen B fügt der für die Zuschauerzahl konfigurierten Tabelle eine leere benutzerdefinierte Analyseregel hinzu.

  8. Unternehmen B ordnet der Kollaboration eine für die Zuschauerzahl konfigurierte Tabelle zu.

  9. Unternehmen A zeigt die der Kollaboration zugeordnete Verkaufstabelle und die Tabelle mit den Zuschauerzahlen an und erstellt eine Analysevorlage, in der die Inkrementalitätsabfrage und der Parameter für den Kampagnenmonat hinzugefügt werden.

    { "analysisParameters": [ { "defaultValue": "" "type": "DATE" "name": "campaign_month" } ], "description": "Monthly incrementality query using sales and viewership data" "format": "SQL" "name": "Incrementality analysis" "source": "WITH labeleddata AS ( SELECT hashedemail, deviceid, purchases, unitprice, purchasedate, CASE WHEN testvalue IN ('value1', 'value2', 'value3') THEN 0 ELSE 1 END AS testgroup FROM viewershipdata ) SELECT labeleddata.purchases, provider.impressions FROM labeleddata INNER JOIN salesdata ON labeleddata.hashedemail = provider.hashedemail WHERE MONTH(labeleddata.purchasedate) > :campaignmonth AND testgroup = :group " }
  10. Unternehmen A fügt sein Konto (z. B. 444455556666) zur Steuerung des zulässigen Analyseanbieters in der benutzerdefinierten Analyseregel hinzu. Sie verwenden das Steuerelement für zugelassene Analyseanbieter, weil sie zulassen möchten, dass alle von ihnen erstellten Abfragen in ihrer für den Vertrieb konfigurierten Tabelle ausgeführt werden.

    { "allowedAnalyses": [ "ANY_QUERY" ], "allowedAnalysisProviders": [ "444455556666" ] }
  11. Unternehmen B sieht die erstellte Analysevorlage in der Kollaboration und überprüft ihren Inhalt, einschließlich der Abfragezeichenfolge und des Parameters.

  12. Unternehmen B stellt fest, dass die Analysevorlage den Anwendungsfall Inkrementalität erfüllt und die Datenschutzanforderungen hinsichtlich der Art und Weise, wie die für die Zuschauerzahl konfigurierte Tabelle abgefragt werden kann, erfüllt.

  13. Unternehmen B fügt die Analysevorlage ARN dem Steuerelement für zulässige Analysen in der benutzerdefinierten Analyseregel der Zuschauerzahltabelle hinzu. Sie verwenden die zulässige Analysesteuerung, weil sie nur zulassen möchten, dass die Inkrementalitätsabfrage für ihre für die Zuschauerzahl konfigurierte Tabelle ausgeführt wird.

    { "allowedAnalyses": [ "arn:aws:cleanrooms:us-east-1:111122223333:membership/41327cc4-bbf0-43f1-b70c-a160dddceb08/analysistemplate/1ff1bf9d-781c-418d-a6ac-2b80c09d6292" ] }
  14. Unternehmen A führt die Analysevorlage aus und verwendet den Parameterwert. 05-01-2023

Benutzerdefinierte Analyseregel mit differenziertem Datenschutz

In AWS Clean Rooms, die benutzerdefinierte Analyseregel unterstützt differenziellen Datenschutz. Differential Privacy ist ein mathematisch strenger Rahmen für den Datenschutz, der Ihnen hilft, Ihre Daten vor Reidentifikationsversuchen zu schützen.

Differential Privacy unterstützt aggregierte Analysen wie die Planung und post-ad-campaign Messung von Werbekampagnen, Benchmarking in einem Konsortium von Finanzinstituten und A/B-Tests für die Gesundheitsforschung.

Die unterstützte Abfragestruktur und Syntax sind in definiert. Struktur und Syntax der Abfrage

Beispiel für eine benutzerdefinierte Analyseregel mit differenziertem Datenschutz

Anmerkung

AWS Clean Rooms Differential Privacy ist nur für Kollaborationen verfügbar, die AWS Clean Rooms SQL als Analyse-Engine und in Amazon S3 gespeicherte Daten verwendet werden.

Sehen Sie sich das Beispiel für eine benutzerdefinierte Analyseregel an, das im vorherigen Abschnitt vorgestellt wurde. Dieses Beispiel zeigt, wie Sie Differential Privacy nutzen können, um Ihre Daten vor Reidentifikationsversuchen zu schützen und gleichzeitig Ihrem Partner die Möglichkeit zu geben, geschäftskritische Erkenntnisse aus Ihren Daten zu gewinnen. Gehen Sie davon aus, dass Unternehmen B, das über die Zuschauerdaten verfügt, seine Daten mithilfe von Differential Privacy schützen möchte. Um die Einrichtung des differenzierten Datenschutzes abzuschließen, führt Unternehmen B die folgenden Schritte durch:

  1. Unternehmen B aktiviert den differenziellen Datenschutz und fügt gleichzeitig eine benutzerdefinierte Analyseregel zur konfigurierten Tabelle für die Zuschauerzahl hinzu. Unternehmen B wählt diese viewershipdata.hashedemail Spalte als Benutzer-ID aus.

  2. Unternehmen B fügt der Zusammenarbeit eine differenzierte Datenschutzrichtlinie hinzu, um die Tabelle mit den Zuschauerzahlen für Abfragen verfügbar zu machen. Unternehmen B wählt die Standardrichtlinie aus, um die Einrichtung schnell abzuschließen.

Unternehmen A, das die Umsatzsteigerung einer Werbekampagne auf der Website von Unternehmen B verstehen möchte, führt die Analysevorlage aus. Da die Abfrage mit der allgemeinen Abfragestruktur von AWS Clean Rooms Differential Privacy kompatibel ist, wird die Abfrage erfolgreich ausgeführt.

Struktur und Syntax der Abfrage

Abfragen, die mindestens eine Tabelle enthalten, für die Differential Privacy aktiviert ist, müssen der folgenden Syntax entsprechen.

query_statement: [cte, ...] final_select cte: WITH sub_query AS ( inner_select [ UNION | INTERSECT | UNION_ALL | EXCEPT/MINUS ] [ inner_select ] ) inner_select: SELECT [user_id_column, ] expression [, ...] FROM table_reference [, ...] [ WHERE condition ] [ GROUP BY user_id_column[, expression] [, ...] ] [ HAVING condition ] final_select: SELECT [expression, ...] | COUNT | COUNT_DISTINCT | SUM | AVG | STDDEV FROM table_reference [, ...] [ WHERE condition ] [ GROUP BY expression [, ...] ] [ HAVING COUNT | COUNT_DISTINCT | SUM | AVG | STDDEV | condition ] [ ORDER BY column_list ASC | DESC ] [ OFFSET literal ] [ LIMIT literal ] expression: column_name [, ...] | expression AS alias | aggregation_functions | window_functions_on_user_id | scalar_function | CASE | column_name math_expression [, expression] window_functions_on_user_id: function () OVER (PARTITION BY user_id_column, [column_name] [ORDER BY column_list ASC|DESC])
Anmerkung

Beachten Sie bei der Struktur und Syntax von Differential Privacy Abfragen Folgendes:

  • Unterabfragen werden nicht unterstützt.

  • Common Table Expressions (CTEs) sollte die Benutzer-ID-Spalte ausgeben, wenn es sich um eine Tabelle oder CTE um Daten handelt, die durch Differential Privacy geschützt sind. Filter, Gruppierungen und Aggregationen sollten auf Benutzerebene vorgenommen werden.

  • Final_Select ermöglicht COUNTDISTINCT,, COUNTSUM, AVG und Aggregatfunktionen. STDDEV

Weitere Informationen darüber, welche SQL Schlüsselwörter für Differential Privacy unterstützt werden, finden Sie unter. SQLFunktionen von AWS Clean Rooms Differential Privacy