可変 - Amazon Fraud Detector

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

可変

変数は、不正行為の予測に使用したいデータ要素を表します。これらの変数は、モデルのトレーニング用に準備したイベントデータセット、Amazon Fraud Detector モデルのリスクスコア出力、または Amazon SageMaker モデルから取得できます。イベントデータセットから取得した変数の詳細については、を参照してくださいデータモデルエクスプローラーを使用してイベントデータセットの要件を取得

不正行為の予測に使用する変数は、まず作成してからイベントタイプを作成するときにイベントに追加する必要があります。作成する各変数には、データ型、デフォルト値、およびオプションで変数タイプを割り当てる必要があります。Amazon Fraud Detector は、IP アドレス、銀行識別番号 (BIN)、電話番号など、ユーザーが入力する変数の一部を強化して、これらの変数を使用するモデルの入力を増やし、パフォーマンスを向上させます。

データ型

変数には、その変数が表すデータ要素のデータ型が必要で、変数タイプオプションで定義済みのデータ型のいずれかを割り当てることができます。変数型に割り当てられた変数の場合、データ型は事前に選択されています。使用可能なデータ型には次の種類があります。

データ型 説明 デフォルト値 値の例
文字列 文字、整数、またはその両方の任意の組み合わせ <空>

abc、123、13B

整数 正または負の整数 0 1, -1
ブール値 True または False False True、False
DateTime ISO 8601 標準 UTC フォーマットでのみ指定されている日付と時刻 <空> 2019-11-30 13:01:01 Z
浮動小数点 小数点のある数字 0.0 4.01、0.10

デフォルト値

変数にはデフォルト値が必要です。Amazon Fraud Detector が不正行為の予測を生成すると、Amazon Fraud Detector が変数の値を受け取らない場合に、このデフォルト値を使用してルールまたはモデルが実行されます。指定するデフォルト値は、選択したデータ型と一致する必要があります。AWS コンソールでは、Amazon Fraud Detector は整数、ブール値、false浮動小数点数、文字列には (空) 0.0 のデフォルト値を割り当てます。0これらのデータ型のいずれにもカスタムデフォルト値を設定できます。

変数タイプ

変数を作成するときに、オプションでその変数を変数型に割り当てることができます。変数タイプは、モデルのトレーニングや不正予測の生成に使用される一般的なデータ要素を表します。モデルトレーニングに使用できるのは、関連する変数タイプを持つ変数のみです。モデルトレーニングプロセスの一環として、Amazon Fraud Detector は変数に関連付けられた変数タイプを使用して、変数の強化、機能エンジニアリング、およびリスクスコアリングを実行します。

Amazon Fraud Detector には、変数への割り当てに使用できる以下の変数タイプがあらかじめ定義されています。

カテゴリ 変数タイプ 説明 データ型
セッション IP_ADDRESS イベント中に収集されたIPアドレス 文字列 192.0.2.0

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。

USERAGENT イベント中に収集されたユーザーエージェント 文字列 Mozilla 5.0 (Windows NT 10.0、Win64、x64、rv: 68.0) Gecko 20100101
FINGERPRINT イベントに使用されるデバイスの固有識別子 文字列 sadfow987u234
SESSION_ID イベントのアクティブセッションのセッション ID 文字列 123456789
資格情報は有効ですか イベントログインに使用された認証情報が有効かどうかを示します ブール値 True
ユーザー EMAIL_ADDRESS イベント中に収集されたメールアドレス 文字列 abc@domain.com
PHONE_NUMBER イベント中に収集された電話番号 文字列 +1 555-0100

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。

請求 BILLING_NAME 請求先住所に関連する名前 文字列 John Doe
BILLING_PHONE 請求先住所に関連付けられている電話番号 文字列 +1 555-0100

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。

BILLING_ADDRESS_L1 請求先住所の最初の行 文字列 どの通りでも
請求先住所_L2 請求先住所の 2 行目 文字列 任意のユニット 123
ビリング・シティ 請求先住所にある都市 文字列 すべての都市
ビリング・ステート 請求先住所にある州または都道府県 文字列 すべての州または省
BILLING_COUNTRY 請求先住所の国 文字列 どの国でも

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。

BILLING_ZIP 請求先住所の郵便番号 文字列 01234

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。

配送 SHIPPING_NAME 配送先住所に関連する名前 文字列 John Doe
SHIPPING_PHONE 配送先住所に関連付けられている電話番号 文字列 +1 555-0100

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。

SHIPPING_ADDRESS_L1 配送先住所の最初の行 文字列 123 Any Street
SHIPPING_ADDRESS_L2 配送先住所の 2 行目 文字列 Unit 123
SHIPPING_CITY 配送先住所の都市 文字列 どの都市でも
SHIPPING_STATE 配送先住所にある州または都道府県 文字列 すべての州
SHIPPING_COUNTRY 配送先住所に記載されている国 文字列 どの国でも

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。

SHIPPING_ZIP 配送先住所の郵便番号 文字列 01234

注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。

支払い ORDER_ID トランザクションの固有識別子 文字列 LUX60
料金 注文金額の合計 文字列 560.00
CURRENCY ISO 4217 通貨コード 文字列 USD
PAYMENT_TYPE イベント中の支払いに使用される支払い方法 文字列 クレジットカード
AUTH_CODE クレジットカード発行会社または発行銀行から送信される英数字コード 文字列 0000
AVS カードプロセッサからの住所検証システム (AVS) 応答コード 文字列 Y
製品 PRODUCT_CATEGORY 注文商品の製品カテゴリ 文字列 キッチン
Custom NUMERIC 実数として表現できる任意の変数 浮動小数点 1.224
CATEGORICAL カテゴリ、セグメント、またはグループを記述する変数 文字列 ラージ
FREE_FORM_TEXT イベントの一部としてキャプチャされた自由形式のテキスト (カスタマーレビューやコメントなど) 文字列 フリーフォームテキスト入力の例

変数型への変数の割り当て

モデルのトレーニングに変数を使用する予定がある場合は、変数に割り当てる適切な変数タイプを選択することが重要です。変数型の割り当てが正しくないと、モデルのパフォーマンスに悪影響を及ぼす可能性があります。また、特に複数のモデルやイベントが変数を使用している場合は、後で割り当てを変更するのが非常に難しくなります。

変数には、定義済みの変数タイプまたはカスタム変数タイプ (、FREE_FORM_TEXTCATEGORICALまたは) のいずれかを割り当てることができます。NUMERIC

変数を適切な変数型に割り当てる際の重要な注意事項

  1. 変数が定義済みの変数型のいずれかに一致する場合は、それを使用します。変数タイプが変数に対応していることを確認してください。たとえば、変数タイプに ip_address 変数を割り当てても、ip_address EMAIL_ADDRESS 変数には ASN、ISP、位置情報、リスクスコアなどのエンリッチメントは追加されません。詳細については、「可変エンリッチメント」を参照してください。

  2. 変数が定義済みの変数タイプのいずれにも一致しない場合は、以下の推奨事項に従ってカスタム変数タイプの 1 つを割り当ててください。

  3. 通常、自然な順序付けがなく、カテゴリ、セグメント、またはグループに分類できる変数には、CATEGORICAL変数タイプを割り当てます。モデルのトレーニングに使用しているデータセットには、merchant_id、campaign_id、policy_id などの ID 変数が含まれている場合があります。これらの変数はグループを表します (たとえば、同じ policy_id を持つすべての顧客がグループを表します)。次のデータを含む変数には、CATEGORICAL 変数タイプを割り当てる必要があります-

    • 顧客ID、セグメントID、色ID、部門コード、製品IDなどのデータを含む変数

    • true、false、または NULL 値のブールデータを含む変数。

    • 会社名、製品カテゴリ、カードタイプ、紹介媒体などのグループまたはカテゴリに入れることができる変数。

    注記

    ENTITY_IDは Amazon 詐欺検出器が ENTITY_ID 変数に割り当てるために使用する予約済み変数タイプです。ENTITY_ID 変数は、評価するアクションを開始するエンティティの ID です。トランザクション詐欺インサイト (TFI) モデルタイプを作成する場合は、ENTITY_ID 変数を指定する必要があります。アクションを開始するエンティティを一意に識別するデータ内の変数を決定し、それを ENTITY_ID 変数として渡す必要があります。CATEGORICAL 変数タイプをデータセット内のその他すべての ID に割り当てます (存在する場合やモデルトレーニングに使用している場合)。データセットのエンティティではない他のIDの例としては、Merchant_ID、Policy_ID、Campaign_IDなどがあります

  4. テキストブロックを含む変数に変数タイプを割り当てますFREE_FORM_TEXTFREE_FORM_TEXT 変数タイプの例としては、ユーザーレビューコメント日付、紹介コードなどがあります。FREE_FORM_TEXT データには、区切り文字で区切られた複数のトークンが含まれています。区切り文字には、英数字とアンダースコア記号以外の任意の文字を使用できます。たとえば、ユーザーのレビューやコメントは「スペース」で区切ったり、日付や紹介コードではハイフンを区切ってプレフィックス、サフィックス、中間部分を区切ることができます。Amazon 詐欺検出器は区切り文字を使用して FREE_FORM_TEXT 変数からデータを抽出します。

  5. 実数で固有の順序を持つ変数には NUMERIC 変数型を割り当てます。数値変数の例としては、曜日、インシデントの重大度、顧客評価などがありますこれらの変数には CATEGORICAL 変数型を割り当てることができますが、固有の順序を持つすべての実数変数を NUMERIC 変数型に割り当てることを強くお勧めします。

可変エンリッチメント

Amazon Fraud Detector は、IP アドレス、銀行識別番号 (BIN)、電話番号など、ユーザーが提供した未加工のデータ要素の一部を強化して、これらのデータ要素を使用するモデルの追加入力やパフォーマンスの向上を図ります。このエンリッチメントは、疑わしいと思われる状況を特定し、モデルがより多くの不正行為を捉えるのに役立ちます。

電話番号の充実

Amazon Fraud Detector は、位置情報、元の配送業者、電話番号の有効性に関連する追加情報を電話番号データに追加します。電話番号のエンリッチメントは、2021 年 12 月 13 日以降にトレーニングを受け、電話番号に国コード (+xxx) が含まれるすべてのモデルで自動的に有効になります。モデルに電話番号変数を含めて、2021 年 12 月 13 日より前にトレーニングを行った場合は、この拡張機能を活用できるようにモデルを再トレーニングしてください。

データが正常にエンリッチ化されるように、電話番号変数には次の形式を使用することを強くお勧めします。

変数 [Format] (形式) 説明
PHONE_NUMBER E.164 スタンダード 電話番号には必ず国コード (+xxx) を含めてください。
請求先電話と配送先電話番号 E.164 スタンダード 電話番号には必ず国コード (+xxx) を含めてください。

位置情報エンリッチメント

2022 年 2 月 8 日以降、 Amazon Fraud Detector は、イベントについて指定した IP_ADDRESS、BILLING_ZIP、SHIPPING_ZIP の値の間の物理的な距離を計算します。計算された距離は、不正検知モデルへの入力として使用されます。

位置情報エンリッチメントを有効にするには、イベントデータに IP_ADDRESS、BILLING_ZIP、SHIPPING_ZIP の 3 つの変数のうち少なくとも 2 つが含まれている必要があります。さらに、BILLING_ZIPとSHIPPING_ZIPの各値には、それぞれ有効なBILLING_COUNTRYコードとSHIPPING_COUNTRYコードが必要です。2022年2月8日より前にトレーニングされたモデルにこれらの変数が含まれている場合は、モデルを再トレーニングして位置情報エンリッチメントを有効にする必要があります。

データが無効であるために Amazon Fraud Detector がイベントの IP_ADDRESS、BILLING_ZIP、または SHIPPING_ZIP 値に関連するロケーションを特定できない場合は、代わりに特別なプレースホルダー値が使用されます。たとえば、あるイベントの IP_ADDRESS と BILLING_ZIP の値は有効だが、SHIPPING_ZIP の値は有効ではないとします。この場合、エンリッチメントは IP_ADDRESS —> BILLING_ZIP に対してのみ行われます。IP_ADDRESS—>SHIPPING_ZIPとBILLING_ZIP—>SHIPPING_ZIPについてはエンリッチメントは行われません。代わりに、プレースホルダー値が代わりに使用されます。モデルで位置情報エンリッチメントが有効になっているかどうかに関係なく、モデルのパフォーマンスは変わりません。

BILLING_ZIP 変数と SHIPPING_ZIP 変数を CUSTOM_CATEGORICAL 変数タイプにマッピングすることで、位置情報エンリッチメントをオプトアウトできます。変数タイプを変更しても、モデルのパフォーマンスには影響しません。

位置情報変数形式

位置データを正しくエンリッチ化するために、位置情報変数には以下の形式を使用することを強くお勧めします。

変数 [Format] (形式) 説明
IP_ADDRESS IPv4 アドレス 例えば-1.1.1.1
請求先_郵便番号と配送_郵便番号 指定された国の ISO 3166-1 アルファ-2 郵便番号 詳細については、このトピックの「国と地域のコード」セクションを参照してください。
請求先の国と配送先の国 ISO 3166-1 アルファ-2 の 2 文字の標準国コード 詳細については、このトピックの「国と地域のコード」セクションを参照してください。Amazon Fraud Detector は、国名の一般的なバリエーションをすべてその ISO 3166-1 2 文字の標準国コードと一致させようとします。ただし、これらが正しく一致することは保証できません。

次の表は、Amazon Fraud Detector が位置情報エンリッチメントをサポートしている国と地域の一覧です。それぞれの国と地域には、国コード (具体的には ISO 3166-1 alpha-2 2 文字の国コード) と郵便番号が割り当てられています。

郵便番号の形式

  • 9-数字

  • A-レター

  • [X]-X はオプションです。たとえば、ガースニーの「GY9 [9] 9aa」は、「GY9 9aa」と「GY99 9aa」の両方が有効であることを意味します。1 つの形式を使用してください。

  • [X/XX]-X または XX のいずれかを使用できます。たとえば、バミューダ諸島の「aa [aa/99]」は、「aa aa」と「aa 99」の両方が有効であることを意味します。これらの形式のいずれかを使用しますが、両方は使用しないでください

  • 一部の国ではプレフィックスが固定されています。たとえば、アンドラの郵便番号は AD999 です。つまり、国コードはADの文字で始まり、その後に3つの数字が続く必要があります。

コード 名前 郵便番号
AD アンドラ 999
AR オランダ領アンティル 9999
AT オーストリア 9999
AU オーストラリア 9999
AZ アゼルバイジャン アリゾナ州 9999
BD バングラデシュ 9999
BE ベルギー 9999
BG ブルガリア 9999
BM バミューダ aa [aa/9]
BY ベラルーシ 999999
CA カナダ a9
CH スイス 9999
CL チリ 9999999
CO コロンビア 999999
CR コスタリカ 99999
CY キプロス 9999
CZ チェコ共和国 99 99
DE ドイツ 99999
DK デンマーク 9999
DO ドミニカ共和国 99999
DZ アルジェリア 99999
EE エストニア 99999
ES スペイン 99999
FI フィンランド 99999
FM ミクロネシア連邦 99999
FO フェロー諸島 999
FR フランス 99999
GB 英国 [a] 9 [a/9] aa
GG ガーンジー代官管轄区 GY9 [9] aa
GL グリーンランド 9999
GP グアドループ 99999
GT グアテマラ 99999
GU グアム 99999
HR クロアチア 99999
hu ハンガリー 9999
IE アイルランド a99 [a/9] [a/9] [a/9] [a/9]
IM マン島 IM9 [9] aa
IN インド 999999
IS アイスランド 999
IT イタリア 99999
JE ジャージー JE9 [9] aa
JP 日本 999-999
KR 大韓民国 99999
LI リヒテンシュタイン 9999
LK スリランカ 99999
LT リトアニア 99999
LU ルクセンブルグ 9999
LV ラトビア 9999
MC モナコ 99999
MD モルドバ共和国 9999
MH マーシャル諸島 99999
MK 北マケドニア 9999
MP 北マリアナ諸島 99999
MQ マティニーク 99999
MT マルタ AAA 999
MX メキシコ 99999
MY マレーシア 99999
NL オランダ 999
いいえ ノルウェー 9999
NZ ニュージーランド 9999
PH フィリピン 9999
PK パキスタン 99999
PL ポーランド 99-999
PR プエルトリコ 99999
PT ポルトガル 9999-999
PW パラオ 99999
RE

再会

99999
RO ルーマニア 999999
RU ロシア連邦 999999
SE スウェーデン 99 99
SG シンガポール 999999
SI スロベニア 9999
SK スロバキア 99 99
SM サンマリノ 99999
TH タイ 99999
TR トルコ 99999
UA ウクライナ 99999
US アメリカ 99999
UY ウルグアイ 99999
VI 米領バージン諸島 99999
WF ワリス・フツナ 99999
YT マヨット 99999
ZA 南アフリカ 9999

ユーザーエージェントエンリッチメント

アカウントテイクオーバーインサイト (ATI) モデルを作成する場合は、useragentデータセットに変数タイプの変数を指定する必要があります。この変数には、ログインイベントのブラウザ、デバイス、OS データが含まれます。Amazon Fraud Detector は、、user_agent_familyOS_familyなどの追加情報をユーザーエージェントデータに追加します。device_family