翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
可変
変数は、不正行為の予測に使用したいデータ要素を表します。これらの変数は、モデルのトレーニング用に準備したイベントデータセット、Amazon Fraud Detector モデルのリスクスコア出力、または Amazon SageMaker モデルから取得できます。イベントデータセットから取得した変数の詳細については、を参照してくださいデータモデルエクスプローラーを使用してイベントデータセットの要件を取得。
不正行為の予測に使用する変数は、まず作成してからイベントタイプを作成するときにイベントに追加する必要があります。作成する各変数には、データ型、デフォルト値、およびオプションで変数タイプを割り当てる必要があります。Amazon Fraud Detector は、IP アドレス、銀行識別番号 (BIN)、電話番号など、ユーザーが入力する変数の一部を強化して、これらの変数を使用するモデルの入力を増やし、パフォーマンスを向上させます。
データ型
変数には、その変数が表すデータ要素のデータ型が必要で、変数タイプオプションで定義済みのデータ型のいずれかを割り当てることができます。変数型に割り当てられた変数の場合、データ型は事前に選択されています。使用可能なデータ型には次の種類があります。
データ型 | 説明 | デフォルト値 | 値の例 |
---|---|---|---|
文字列 | 文字、整数、またはその両方の任意の組み合わせ | <空> |
abc、123、13B |
整数 | 正または負の整数 | 0 | 1, -1 |
ブール値 | True または False | False | True、False |
DateTime | ISO 8601 標準 UTC フォーマットでのみ指定されている日付と時刻 | <空> | 2019-11-30 13:01:01 Z |
浮動小数点 | 小数点のある数字 | 0.0 | 4.01、0.10 |
デフォルト値
変数にはデフォルト値が必要です。Amazon Fraud Detector が不正行為の予測を生成すると、Amazon Fraud Detector が変数の値を受け取らない場合に、このデフォルト値を使用してルールまたはモデルが実行されます。指定するデフォルト値は、選択したデータ型と一致する必要があります。AWS コンソールでは、Amazon Fraud Detector は整数、ブール値、false
浮動小数点数、文字列には (空) 0.0
のデフォルト値を割り当てます。0
これらのデータ型のいずれにもカスタムデフォルト値を設定できます。
変数タイプ
変数を作成するときに、オプションでその変数を変数型に割り当てることができます。変数タイプは、モデルのトレーニングや不正予測の生成に使用される一般的なデータ要素を表します。モデルトレーニングに使用できるのは、関連する変数タイプを持つ変数のみです。モデルトレーニングプロセスの一環として、Amazon Fraud Detector は変数に関連付けられた変数タイプを使用して、変数の強化、機能エンジニアリング、およびリスクスコアリングを実行します。
Amazon Fraud Detector には、変数への割り当てに使用できる以下の変数タイプがあらかじめ定義されています。
カテゴリ | 変数タイプ | 説明 | データ型 | 例 |
---|---|---|---|---|
セッション | IP_ADDRESS | イベント中に収集されたIPアドレス | 文字列 | 192.0.2.0 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。 |
USERAGENT | イベント中に収集されたユーザーエージェント | 文字列 | Mozilla 5.0 (Windows NT 10.0、Win64、x64、rv: 68.0) Gecko 20100101 | |
FINGERPRINT | イベントに使用されるデバイスの固有識別子 | 文字列 | sadfow987u234 | |
SESSION_ID | イベントのアクティブセッションのセッション ID | 文字列 | 123456789 | |
資格情報は有効ですか | イベントログインに使用された認証情報が有効かどうかを示します | ブール値 | True | |
ユーザー | EMAIL_ADDRESS | イベント中に収集されたメールアドレス | 文字列 | abc@domain.com |
PHONE_NUMBER | イベント中に収集された電話番号 | 文字列 | +1 555-0100 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。 |
|
請求 | BILLING_NAME | 請求先住所に関連する名前 | 文字列 | John Doe |
BILLING_PHONE | 請求先住所に関連付けられている電話番号 | 文字列 | +1 555-0100 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。 |
|
BILLING_ADDRESS_L1 | 請求先住所の最初の行 | 文字列 | どの通りでも | |
請求先住所_L2 | 請求先住所の 2 行目 | 文字列 | 任意のユニット 123 | |
ビリング・シティ | 請求先住所にある都市 | 文字列 | すべての都市 | |
ビリング・ステート | 請求先住所にある州または都道府県 | 文字列 | すべての州または省 | |
BILLING_COUNTRY | 請求先住所の国 | 文字列 | どの国でも 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。 |
|
BILLING_ZIP | 請求先住所の郵便番号 | 文字列 | 01234 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。 |
|
配送 | SHIPPING_NAME | 配送先住所に関連する名前 | 文字列 | John Doe |
SHIPPING_PHONE | 配送先住所に関連付けられている電話番号 | 文字列 | +1 555-0100 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「電話番号の充実」を参照してください。 |
|
SHIPPING_ADDRESS_L1 | 配送先住所の最初の行 | 文字列 | 123 Any Street | |
SHIPPING_ADDRESS_L2 | 配送先住所の 2 行目 | 文字列 | Unit 123 | |
SHIPPING_CITY | 配送先住所の都市 | 文字列 | どの都市でも | |
SHIPPING_STATE | 配送先住所にある州または都道府県 | 文字列 | すべての州 | |
SHIPPING_COUNTRY | 配送先住所に記載されている国 | 文字列 | どの国でも 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。 |
|
SHIPPING_ZIP | 配送先住所の郵便番号 | 文字列 | 01234 注:Amazon 詐欺検出器はこのデータを強化します。詳細については、「位置情報エンリッチメント」を参照してください。 |
|
支払い | ORDER_ID | トランザクションの固有識別子 | 文字列 | LUX60 |
料金 | 注文金額の合計 | 文字列 | 560.00 | |
CURRENCY | ISO 4217 通貨コード | 文字列 | USD | |
PAYMENT_TYPE | イベント中の支払いに使用される支払い方法 | 文字列 | クレジットカード | |
AUTH_CODE | クレジットカード発行会社または発行銀行から送信される英数字コード | 文字列 | 0000 | |
AVS | カードプロセッサからの住所検証システム (AVS) 応答コード | 文字列 | Y | |
製品 | PRODUCT_CATEGORY | 注文商品の製品カテゴリ | 文字列 | キッチン |
Custom | NUMERIC | 実数として表現できる任意の変数 | 浮動小数点 | 1.224 |
CATEGORICAL | カテゴリ、セグメント、またはグループを記述する変数 | 文字列 | ラージ | |
FREE_FORM_TEXT | イベントの一部としてキャプチャされた自由形式のテキスト (カスタマーレビューやコメントなど) | 文字列 | フリーフォームテキスト入力の例 |
変数型への変数の割り当て
モデルのトレーニングに変数を使用する予定がある場合は、変数に割り当てる適切な変数タイプを選択することが重要です。変数型の割り当てが正しくないと、モデルのパフォーマンスに悪影響を及ぼす可能性があります。また、特に複数のモデルやイベントが変数を使用している場合は、後で割り当てを変更するのが非常に難しくなります。
変数には、定義済みの変数タイプまたはカスタム変数タイプ (、FREE_FORM_TEXT
、CATEGORICAL
または) のいずれかを割り当てることができます。NUMERIC
変数を適切な変数型に割り当てる際の重要な注意事項
-
変数が定義済みの変数型のいずれかに一致する場合は、それを使用します。変数タイプが変数に対応していることを確認してください。たとえば、変数タイプに ip_address 変数を割り当てても、ip_address
EMAIL_ADDRESS
変数には ASN、ISP、位置情報、リスクスコアなどのエンリッチメントは追加されません。詳細については、「可変エンリッチメント」を参照してください。 -
変数が定義済みの変数タイプのいずれにも一致しない場合は、以下の推奨事項に従ってカスタム変数タイプの 1 つを割り当ててください。
-
通常、自然な順序付けがなく、カテゴリ、セグメント、またはグループに分類できる変数には、
CATEGORICAL
変数タイプを割り当てます。モデルのトレーニングに使用しているデータセットには、merchant_id、campaign_id、policy_id などの ID 変数が含まれている場合があります。これらの変数はグループを表します (たとえば、同じ policy_id を持つすべての顧客がグループを表します)。次のデータを含む変数には、CATEGORICAL 変数タイプを割り当てる必要があります--
顧客ID、セグメントID、色ID、部門コード、製品IDなどのデータを含む変数。
-
true、false、または NULL 値のブールデータを含む変数。
-
会社名、製品カテゴリ、カードタイプ、紹介媒体などのグループまたはカテゴリに入れることができる変数。
注記
ENTITY_ID
は Amazon 詐欺検出器が ENTITY_ID 変数に割り当てるために使用する予約済み変数タイプです。ENTITY_ID 変数は、評価するアクションを開始するエンティティの ID です。トランザクション詐欺インサイト (TFI) モデルタイプを作成する場合は、ENTITY_ID 変数を指定する必要があります。アクションを開始するエンティティを一意に識別するデータ内の変数を決定し、それを ENTITY_ID 変数として渡す必要があります。CATEGORICAL 変数タイプをデータセット内のその他すべての ID に割り当てます (存在する場合やモデルトレーニングに使用している場合)。データセットのエンティティではない他のIDの例としては、Merchant_ID、Policy_ID、Campaign_IDなどがあります。 -
-
テキストブロックを含む変数に変数タイプを割り当てます
FREE_FORM_TEXT
。FREE_FORM_TEXT 変数タイプの例としては、ユーザーレビュー、コメント、日付、紹介コードなどがあります。FREE_FORM_TEXT データには、区切り文字で区切られた複数のトークンが含まれています。区切り文字には、英数字とアンダースコア記号以外の任意の文字を使用できます。たとえば、ユーザーのレビューやコメントは「スペース」で区切ったり、日付や紹介コードではハイフンを区切ってプレフィックス、サフィックス、中間部分を区切ることができます。Amazon 詐欺検出器は区切り文字を使用して FREE_FORM_TEXT 変数からデータを抽出します。 -
実数で固有の順序を持つ変数には NUMERIC 変数型を割り当てます。数値変数の例としては、曜日、インシデントの重大度、顧客評価などがあります。これらの変数には CATEGORICAL 変数型を割り当てることができますが、固有の順序を持つすべての実数変数を NUMERIC 変数型に割り当てることを強くお勧めします。
可変エンリッチメント
Amazon Fraud Detector は、IP アドレス、銀行識別番号 (BIN)、電話番号など、ユーザーが提供した未加工のデータ要素の一部を強化して、これらのデータ要素を使用するモデルの追加入力やパフォーマンスの向上を図ります。このエンリッチメントは、疑わしいと思われる状況を特定し、モデルがより多くの不正行為を捉えるのに役立ちます。
電話番号の充実
Amazon Fraud Detector は、位置情報、元の配送業者、電話番号の有効性に関連する追加情報を電話番号データに追加します。電話番号のエンリッチメントは、2021 年 12 月 13 日以降にトレーニングを受け、電話番号に国コード (+xxx) が含まれるすべてのモデルで自動的に有効になります。モデルに電話番号変数を含めて、2021 年 12 月 13 日より前にトレーニングを行った場合は、この拡張機能を活用できるようにモデルを再トレーニングしてください。
データが正常にエンリッチ化されるように、電話番号変数には次の形式を使用することを強くお勧めします。
変数 | [Format] (形式) | 説明 |
---|---|---|
PHONE_NUMBER | E.164 スタンダード |
電話番号には必ず国コード (+xxx) を含めてください。 |
請求先電話と配送先電話番号 | E.164 スタンダード |
電話番号には必ず国コード (+xxx) を含めてください。 |
位置情報エンリッチメント
2022 年 2 月 8 日以降、 Amazon Fraud Detector は、イベントについて指定した IP_ADDRESS、BILLING_ZIP、SHIPPING_ZIP の値の間の物理的な距離を計算します。計算された距離は、不正検知モデルへの入力として使用されます。
位置情報エンリッチメントを有効にするには、イベントデータに IP_ADDRESS、BILLING_ZIP、SHIPPING_ZIP の 3 つの変数のうち少なくとも 2 つが含まれている必要があります。さらに、BILLING_ZIPとSHIPPING_ZIPの各値には、それぞれ有効なBILLING_COUNTRYコードとSHIPPING_COUNTRYコードが必要です。2022年2月8日より前にトレーニングされたモデルにこれらの変数が含まれている場合は、モデルを再トレーニングして位置情報エンリッチメントを有効にする必要があります。
データが無効であるために Amazon Fraud Detector がイベントの IP_ADDRESS、BILLING_ZIP、または SHIPPING_ZIP 値に関連するロケーションを特定できない場合は、代わりに特別なプレースホルダー値が使用されます。たとえば、あるイベントの IP_ADDRESS と BILLING_ZIP の値は有効だが、SHIPPING_ZIP の値は有効ではないとします。この場合、エンリッチメントは IP_ADDRESS —> BILLING_ZIP に対してのみ行われます。IP_ADDRESS—>SHIPPING_ZIPとBILLING_ZIP—>SHIPPING_ZIPについてはエンリッチメントは行われません。代わりに、プレースホルダー値が代わりに使用されます。モデルで位置情報エンリッチメントが有効になっているかどうかに関係なく、モデルのパフォーマンスは変わりません。
BILLING_ZIP 変数と SHIPPING_ZIP 変数を CUSTOM_CATEGORICAL 変数タイプにマッピングすることで、位置情報エンリッチメントをオプトアウトできます。変数タイプを変更しても、モデルのパフォーマンスには影響しません。
位置情報変数形式
位置データを正しくエンリッチ化するために、位置情報変数には以下の形式を使用することを強くお勧めします。
変数 | [Format] (形式) | 説明 |
---|---|---|
IP_ADDRESS | IPv4 アドレス |
例えば-1.1.1.1 |
請求先_郵便番号と配送_郵便番号 | 指定された国の ISO 3166-1 アルファ-2 郵便番号 |
詳細については、このトピックの「国と地域のコード」セクションを参照してください。 |
請求先の国と配送先の国 | ISO 3166-1 アルファ-2 |
詳細については、このトピックの「国と地域のコード」セクションを参照してください。Amazon Fraud Detector は、国名の一般的なバリエーションをすべてその ISO 3166-1 2 文字の標準国コードと一致させようとします。ただし、これらが正しく一致することは保証できません。 |
次の表は、Amazon Fraud Detector が位置情報エンリッチメントをサポートしている国と地域の一覧です。それぞれの国と地域には、国コード (具体的には ISO 3166-1 alpha-2 2 文字の国コード) と郵便番号が割り当てられています。
郵便番号の形式
9-数字
A-レター
[X]-X はオプションです。たとえば、ガースニーの「GY9 [9] 9aa」は、「GY9 9aa」と「GY99 9aa」の両方が有効であることを意味します。1 つの形式を使用してください。
[X/XX]-X または XX のいずれかを使用できます。たとえば、バミューダ諸島の「aa [aa/99]」は、「aa aa」と「aa 99」の両方が有効であることを意味します。これらの形式のいずれかを使用しますが、両方は使用しないでください。
一部の国ではプレフィックスが固定されています。たとえば、アンドラの郵便番号は AD999 です。つまり、国コードはADの文字で始まり、その後に3つの数字が続く必要があります。
コード | 名前 | 郵便番号 |
---|---|---|
AD | アンドラ | 999 |
AR | オランダ領アンティル | 9999 |
AT | オーストリア | 9999 |
AU | オーストラリア | 9999 |
AZ | アゼルバイジャン | アリゾナ州 9999 |
BD | バングラデシュ | 9999 |
BE | ベルギー | 9999 |
BG | ブルガリア | 9999 |
BM | バミューダ | aa [aa/9] |
BY | ベラルーシ | 999999 |
CA | カナダ | a9 |
CH | スイス | 9999 |
CL | チリ | 9999999 |
CO | コロンビア | 999999 |
CR | コスタリカ | 99999 |
CY | キプロス | 9999 |
CZ | チェコ共和国 | 99 99 |
DE | ドイツ | 99999 |
DK | デンマーク | 9999 |
DO | ドミニカ共和国 | 99999 |
DZ | アルジェリア | 99999 |
EE | エストニア | 99999 |
ES | スペイン | 99999 |
FI | フィンランド | 99999 |
FM | ミクロネシア連邦 | 99999 |
FO | フェロー諸島 | 999 |
FR | フランス | 99999 |
GB | 英国 | [a] 9 [a/9] aa |
GG | ガーンジー代官管轄区 | GY9 [9] aa |
GL | グリーンランド | 9999 |
GP | グアドループ | 99999 |
GT | グアテマラ | 99999 |
GU | グアム | 99999 |
HR | クロアチア | 99999 |
hu | ハンガリー | 9999 |
IE | アイルランド | a99 [a/9] [a/9] [a/9] [a/9] |
IM | マン島 | IM9 [9] aa |
IN | インド | 999999 |
IS | アイスランド | 999 |
IT | イタリア | 99999 |
JE | ジャージー | JE9 [9] aa |
JP | 日本 | 999-999 |
KR | 大韓民国 | 99999 |
LI | リヒテンシュタイン | 9999 |
LK | スリランカ | 99999 |
LT | リトアニア | 99999 |
LU | ルクセンブルグ | 9999 |
LV | ラトビア | 9999 |
MC | モナコ | 99999 |
MD | モルドバ共和国 | 9999 |
MH | マーシャル諸島 | 99999 |
MK | 北マケドニア | 9999 |
MP | 北マリアナ諸島 | 99999 |
MQ | マティニーク | 99999 |
MT | マルタ | AAA 999 |
MX | メキシコ | 99999 |
MY | マレーシア | 99999 |
NL | オランダ | 999 |
いいえ | ノルウェー | 9999 |
NZ | ニュージーランド | 9999 |
PH | フィリピン | 9999 |
PK | パキスタン | 99999 |
PL | ポーランド | 99-999 |
PR | プエルトリコ | 99999 |
PT | ポルトガル | 9999-999 |
PW | パラオ | 99999 |
RE |
再会 |
99999 |
RO | ルーマニア | 999999 |
RU | ロシア連邦 | 999999 |
SE | スウェーデン | 99 99 |
SG | シンガポール | 999999 |
SI | スロベニア | 9999 |
SK | スロバキア | 99 99 |
SM | サンマリノ | 99999 |
TH | タイ | 99999 |
TR | トルコ | 99999 |
UA | ウクライナ | 99999 |
US | アメリカ | 99999 |
UY | ウルグアイ | 99999 |
VI | 米領バージン諸島 | 99999 |
WF | ワリス・フツナ | 99999 |
YT | マヨット | 99999 |
ZA | 南アフリカ | 9999 |
ユーザーエージェントエンリッチメント
アカウントテイクオーバーインサイト (ATI) モデルを作成する場合は、useragent
データセットに変数タイプの変数を指定する必要があります。この変数には、ログインイベントのブラウザ、デバイス、OS データが含まれます。Amazon Fraud Detector は、、user_agent_family
OS_family
などの追加情報をユーザーエージェントデータに追加します。device_family