項目互動資料集 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

項目互動資料集

項目互動是指使用者與目錄中項目之間的正面互動事件。例如,觀看電影,查看列表或購買一雙鞋子的用戶。您可以將使用者與項目互動的相關資料匯入項目互動資料集。您可以記錄多種事件類型,例如點擊觀看喜歡

例如,如果使用者按一下特定項目,然後對該項目按,您可以讓 Amazon Personalize 使用這些事件做為訓練資料。對於每個事件,您都會記錄用戶的 ID,項目的 ID,時間戳(以 Unix 時間紀元格式)和事件類型(單擊)。然後,您會將這兩個項目互動事件新增至 I tem 互動資料集

對於所有使用案例 (網域資料集群組) 和配方 (自訂資源),您的項目互動資料必須具有下列項目:

  • 使用者與目錄中的項目互動至少 1000 筆項目互動記錄。這些互動可以來自大量匯入或串流事件,或兩者皆有。

  • 至少 25 個不重複的IDs用戶,每個用戶至少有兩個項目互動。

如需品質建議,我們建議您至少與 1,000 位使用者進行 50,000 次項目互動,每次有兩個以上的物品互動。

若要建立推薦人或自訂解決方案,您至少必須建立項目互動資料集。本節提供您可以匯入 Amazon Personalize 的下列項目互動資料類型的相關資訊。

事件類型和事件值資料

Item 互動資料集可以儲存每個互動的事件類型和事件值資料。只有自訂資源使用事件值資料。

事件類型資料

Amazon Personalize 會使用事件類型資料 (例如點擊購買資料) 來識別使用者的意圖和興趣。如果您建立網域推薦程式,則所有使用案例都需要事件類型資料。某些使用案例需要特定的事件類型。您可以自由使用其他事件類型。如需詳細資訊,請參閱選擇使用案例

如果您建立自訂資源,您可以依事件類型選擇用於訓練的事件。如果您的資料集在 EVENT _ TYPE 欄中有多個事件類型,而且您在設定自訂解決方案時並未提供事件類型,Amazon Personalize 會使用所有項目互動資料進行相等權重的訓練,而不論類型為何。如需詳細資訊,請參閱選擇用於訓練的項目互動資料

正面和負面事件類型

Amazon Personalize 化假定任何互動都是積極的。與負面事件類型的互動 (例如不喜歡) 不一定會讓項目出現在使用者 future 的建議中。

以下是有負面事件和用戶不利益影響建議的方法:

  • 對於所有網域使用案例和用戶個性化配方,Amazon Personalize 都可以使用曝光次數資料。如果項目出現在曝光次數資料中,而使用者沒有選擇該項目,則該項目不太可能出現在建議中。如需詳細資訊,請參閱印象資料

  • 如果您使用自訂資源並匯入正負事件類型,則只能訓練正面事件類型,然後篩選出使用者與負面互動的項目。如需詳細資訊,請參閱 選擇用於訓練的項目互動資料篩選建議和使用者區段

事件值資料 (自訂資源)

事件值資料可能是使用者觀看的電影的百分比,或評分超過 10。如果您建立自訂解決方案並匯入事件值資料以及事件類型資料,您可以根據類型和值選擇用於訓練的記錄。透過網域推薦程式,Amazon Personalize 不會使用事件值資料,而且您無法在訓練前篩選事件。

要根據類型和值選擇記錄,請記錄每個事件的事件類型和事件值。您為每個事件選擇的值取決於您要排除的資料以及要錄製的事件類型。例如,您可能會與使用者活動相符,例如使用者針對觀看事件類型看的影片百分比。

當您設定解決方案時,您可以將特定值設定為閾值,以從訓練中排除記錄。例如,如果手錶 EVENT _ 事件的 EVENT _ VALUE 資料是使用者看TYPE的視訊的百分比,如果您將事件值閾值設定為 0.5,而要看的事件類型,Amazon Personalize 只會使用 EVENT _ VALUE 大於或等於 0.5 的看互動事件來訓練模型。

如需詳細資訊,請參閱 選擇用於訓練的項目互動資料

關聯式詮釋

透過某些配方和建議使用案例,Amazon Personalize 可以使用情境中繼資料來識別基礎模式,以向您的使用者顯示最相關的項目。上下文元數據是您在事件發生時在用戶環境中收集的互動數據,例如其位置或設備類型。

包括上下文元數據可讓您為現有用戶提供更個性化的體驗。例如,如果客戶從手機存取您的目錄與電腦相比,購物方式不同,請加入使用者裝置的內容相關中繼資料。然後,建議將根據它們的瀏覽方式更加相關。

此外,關聯式中繼資料有助於減少新使用者或無法辨識的使用者的冷啟動階段。冷啟動階段是指由於缺少與該使用者相關的歷史資訊,建議引擎提供較不相關建議的期間。

對於網域資料集群組,下列建議使用案例可以使用關聯式中繼資料:

對於自訂資源,使用上下文中繼資料的方法包括以下內容:

如需有關內容相關資訊的詳細資訊,請參閱下列 M AWS achine Learning 部落格文章:利用情境資訊來增加 Amazon Personalize 建議的相關性

印象資料

曝光次數是使用者與特定項目互動 (例如,按一下或觀看) 時可見的項目清單。如果您使用提供個人化或用戶個性化配方的網域使用案例,Amazon Personalize 可以使用曝光次數資料來指導探索。

透過探索,建議包括一些通常不太可能推薦給使用者的項目或動作,例如新項目或動作、互動很少的項目或動作,或者根據使用者先前的行為較不相關的項目或動作。項目出現在曝光次數資料中的頻率越高,Amazon Personalize 在探索中包含該項目的可能性就越小。

當您建立推薦人或解決方案時,Amazon Personalize 一律會從訓練中排除曝光次數資料。這是因為 Amazon Personalize 不會使用曝光次數資料來訓練您的模型。相反,當您獲得指導用戶探索的建議時,它會使用它。

曝光值最多可包含 1000 個字元 (包括垂直列字元)。對於網域資料集群組,下列推薦使用案例可以使用曝光次數資料:

如需探索的更多資訊,請參閱探勘。Amazon Personalize 化可以建立兩種類型的展示:隱含印象明確曝光.

隱含印象

隱含曝光是您向使用者顯示的建議,從 Amazon Personalize 擷取。您可以將 RecommendationId (GetRecommendations和作業傳回) 納入為 future PutEvents 請求的輸入,將它們整合到您的建議工GetPersonalizedRanking作流程中。Amazon Personalize 會根據您的建議資料衍生出隱含的曝光次數。

例如,您可能有一個提供串流視訊建議的應用程式。您使用隱含曝光次數的建議工作流程可能如下所示:

  1. 您可以使用 Amazon Personalize GetRecommendations API 操作向其中一位使用者申請視訊推薦。

  2. Amazon Personalize 會使用您的模型 (解決方案版本) 為使用者產生建議,並在回API應recommendationId中傳回建議。

  3. 您可以在應用程式中向使用者顯示視訊建議。

  4. 當您的使用者與視訊互動 (例如,按一下) 時,請在呼叫中錄製選擇,PutEventsAPI並將其recommendationId作為參數加入。如需程式碼範例,請參閱記錄曝光數據

  5. Amazon Personalize 會使用從先前的影片建議衍生曝光資料,然後使用曝光次數資料來指導探索,其中 future 的建議包括互動資料較少或相關性較少的新影片。recommendationId

    如需使用隱含曝光資料記錄事件的詳細資訊,請參閱記錄曝光數據

明確曝光

明確曝光是您手動記錄並傳送給 Amazon Personalize 的曝光次數。使用明確的曝光來操控 Amazon Personalize 的結果。項目的順序沒有影響。

例如,您可能有一個提供鞋子建議的購物應用程式。如果您只推薦目前有庫存的鞋子,則可以使用明確的曝光指定這些項目。使用明確曝光次數的建議工作流程可能如下所示:

  1. 您可以使用 Amazon Personalize 功能向其中一位使用者申請建議GetRecommendationsAPI。

  2. Amazon Personalize 會使用您的模型 (解決方案版本) 為使用者產生建議,並在回API應中傳回建議。

  3. 您只向用戶展示有庫存的推薦鞋子。

  4. 對於即時增量資料匯入,當您的使用者與 (例如,按一下) 一雙鞋子進行互動時,您可以在呼叫中記錄選擇,PutEventsAPI並在impression參數中列出有庫存的建議項目。如需程式碼範例,請參閱記錄曝光數據

    若要在歷史項目互動資料中匯入曝光次數,您可以在 csv 檔案中列出明確的曝光次數,並以「|」字元分隔每個項目。垂直列字元會計入 1000 個字元限制。如需範例,請參閱格式化明確曝光

  5. Amazon Personalize 使用印象資料來指導探索,其中 future 的建議包括互動資料較少或相關性較少的新鞋款。