トレーニング時に使用する列の設定 - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トレーニング時に使用する列の設定

重要

ソリューションを作成した後は、その設定を変更することはできません。デフォルトでは、すべての新しいソリューションで自動トレーニングが使用されます。自動トレーニングでは、ソリューションがアクティブになっている間にトレーニングコストが発生します。不要なコストを避けるため、作業が終了したらソリューションを削除してください。トレーニングコストの詳細については、「Amazon Personalize の料金」を参照してください。

レシピがアイテムのレコメンデーションまたはユーザーセグメントを生成する場合、Amazon Personalize がソリューションバージョンの作成 (モデルのトレーニング) 時に考慮する列を変更できます。

トレーニング時に使用する列を変更して、Amazon Personalize がモデルのトレーニング (ソリューションバージョンの作成) に使用するデータを制御できます。これにより、トレーニングデータのさまざまな組み合わせを試してみることができます。または、意味のあるデータがない列を除外することもできます。例えば、レコメンデーションのフィルタリングにのみ使用したい列があるとします。この列をトレーニングから除外すると、Amazon Personalize はフィルタリング時にのみこの列を考慮します。

EVENT_TYPE 列を除外することはできません。デフォルトでは、Amazon Personalize はトレーニング時に使用できるすべての列を使用します。次のデータは、常にトレーニングから除外されます。

トレーニングにインプレッションデータを含めることはできませんが、ユースケースやレシピでそのデータが使用されている場合、Amazon Personalize はインプレッションデータを使用してレコメンデーションを取得するときに探索をガイドします。

ソリューションをすでに作成していて、トレーニング時に使用する列を変更したい場合は、ソリューションを複製できます。ソリューションを複製するときは、レシピやハイパーパラメータなど、既存のソリューションの構成を出発点として使用し、必要に応じて変更を加えることができます。詳細については、「ソリューションの複製 (コンソール)」を参照してください。

Amazon Personalize コンソール、 AWS Command Line Interface (AWS CLI)、または AWS SDK を使用してトレーニングするときに Amazon Personalize が使用する列を設定できます。Amazon Personalize コンソールで列を選択する方法については、「ソリューションの作成 (コンソール)」の詳細設定ステップを参照してください。ソリューションを作成したら、ソリューションが使用する列を Amazon Personalize コンソールのソリューションの詳細ページに表示するか、DescribeSolution のオペレーションで表示できます。

トレーニング時に使用する列の設定 (AWS CLI)

列をトレーニングから除外するには、ソリューション構成の一部として trainingDataConfigexcludedDatasetColumns オブジェクトを指定します。キーごとに、データセットタイプを指定します。値ごとに、除外する列のリストを指定します。次のコードは、 AWS CLIを使用してソリューションを作成するときに列を除外する方法を示しています。

aws personalize create-solution \ --name solution name \ --dataset-group-arn dataset group ARN \ --recipe-arn recipe ARN \ --solution-config "{\"trainingDataConfig\": {\"excludedDatasetColumns\": { \"datasetType\" : [ \"column1Name\", \"column2Name\"]}}}"

トレーニング時に使用される列の設定 (AWS SDKs)

列をトレーニングから除外するには、ソリューション構成の一部として trainingDataConfigexcludedDatasetColumns オブジェクトを指定します。キーごとに、データセットタイプを指定します。値ごとに、除外する列のリストを指定します。次のコードは、SDK for Python (Boto3) を使用してソリューションを作成するときに、列を除外する方法を示しています。

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', recipeArn = 'recipe ARN', datasetGroupArn = 'dataset group ARN', solutionConfig = { "trainingDataConfig": { "excludedDatasetColumns": { "datasetType": ["COLUMN_A", "COLUMN_B"] } } } ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)