Fórmula HRNN-Coldstart (legada)

nota

As fórmulas legadas do HRNN não estarão mais disponíveis. Esta documentação é apenas para referência.

Recomendamos usar a receita aws-user-personalizaton (Personalização do usuário) em vez das receitas antigas do HRNN. User-Personalization aprimora e unifica a funcionalidade oferecida pelas fórmulas do HRNN. Para obter mais informações, consulte Fórmula User-Personalization.

Use a fórmula HRNN-Coldstart para prever os itens com os quais um usuário interagirá quando você adicionar novos itens e interações com frequência e quiser obter recomendações para esses itens imediatamente. A fórmula HRNN-Coldstart é semelhante à fórmula HRNN-Metadata, mas permite que você obtenha recomendações para novos itens.

Além disso, é possível usar a fórmula HRNN-Coldstart quando quiser excluir do treinamento itens que têm uma longa lista de interações devido a uma tendência de popularidade recente, ou porque as interações podem ser altamente incomuns e introduzir ruído no treinamento. Com HRNN-Coldstart, é possível filtrar itens menos relevantes para criar um subconjunto para treinamento. O subconjunto de itens, chamado itens frios, são itens que têm eventos de interação relacionados no conjunto de dados de Interações com itens. Um item será considerado frio quando tiver o seguinte:

Um número de interações menor do que uma quantidade especificada de interações máximas. Especifique esse valor no hiperparâmetro cold_start_max_interactions da fórmula.
Uma duração relativa mais curta que a duração máxima. Especifique esse valor no hiperparâmetro cold_start_max_duration da fórmula.

Para reduzir o número de itens frios, defina um valor mais baixo para cold_start_max_interactions ou cold_start_max_duration. Para aumentar o número de itens frios, defina um valor maior para cold_start_max_interactions ou cold_start_max_duration.

HRNN-Coldstart tem os seguintes limites de itens frios:

Maximum cold start items: 80.000
Minimum cold start items: 100

Se o número de itens frios estiver fora desse intervalo, ocorrerá uma falha nas tentativas de criar uma solução.

A fórmula HRNN-Coldstart tem as seguintes propriedades:

Nome: aws-hrnn-coldstart
Fórmula nome do recurso da Amazon (ARN) – arn:aws:personalize:::recipe/aws-hrnn-coldstart
ARN do algoritmo – arn:aws:personalize:::algorithm/aws-hrnn-coldstart
ARN de transformação de atributos – arn:aws:personalize:::feature-transformation/featurize_coldstart
Tipo de fórmula – USER_PERSONALIZATION

Para obter mais informações, consulte Escolher uma fórmula.

A tabela a seguir descreve os hiperparâmetros da fórmula HRNN-Coldstart. Um hiperparâmetro é um parâmetro de algoritmo que pode ser ajustado para melhorar o desempenho do modelo. Os hiperparâmetros do algoritmo controlam o desempenho do modelo. Os hiperparâmetros de caracterização controlam como filtrar os dados a serem usados no treinamento. O processo de escolher o melhor valor para um hiperparâmetro é chamado de otimização de hiperparâmetros (HPO). Para obter mais informações, consulte Hiperparâmetros e HPO.

A tabela também fornece as seguintes informações para cada hiperparâmetro:

Intervalo: [limite inferior, limite superior]
Tipo de valor: inteiro, contínuo (float), categórico (booliano, lista, string)
HPO ajustável: o parâmetro pode participar da HPO?

Nome	Descrição
Hiperparâmetros de algoritmo
`hidden_dimension`	O número de variáveis ocultas usadas no modelo. Variáveis ocultas recriam o histórico de compras dos usuários e as estatísticas de itens para gerar pontuações de classificação. Especifique um número maior de dimensões ocultas quando o conjunto de dados de interações com itens incluir padrões mais complicados. Usar mais dimensões ocultas requer um conjunto de dados maior e mais tempo para processamento. Para decidir sobre o valor ideal, use HPO. Para usar a HPO, defina `performHPO` `true` ao chamar as operações CreateSolution e CreateSolutionVersion. Valor padrão: 149 Intervalo: [32, 256] Tipo de valor: inteiro Ajustável de HPO: sim
`bptt`	Determina se é necessário usar a técnica de propagação retroativa ao longo do tempo. A propagação retroativa ao longo do tempo é uma técnica que atualiza pesos em algoritmos baseados em rede neural recorrente. Use o `bptt` para créditos de longo prazo a fim de conectar prêmios atrasados a eventos iniciais. Por exemplo, um prêmio atrasado pode ser uma compra feita após vários cliques. Um evento inicial pode ser um clique inicial. Mesmo dentro dos mesmos tipos de evento, como um clique, é uma boa ideia considerar efeitos de longo prazo e maximizar os prêmios totais. Para considerar efeitos de longo prazo, use valores `bptt` maiores. O uso de um valor `bptt` maior exige conjuntos de dados maiores e mais tempo para processamento. Valor padrão: 32 Intervalo: [2, 32] Tipo de valor: inteiro Ajustável de HPO: sim
`recency_mask`	Determina se o modelo deve utilizar as tendências de popularidade mais recentes no conjunto de dados de interações com itens. As tendências de popularidade mais recentes podem incluir mudanças repentinas nos padrões subjacentes de eventos de interação. Para treinar um modelo que posiciona mais peso sobre eventos recentes, defina `recency_mask` como `true`. Para treinar um modelo que pese igualmente todas as interações passadas, defina `recency_mask` como `false`. Para obter boas recomendações usando um peso igual, talvez seja necessário um conjunto de dados de treinamento maior. Valor padrão: `True` Intervalo: `True` ou `False` Tipo de valor: booliano Ajustável de HPO: sim
Hiperparâmetros de caracterização
`cold_start_max_interactions`	O número máximo de interações entre usuários e itens que um item pode ter para ser considerado um item frio. Valor padrão: 15 Intervalo: inteiros positivos Tipo de valor: inteiro HPO ajustável: não
`cold_start_max_duration`	A duração máxima, em dias, em relação ao ponto de partida para que uma interação entre usuário e item seja considerada um item de partida a frio. Para definir o ponto de partida da interação entre usuários e itens, defina o hiperparâmetro `cold_start_relative_from`. Valor padrão: 5.0 Intervalo: flutuantes positivos Tipo de valor: flutuante HPO ajustável: não
`cold_start_relative_from`	Determina o ponto de partida para a fórmula HRNN-Coldstart calcular `cold_start_max_duration`. Para calcular a partir da hora atual, escolha `currentTime`. Para calcular `cold_start_max_duration` com base no carimbo de data e hora do item mais recente no conjunto de dados de interações com itens, selecione `latestItem`. Isso será útil se você adicionar novos itens com frequência. Valor padrão: `latestItem` Intervalo: `currentTime`, `latestItem` Tipo de valor: string HPO ajustável: não
`min_user_history_length_percentile`	O percentil mínimo dos comprimentos dos históricos de usuários para incluir no treinamento do modelo. Tamanho do histórico é a quantidade total de dados sobre um usuário. Use `min_user_history_length_percentile` para excluir uma porcentagem de usuários com históricos breves. Os usuários com um histórico breve geralmente mostram padrões baseados na popularidade dos itens em vez das necessidades ou dos desejos pessoais do usuário. Removê-los pode treinar modelos com mais foco nos padrões subjacentes nos dados. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos usuários, mas remova os casos de borda. Por exemplo, a definição de `min__user_history_length_percentile to 0.05` e `max_user_history_length_percentile to 0.95` inclui todos os usuários, exceto aqueles com comprimentos de histórico nos 5% inferiores ou superiores. Valor padrão: 0.0 Intervalo: [0,0, 1,0] Tipo de valor: flutuante HPO ajustável: não
`max_user_history_length_percentile`	O percentil máximo dos comprimentos dos históricos de usuários a ser incluído no treinamento do modelo. Tamanho do histórico é a quantidade total de dados sobre um usuário. Use `max_user_history_length_percentile` para excluir uma porcentagem de usuários com históricos longos, pois os dados desses usuários tendem a conter ruído. Por exemplo, um robô pode ter uma longa lista de interações automatizadas. A remoção desses usuários limita o ruído no treinamento. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos usuários, mas remova os casos de borda. Por exemplo, a definição de `min__user_history_length_percentile to 0.05` e `max_user_history_length_percentile to 0.95` inclui todos os usuários, exceto aqueles com comprimentos de histórico nos 5% inferiores ou superiores. Valor padrão: 0.99 Intervalo: [0,0, 1,0] Tipo de valor: flutuante HPO ajustável: não

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

HRNN-Metadata

Preparar os dados de treinamento