Machine learning - Amazon Redshift

Machine learning

El machine learning de Amazon Redshift (Amazon Redshift ML) es un servicio robusto basado en la nube que permite a los analistas y los científicos de datos con todos los niveles de habilidades usar tecnología de machine learning con más facilidad. Amazon Redshift ML utiliza un modelo para generar resultados. Puede utilizar modelos de las siguientes maneras:

  • Puede proporcionar los datos que desea para entrenar un modelo y los metadatos asociados a las entradas de datos a Amazon Redshift. A continuación, Amazon Redshift ML crea modelos en Amazon SageMaker capaces de detectar patrones en los datos de entrada. Al utilizar sus propios datos para el modelo, puede utilizar Amazon Redshift ML para identificar tendencias en los datos, como la predicción de la pérdida, el valor de por vida del cliente o la predicción de los ingresos. Puede utilizar estos modelos para generar predicciones para los nuevos datos de entrada sin incurrir en costos adicionales.

  • Puede utilizar uno de los modelos fundacionales (FM) proporcionados por Amazon Bedrock, como Claude o Amazon Titan. Con Amazon Bedrock, puede combinar la potencia de los modelos de lenguaje grande (LLM) con los datos de análisis en Amazon Redshift en unos pocos pasos. Si utiliza un modelo de lenguaje grande (LLM) externo, puede utilizar Amazon Redshift para realizar el procesamiento de lenguaje natural (NLP) en los datos. Puede utilizar el NLP para aplicaciones como la generación de texto, el análisis de opiniones o la traducción. Para obtener información acerca del uso de Amazon Bedrock con Amazon Redshift, consulte Integración de Amazon Redshift ML con Amazon Bedrock.

nota

Desactivación del uso de los datos para mejorar el servicio

Si utiliza modelos de Amazon Bedrock y no desea AWS para procesar los datos con fines de mejora del servicio, debe habilitar la política de exclusión de Amazon Bedrock.

nota

Los LLM pueden generar información imprecisa o incompleta. Recomendamos verificar la información que producen los LLM para garantizar que sea precisa y completa.

Funcionamiento de Amazon Redshift ML con Amazon SageMaker

Amazon Redshift opera con Amazon SageMaker Autopilot para obtener automáticamente el modelo más adecuado y hacer que la función de predicción esté disponible en Amazon Redshift.

En el siguiente diagrama, se ilustra cómo funciona Amazon Redshift ML.

Flujo de trabajo para la integración de Amazon Redshift ML con Piloto automático de Amazon SageMaker.

El flujo de trabajo general es el siguiente:

  1. Amazon Redshift exporta los datos de formación a Amazon S3.

  2. Amazon SageMaker Autopilot procesa previamente los datos de formación. El procesamiento previo cumple funciones esenciales, tales como la imputación de los valores faltantes. Reconoce que ciertas columnas son categóricas (como el código postal), les da el formato adecuado para la formación y realiza muchas otras tareas. Elegir los mejores preprocesadores que se aplicarán en el conjunto de datos de formación supone un problema en sí mismo, por lo que Amazon SageMaker Autopilot automatiza su solución.

  3. Amazon SageMaker Autopilot encuentra el algoritmo y los hiperparámetros del algoritmo que ofrecen el modelo con las predicciones más precisas.

  4. Amazon Redshift registra la función de predicción como una función SQL en el clúster de Amazon Redshift.

  5. Cuando se ejecutan instrucciones CREATE MODEL, Amazon Redshift utiliza Amazon SageMaker para la formación. Por lo tanto, la formación de su modelo conlleva un costo adicional. Se trata de una partida independiente en su factura de AWS por Amazon SageMaker. También se paga por el almacenamiento utilizado en Amazon S3 para guardar los datos de formación. No se cobra la inferencia mediante modelos creados con CREATE MODEL que puede compilar y ejecutar en su clúster de Redshift. No se aplican cargos adicionales a Amazon Redshift por utilizar Amazon Redshift ML.