

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de conjuntos de datos usando nuevos orígenes de datos
<a name="creating-data-sets-new"></a>

Al crear un conjunto de datos basado en un AWS servicio como Amazon RDS, Amazon Redshift o Amazon EC2, es posible que se apliquen cargos por transferencia de datos al consumir datos de esa fuente. Estos cargos también pueden variar en función de si ese AWS recurso se encuentra en la casa Región de AWS que has elegido para tu cuenta de Amazon Quick. Para obtener más información sobre precios, consulte la página de precios del servicio en cuestión.

Al crear un nuevo conjunto de datos de base de datos, puede seleccionar una tabla, unir varias tablas o crear una consulta SQL para recuperar los datos que desee. También puede cambiar si el conjunto de datos utiliza una consulta directa o almacena los datos en [SPICE](spice.md).

**Creación de un nuevo conjunto de datos**

1. Para crear un conjunto de datos, selecciona **Nuevo conjunto de datos** en la página **de datos**. A continuación, podrá crear un conjunto de datos basado en un conjunto de datos o un origen de datos existente o conectarse a un nuevo origen de datos y basar el conjunto de datos en ello.

1. Proporcione la información de conexión al origen de datos:
   + Para archivos de texto o Microsoft Excel locales, puede simplemente identificar la ubicación del archivo y cargarlo.
   + En el caso de Amazon S3, debe proporcionar un manifiesto que identifique los archivos o buckets que desee utilizar y también la configuración de importación de los archivos de destino.
   + En el caso de Amazon Athena, se devuelven todas las bases de datos de Athena de su AWS cuenta. No se requieren credenciales adicionales.
   + Para Salesforce, proporcione credenciales con las que conectarse.
   + Para Amazon Redshift, Amazon RDS, Amazon EC2 u otros orígenes de datos de base de datos, proporcione información sobre el servidor y la base de datos que alojan los datos. Proporcione también credenciales válidas para esa instancia de base de datos.

# Creación de un conjunto de datos a partir de una base de datos
<a name="create-a-database-data-set"></a>

Los siguientes procedimientos le ayudarán a conectar con orígenes de datos de bases de datos y crear conjuntos de datos. Para crear conjuntos de datos a partir de fuentes de AWS datos que su cuenta Amazon Quick descubrió automáticamente, utilice. [Creación de un conjunto de datos desde un clúster de Amazon Redshift o una instancia de Amazon RDS detectados automáticamente](#create-a-data-set-autodiscovered) Para crear conjuntos de datos a partir de cualquier otro origen de datos de base de datos, utilice [Creación de un conjunto de datos utilizando una base de datos no detectada automáticamente](#create-a-data-set-database). 

## Creación de un conjunto de datos desde un clúster de Amazon Redshift o una instancia de Amazon RDS detectados automáticamente
<a name="create-a-data-set-autodiscovered"></a>

Utilice el siguiente procedimiento para crear una conexión con un origen de datos de AWS detectado automáticamente.

**Para crear una conexión a una fuente de datos detectada automáticamente AWS**

1. Consulte [Cuotas de origen de datos](data-source-limits.md) para asegurarse de que su consulta o tabla de destino no supere las cuotas del origen de datos.

1. Confirme que las credenciales de la base de datos que piensa utilizar tienen permisos apropiados como se describe en [Permisos necesarios](required-permissions.md). 

1. Asegúrese de haber configurado el clúster o la instancia para Amazon Quick Access siguiendo las instrucciones que se indican en[Requisitos de configuración de la red y de la base de datos](configure-access.md).

1. En la página de inicio rápido de Amazon, selecciona **Datos**.

1. Selecciona **Crear** y, a continuación, selecciona **Nuevo conjunto de datos**.

1. Elija el icono de detección automática de **RDS** o **Redshift**, según AWS el servicio al que desee conectarse.

1. Escriba la información de conexión del origen de datos, tal y como se indica a continuación:
   + En **Nombre de origen de datos**, escriba un nombre para el origen de datos.
   + En **ID de instancia**, elija el nombre de la instancia o clúster al que desea conectar.
   + **Nombre de base de datos** muestra la base de datos predeterminada del clúster o instancia de **ID de instancia**. Para utilizar una base de datos diferente en ese clúster o instancia, escriba su nombre.
   + Para ello **UserName**, introduzca el nombre de usuario de una cuenta de usuario que tenga permisos para hacer lo siguiente: 
     + Acceder a la base de datos de destino. 
     + Leer las tablas de esa base de datos que desee utilizar (realizar una instrucción `SELECT` en ellas).
   + En **Contraseña**, introduzca la contraseña de la cuenta que ha introducido.

1. Elija **Validate connection** para verificar que la información de conexión es correcta.

1. Si la conexión se valida, elija **Crear origen de datos**. En caso contrario, corrija la información de la conexión y vuelve a validar de nuevo.
**nota**  
Amazon Quick protege automáticamente las conexiones a las instancias de Amazon RDS y a los clústeres de Amazon Redshift mediante Secure Sockets Layer (SSL). No tiene que hacer nada más para habilitarlo.

1. Seleccione una de las siguientes opciones:
   + **SQL personalizada**

     En la siguiente pantalla, puede elegir escribir una consulta con la opción **Usar consulta SQL personalizada**. Al hacer esto se abre una pantalla llamada **Escriba la consulta SQL personalizada**, donde podrá escribir el nombre de la consulta y escribir, a continuación, la SQL. Para obtener los mejores resultados, cree la consulta en un editor de SQL y, a continuación, péguela en esta ventana. Después de asignar el nombre y de escribir la consulta, puede elegir **Editar/obtener vista previa de los datos** o **Confirmar consulta**. Elija **Editar/obtener vista previa de los datos** para ir de forma inmediata a la preparación de datos. Elija **Confirmar consulta** para validar la SQL y asegurarse de que no haya errores.
   + **Elección de tablas**

     Para conectarse a tablas específicas, en **Esquema: contiene conjuntos de tablas**, elija **Seleccionar** y, a continuación, elija un esquema. En algunos casos en los que no hay un único esquema en la base de datos, dicho esquema se elige de forma automática, en cuyo caso la opción de selección de esquema no se muestra.

     Para preparar los datos antes de crear un análisis, elija **Editar/obtener vista previa de los datos** para abrir la preparación de datos. Utilice esta opción si desea unirse a más tablas.

     De lo contrario, después de elegir una tabla, elija **Seleccionar**.

1. Elija una de las siguientes opciones:
   + Prepare los datos antes de crear un análisis. Para ello, elija **Editar/obtener vista previa de los datos** para abrir la preparación de datos para la tabla seleccionada. Para obtener más información sobre la preparación de datos, consulte [Preparación de ejemplos de un conjunto de datos](preparing-data-sets.md).
   + Cree un conjunto de datos y análisis mediante los datos de la tabla tal cual y para importar los datos del conjunto de datos a SPICE para mejorar el rendimiento (recomendado). Para ello, verifique el tamaño de la tabla y el indicador SPICE para ver si tiene suficiente capacidad.

     Si tiene suficiente capacidad de SPICE, elija el botón de opción **Importar a SPICE para agilizar el análisis** y, a continuación, cree un análisis eligiendo **Visualizar**.
**nota**  
Si desea utilizar SPICE y no tiene espacio suficiente, elija **Editar/obtener vista previa de los datos**. En la preparación de datos, puede quitar campos del conjunto de datos para reducir su tamaño. También puede aplicar un filtro o escribir una consulta SQL que reduzca el número de filas o columnas devueltas. Para obtener más información sobre la preparación de datos, consulte [Preparación de ejemplos de un conjunto de datos](preparing-data-sets.md).
   + Para crear un conjunto de datos y un análisis utilizando datos de una tabla tal y como están, y para realizar consultas en los datos directamente desde la base de datos, elija el botón de opción **Realizar una consulta directamente sobre los datos**. A continuación, cree un análisis seleccionando **Visualizar**.

## Creación de un conjunto de datos utilizando una base de datos no detectada automáticamente
<a name="create-a-data-set-database"></a>

Utilice el siguiente procedimiento para crear una conexión a cualquier base de datos que no sea un clúster de Amazon Redshift o una instancia de Amazon RDS detectados automáticamente. Estas bases de datos incluyen clústeres de Amazon Redshift e instancias de Amazon RDS que se encuentran en una cuenta diferente Región de AWS o que están asociadas a una cuenta diferente. AWS También pueden ser instancias de MariaDB, Microsoft SQL Server, MySQL, Oracle y PostgreSQL que estén en las instalaciones, en Amazon EC2 o en algún otro entorno accesible.

**Creación de una conexión a una base de datos que no sea un clúster de Amazon Redshift o una instancia de RDS detectados automáticamente**

1. Consulte [Cuotas de origen de datos](data-source-limits.md) para asegurarse de que su consulta o tabla de destino no supere las cuotas del origen de datos.

1. Confirme que las credenciales de la base de datos que piensa utilizar tienen permisos apropiados como se describe en [Permisos necesarios](required-permissions.md). 

1. Asegúrese de haber configurado el clúster o la instancia para Amazon Quick Access siguiendo las instrucciones que se indican en[Requisitos de configuración de la red y de la base de datos](configure-access.md).

1. En la página de inicio rápido de Amazon, selecciona **Administrar datos**.

1. Selecciona **Crear** y, a continuación, selecciona **Nuevo conjunto de datos**.

1. Elija el icono de **conexión manual de Redshift** si desea conectarse a un clúster de Amazon Redshift en Región de AWS otro o asociado a una cuenta diferente. AWS O bien, elija el sistema de administración de bases de datos adecuado para conectarse a una instancia de Amazon Aurora, MariaDB, Microsoft SQL Server, MySQL, Oracle o PostgreSQL.

1. Escriba la información de conexión del origen de datos, tal y como se indica a continuación:
   + En **Nombre de origen de datos**, escriba un nombre para el origen de datos.
   + En **Servidor de base de datos**, escriba uno de los siguientes valores:
     + En un clúster de Amazon Redshift o una instancia de Amazon RDS, escriba el punto de conexión del clúster o instancia sin el número de puerto. Por ejemplo, si el valor del punto enlace es `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`, escriba `clustername.1234abcd.us-west-2.redshift.amazonaws.com`. Puede obtener el valor del punto final en el campo **Punto final** de la página de detalles del clúster o la instancia de la AWS consola.
     + Si se trata de una instancia de Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle o PostgreSQL, escriba la dirección de DNS público. Puede obtener el valor del DNS público en el campo **DNS público** del panel de detalles de la instancia de la consola de Amazon EC2.
     + Para una instancia que no sea de Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle o PostgreSQL, escriba el nombre de host o dirección IP pública del servidor de base de datos. Si utiliza la capa de conexión segura (SSL) para una conexión segura (lo que se recomienda), probablemente deberá indicar el nombre de host que corresponda a la información requerida por el certificado SSL. Para ver una lista de certificados aceptados, consulte [Certificados Amazon Quick SSL y CA](configure-access.md#ca-certificates).
   + En **Puerto**, escriba el puerto que el clúster o la instancia utiliza para las conexiones.
   + En **Nombre de base de datos**, escriba el nombre de la base de datos que desee utilizar.
   + Para ello **UserName**, introduzca el nombre de usuario de una cuenta de usuario que tenga permisos para hacer lo siguiente: 
     + Acceder a la base de datos de destino. 
     + Leer las tablas de esa base de datos que desee utilizar (realizar una instrucción `SELECT` en ellas).
   + En **Contraseña**, escriba la contraseña asociada a la cuenta que ha introducido.

1. (Opcional) Si se conecta a un elemento que no sea un clúster de Amazon Redshift y *no* quiere una conexión protegida, asegúrese de que no marca **Habilitar SSL**. *Recomendamos encarecidamente dejarla marcada*, ya que una conexión no protegida puede estar expuesta a intrusiones. 

   Para obtener más información acerca de cómo la instancia de destino utiliza SSL para proteger las conexiones, consulte la documentación del sistema de administración de base de datos de destino. Amazon Quick no acepta certificados SSL autofirmados como válidos. Para ver una lista de certificados aceptados, consulte [Certificados Amazon Quick SSL y CA](configure-access.md#ca-certificates).

   Amazon Quick protege automáticamente las conexiones a los clústeres de Amazon Redshift mediante SSL. No tiene que hacer nada más para habilitarlo.

   Algunas bases de datos, como Presto y Apache Spark, deben cumplir requisitos adicionales para que Amazon Quick pueda conectarse. Para obtener más información, consulte [Creación de un origen de datos con Presto](create-a-data-source-presto.md) o [Creación de un origen de datos con Apache Spark](create-a-data-source-spark.md).

1. (Opcional) Elija **Validar conexión** para verificar que la información de conexión es correcta.

1. Si la conexión se valida, elija **Crear origen de datos**. En caso contrario, corrija la información de la conexión y vuelve a validar de nuevo.

1. Seleccione una de las siguientes opciones:
   + **SQL personalizada**

     En la siguiente pantalla, puede elegir escribir una consulta con la opción **Usar consulta SQL personalizada**. Al hacer esto se abre una pantalla llamada **Escriba la consulta SQL personalizada**, donde podrá escribir el nombre de la consulta y escribir, a continuación, la SQL. Para obtener los mejores resultados, cree la consulta en un editor de SQL y, a continuación, péguela en esta ventana. Después de asignar el nombre y de escribir la consulta, puede elegir **Editar/obtener vista previa de los datos** o **Confirmar consulta**. Elija **Editar/obtener vista previa de los datos** para ir de forma inmediata a la preparación de datos. Elija **Confirmar consulta** para validar la SQL y asegurarse de que no haya errores.
   + **Elección de tablas**

     Para conectarse a tablas específicas, en **Esquema: contiene conjuntos de tablas**, elija **Seleccionar** y, a continuación, elija un esquema. En algunos casos en los que no hay un único esquema en la base de datos, dicho esquema se elige de forma automática, en cuyo caso la opción de selección de esquema no se muestra.

     Para preparar los datos antes de crear un análisis, elija **Editar/obtener vista previa de los datos** para abrir la preparación de datos. Utilice esta opción si desea unirse a más tablas.

     De lo contrario, después de elegir una tabla, elija **Seleccionar**.

1. Elija una de las siguientes opciones:
   + Prepare los datos antes de crear un análisis. Para ello, elija **Editar/obtener vista previa de los datos** para abrir la preparación de datos para la tabla seleccionada. Para obtener más información sobre la preparación de datos, consulte [Preparación de ejemplos de un conjunto de datos](preparing-data-sets.md).
   + Cree un conjunto de datos y un análisis mediante los datos de la tabla tal cual e importe los datos del conjunto de datos en SPICE para mejorar el rendimiento (recomendado). Para ello, verifique el tamaño de la tabla y el indicador SPICE para ver si tiene suficiente espacio.

     Si tiene suficiente capacidad de SPICE, elija el botón de opción **Importar a SPICE para agilizar el análisis** y, a continuación, cree un análisis eligiendo **Visualizar**.
**nota**  
Si desea utilizar SPICE y no tiene espacio suficiente, elija **Editar/obtener vista previa de los datos**. En la preparación de datos, puede quitar campos del conjunto de datos para reducir su tamaño. También puede aplicar un filtro o escribir una consulta SQL que reduzca el número de filas o columnas devueltas. Para obtener más información sobre la preparación de datos, consulte [Preparación de ejemplos de un conjunto de datos](preparing-data-sets.md).
   + Cree un conjunto de datos y un análisis mediante los datos de tabla tal cual y realice consultas en los datos directamente desde la base de datos. Para hacerlo, elija **Realizar una consulta directamente sobre los datos**. A continuación, cree un análisis seleccionando **Visualizar**.