Configurar una fuente de datos en Dashboards OpenSearch - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configurar una fuente de datos en Dashboards OpenSearch

Ahora que ha creado su origen de datos, puede configurar los ajustes de seguridad, definir las tablas de Amazon S3 o configurar la indexación acelerada de datos. En esta sección, se explican varios casos de uso de la fuente de datos en los OpenSearch paneles antes de realizar consultas en los datos.

Para configurar las siguientes secciones, primero debe navegar hasta su fuente de datos en los OpenSearch paneles. En el menú de navegación izquierdo, en Administración, elija Origen de datos. En Administrar orígenes de datos, seleccione el nombre del origen de datos que creó en la consola.

Configurar el control de acceso

En la página de detalles de la fuente de datos, busque la sección de controles de acceso y seleccione Editar. Si tiene el complemento de seguridad instalado, elija Restringido y seleccione los grupos basados en roles a los que desea proporcionar acceso al nuevo origen de datos. También puede elegir Solo administrador si solo quiere que el administrador tenga acceso al origen de datos.

importante

Los índices se utilizan para cualquier consulta realizada en el origen de datos. Un usuario con acceso de lectura al índice de solicitudes de un origen de datos determinado puede leer todas las consultas realizadas en ese origen de datos. Un usuario con acceso de lectura al índice de resultados puede leer los resultados de todas las consultas realizadas en ese origen de datos.

Configura las integraciones para los tipos de AWS registro más populares

OpenSearch Dashboards permite empezar rápidamente a utilizar tipos de registros comunes almacenados en Amazon S3 con registros sin procesar, excepto los registros de Amazon VPC Flow, que son compatibles con el formato Parquet. OpenSearch Dashboards ofrece integraciones que permiten acceder a activos como AWS Glue Data Catalog tablas, consultas guardadas y paneles. Estos activos funcionan con OpenSearch aceleraciones y se actualizarán automáticamente una vez que los hayas instalado. Puede configurar las integraciones desde la página de detalles de la fuente de datos o desde el menú de navegación izquierdo. Para ello:

  1. Seleccione el tipo de registro que desee instalar. Asegúrese de que el tipo de registro que instale tenga la etiqueta Amazon S3.

  2. Seleccione el tipo de conexión como conexión Amazon S3 si aún no lo ha seleccionado.

  3. Seleccione el nombre de la fuente de datos en la que desee instalar la integración, la ubicación de Amazon S3 para los datos, el punto de control que desee utilizar para mantener el estado de indexación de la aceleración y los activos que desee en función de su caso de uso.

    nota

    Al crear el rol de IAM, especificó un recurso de Amazon S3 para un punto de control que tiene permisos de acción de escritura para la ubicación del punto de control. Deberá hacer referencia a una ubicación de depósito de Amazon S3 que tenga acceso de escritura para la ubicación del punto de control. Si no lo hace, las aceleraciones que instalará la integración fallarán.

    nota

    La integración del registro de flujo de Amazon VPC requiere la instalación de un parche mediante OpenSearch paneles. Es posible que los paneles que haya instalado tarden unos minutos en completarse.

Guías de referencia para exportar datos a Amazon S3

Puede utilizar las siguientes guías de referencia para exportar datos a Amazon S3:

Fuentes:

Cree tablas de Spark con Query Workbench

Las consultas directas de OpenSearch Service a Amazon S3 utilizan las tablas de Spark incluidas en AWS Glue Data Catalog. Puede crear tablas desde Query Workbench sin tener que salir de los OpenSearch paneles.

Para gestionar las bases de datos y tablas existentes en su fuente de datos, o para crear tablas nuevas en las que desee utilizar consultas directas, seleccione Query Workbench en el menú de navegación de la izquierda y seleccione la fuente de datos Amazon S3 en el menú desplegable de fuentes de datos.

Para configurar una tabla para los registros de flujo de VPC almacenados en S3 en formato Parquet, ejecute la siguiente consulta:

CREATE TABLE datasourcename.gluedatabasename.vpclogstable (version INT, account_id STRING, interface_id STRING, srcaddr STRING, dstaddr STRING, srcport INT, dstport INT, protocol INT, packets BIGINT, bytes BIGINT, start BIGINT, end BIGINT, action STRING, log_status STRING, `aws-account-id` STRING, `aws-service` STRING, `aws-region` STRING, year STRING, month STRING, day STRING, hour STRING) USING parquet PARTITIONED BY (aws-account-id, aws-service, aws-region, year, month, day, hour) LOCATION "s3://accountnum-vpcflow/AWSLogs"

Tras crear la tabla, ejecute la siguiente consulta para asegurarse de que es compatible con las consultas directas:

MSCK REPAIR TABLE datasourcename.databasename.vpclogstable