Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Convierta archivos de mainframe de EBCDIC formato a formato delimitado por caracteres en ASCII Amazon S3 con Lambda AWS
Creado por Luis Gustavo Dantas () AWS
Repositorio de código: Mainframe Data Utilities | Entorno: PoC o piloto | Fuente: archivos IBM EBCDIC |
Destino: archivos delimitados ASCII | Tipo R: redefinir la plataforma | Carga de trabajo: IBM |
Tecnologías: unidad central | AWSservicios: AWS CloudShell AWS Lambda; Amazon S3; Amazon CloudWatch |
Resumen
Este patrón muestra cómo lanzar una función AWS Lambda que convierte automáticamente los archivos mainframe EBCDIC (código de intercambio decimal codificado en binario extendido) en archivos delimitados por caracteres ASCII (Código estándar estadounidense para el intercambio de información). La función Lambda se ejecuta después de cargar los ASCII archivos en un bucket de Amazon Simple Storage Service (Amazon S3). Tras la conversión de archivos, puede leer los ASCII archivos de las cargas de trabajo basadas en x86 o cargarlos en bases de datos modernas.
El enfoque de conversión de archivos que se muestra en este patrón puede ayudarle a superar los desafíos que supone trabajar con EBCDIC archivos en entornos modernos. Los archivos codificados EBCDIC suelen contener datos representados en formato binario o decimal empaquetado, y los campos tienen una longitud fija. Estas características crean obstáculos porque las cargas de trabajo modernas basadas en x86 o los entornos distribuidos suelen trabajar con datos ASCII codificados y no pueden procesar archivos. EBCDIC
Requisitos previos y limitaciones
Requisitos previos
Una cuenta activa AWS
Un bucket de S3
Un usuario de AWS Identity and Access Management (IAM) con permisos administrativos
AWS CloudShell
Python 3.8.0
o posterior Un archivo plano codificado EBCDIC y su estructura de datos correspondiente en un cuaderno común de lenguaje orientado a los negocios COBOL
Nota: Este patrón utiliza un archivo de muestra EBCDIC (. CLIENT EBCDIC.txt
Limitaciones
COBOLlos cuadernos suelen contener múltiples definiciones de maquetación. El mainframe-data-utilities
proyecto puede analizar este tipo de cuaderno, pero no puede deducir qué diseño considerar en la conversión de datos. Esto se debe a que los cuadernos no utilizan esta lógica (que permanece en COBOL los programas). Por lo tanto, debe configurar manualmente las reglas para seleccionar los diseños después de analizar el cuaderno. Este patrón está sujeto a las cuotas de Lambda.
Arquitectura
Pila de tecnología de origen
IBMz/OS, IBM i y otros sistemas EBCDIC
Archivos secuenciales con datos codificados EBCDIC (como IBM descargas de Db2)
COBOLcuaderno
Pila de tecnología de destino
Amazon S3
Notificaciones de eventos de Amazon S3
IAM
Función de Lambda
Python 3.8 o posterior
Utilidades de datos de unidad central
JSONmetadatos
archivos delimitados por caracteres ASCII
Arquitectura de destino
El siguiente diagrama muestra una arquitectura para convertir archivos de mainframe en archivos. EBCDIC ASCII
En el diagrama, se muestra el siguiente flujo de trabajo:
El usuario ejecuta el script del analizador del cuaderno para convertir el COBOL cuaderno en un archivo. JSON
El usuario carga los JSON metadatos en un bucket de S3. Esto hace que los metadatos sean legibles por la función de Lambda de conversión de datos.
El usuario o un proceso automatizado carga el EBCDIC archivo en el depósito de S3.
El evento de notificación de S3 activa la función de Lambda de conversión de datos.
AWSverifica los permisos de lectura y escritura del bucket S3 para la función Lambda.
Lambda lee el archivo del bucket de S3 y lo convierte localmente de aEBCDIC. ASCII
Lambda registra el estado del proceso en Amazon. CloudWatch
Lambda vuelve a escribir el ASCII archivo en Amazon S3.
Nota: El script del analizador de libros electrónicos se ejecuta solo una vez, después de convertir los metadatos en un bucket de S3 JSON y, a continuación, de cargarlos en un bucket de S3. Tras la conversión inicial, cualquier EBCDIC archivo que utilice el mismo JSON archivo que se cargó en el bucket de S3 utilizará los mismos metadatos.
Herramientas
AWSherramientas
Amazon le CloudWatch ayuda a supervisar las métricas de sus AWS recursos y las aplicaciones en las que se ejecuta AWS en tiempo real.
Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos basado en la nube que le ayuda a almacenar, proteger y recuperar cualquier cantidad de datos.
AWS CloudShelles un shell basado en un navegador que puede utilizar para gestionar AWS servicios mediante la interfaz de línea de AWS comandos (AWSCLI) y una serie de herramientas de desarrollo preinstaladas.
AWSIdentity and Access Management (IAM) le ayuda a administrar de forma segura el acceso a sus AWS recursos al controlar quién está autenticado y autorizado a usarlos.
AWSLambda es un servicio informático que le ayuda a ejecutar código sin necesidad de aprovisionar o administrar servidores. Lambda ejecuta el código solo cuando es necesario y escala la capacidad de manera automática, por lo que solo pagará por el tiempo informático que utilice.
Otras herramientas
Código
El código de este patrón está disponible en el GitHub mainframe-data-utilities
Prácticas recomendadas
Tenga en cuenta las siguientes prácticas recomendadas:
Defina los permisos necesarios en el nivel de Amazon Resource Name (ARN).
Otorgue siempre permisos con privilegios mínimos para las políticas. IAM Para obtener más información, consulte las prácticas recomendadas de seguridad IAM en la documentación. IAM
Epics
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Crear variables de entorno. | Copie las siguientes variables de entorno en un editor de texto y, a continuación, sustituya <placeholder>los valores del siguiente ejemplo por los valores de sus recursos:
Nota: Más adelante, creará referencias a su bucket, AWS cuenta y AWS región de S3. Para definir las variables de entorno, abra la CloudShell consola Nota: Debe repetir este paso cada vez que se reinicie la CloudShell sesión. | General AWS |
Cree una carpeta de trabajo. | Para simplificar el proceso de limpieza de recursos más adelante, cree una carpeta de trabajo CloudShell ejecutando el siguiente comando:
Nota: Debe cambiar el directorio al directorio de trabajo ( | General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Cree una política de confianza para la función de Lambda. | El EBCDIC convertidor se ejecuta en una función Lambda. La función debe tener un IAM rol. Antes de crear el IAM rol, debe definir un documento de política de confianza que permita a los recursos asumir esa política. Desde la carpeta de CloudShell trabajo, cree un documento de política ejecutando el siguiente comando:
| General AWS |
Cree el IAM rol para la conversión a Lambda. | Para crear un IAM rol, ejecute el siguiente AWS CLI comando desde la carpeta de CloudShell trabajo:
| General AWS |
Cree el documento IAM de política para la función Lambda. | La función Lambda debe tener acceso de lectura y escritura al bucket de S3 y permisos de escritura para Amazon Logs. CloudWatch Para crear una IAM política, ejecute el siguiente comando desde la CloudShell carpeta de trabajo:
| General AWS |
Adjunte el documento de IAM política al IAM puesto. | Para adjuntar la IAM política al IAM rol, ejecute el siguiente comando desde la carpeta de CloudShell trabajo:
| General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Descargue el código fuente EBCDIC de la conversión. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para descargar el código mainframe-data-utilities fuente GitHub:
| ¿General AWS |
Crea el ZIP paquete. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para crear el ZIP paquete que crea la función Lambda para EBCDIC la conversión:
| ¿General AWS |
Crear la función de Lambda. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para crear la función Lambda para EBCDIC la conversión:
Nota: El diseño de las variables de entorno indica a la función Lambda dónde residen los JSON metadatos. | General AWS |
Crear la política basada en recursos para la función de Lambda. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para permitir que la notificación de eventos de Amazon S3 active la función Lambda para EBCDIC la conversión:
| ¿General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Cree el documento de configuración para la notificación de eventos de Amazon S3. | La notificación de eventos de Amazon S3 inicia la función Lambda de EBCDIC conversión cuando los archivos se colocan en la carpeta de entrada. Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para crear el JSON documento para la notificación de eventos de Amazon S3:
| General AWS |
Crear notificaciones de eventos de Amazon S3. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para crear la notificación de eventos de Amazon S3:
| ¿General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Analiza el COBOL cuaderno. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para convertir un COBOL cuaderno de ejemplo en un JSON archivo (que define cómo leer y dividir el archivo de datos correctamente):
| ¿General AWS |
Añada la regla de transformación. | El archivo de datos de ejemplo y su COBOL cuaderno correspondiente son archivos de varios diseños. Esto significa que la conversión debe dividir los datos en función de determinadas reglas. En este caso, los bytes de las posiciones 3 y 4 de cada fila definen el diseño. Desde la carpeta de CloudShell trabajo, edite el
| GeneralAWS, IBM Mainframe, Cobol |
Cargue los JSON metadatos en el depósito de S3. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente AWS CLI comando para cargar los JSON metadatos en el depósito de S3:
| General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
Envíe el EBCDIC archivo al bucket de S3. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para enviar el EBCDIC archivo al bucket de S3:
Nota: Le recomendamos que configure carpetas diferentes para los archivos de entrada (EBCDIC) y de salida (ASCII) para evitar volver a llamar a la función de conversión Lambda cuando el ASCII archivo se cargue en el bucket de S3. | ¿General AWS |
Comprobar la salida. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para comprobar si el ASCII archivo se ha generado en el bucket de S3:
Nota: La conversión de datos puede tardar varios segundos en realizarse. Le recomendamos que compruebe el ASCII archivo varias veces. Cuando el ASCII archivo esté disponible, ejecute el siguiente comando para descargar el archivo del bucket de S3 a la carpeta actual:
Compruebe el contenido ASCII del archivo:
| General AWS |
Tarea | Descripción | Habilidades requeridas |
---|---|---|
(Opcional) Prepare las variables y la carpeta. | Si pierde la conexión con CloudShell, vuelva a conectarse y ejecute el siguiente comando para cambiar el directorio a la carpeta de trabajo:
Asegúrese de que las variables de entorno estén definidas:
| ¿General AWS |
Eliminar la configuración de notificación para el bucket. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para eliminar la configuración de notificaciones de eventos de Amazon S3:
| ¿General AWS |
Elimine la función de Lambda. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para eliminar la función Lambda del EBCDIC convertidor:
| ¿General AWS |
Elimine el IAM rol y la política. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para eliminar la función y la política del EBCDIC conversor:
| ¿General AWS |
Elimine los archivos generados en el bucket de S3. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para eliminar los archivos generados en el bucket de S3:
| ¿General AWS |
Elimine la carpeta de trabajo. | Desde la carpeta de CloudShell trabajo, ejecute el siguiente comando para eliminar
| ¿General AWS |
Recursos relacionados
Utilidades de datos de mainframe README
() GitHub El conjunto de EBCDIC caracteres
(IBMdocumentación) EBCDICa ASCII
(IBMdocumentación) COBOL
(IBMdocumentación) Uso de un activador de Amazon S3 para invocar una función de Lambda (documentación de AWS Lambda)