

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Preparación de los datos de entrada para su procesamiento con Amazon EMR
<a name="emr-plan-input"></a>

La mayoría de los clústeres cargan los datos de entrada y, a continuación, procesan dichos datos. Para cargar datos, tiene que estar en una ubicación a la que el clúster pueda acceder y en un formato que el clúster pueda procesar. El escenario más habitual consiste en cargar los datos de entrada en Amazon S3. Amazon EMR proporciona herramientas para su clúster para importar o leer datos desde Amazon S3.

El formato de entrada predeterminado en Hadoop son archivos de texto, aunque puede personalizar Hadoop y utilizar herramientas para importar los datos almacenados en otros formatos. 

**Topics**
+ [Tipos de entrada que Amazon EMR puede aceptar](emr-plan-input-accept.md)
+ [Diferentes formas de obtener datos en Amazon EMR](emr-plan-get-data-in.md)