¿Qué medidas de planificación puedo tomar al actualizar mi clúster de Amazon EMR?

8 minutos de lectura
0

Necesito planificar una actualización de Amazon EMR para mantenerme al día con una tecnología que cambia rápidamente.

Descripción breve

Para mantenerse al día de los cambios en los macrodatos, debe actualizar su versión de Amazon EMR. La migración a una nueva versión de Amazon EMR mejora la excelencia operativa y la eficacia de su carga de trabajo. Sin embargo, antes de actualizar Amazon EMR, debe planificarse y prepararse. Hay información que debe revisar y procedimientos que debe seguir.

Ventajas de las actualizaciones de versión de Amazon EMR

Las ventajas de actualizar Amazon EMR incluyen:

  • Aumento de la productividad y reducción de costos gracias a las características más recientes.
  • Las aplicaciones actualizadas se ejecutan más rápido.
  • Las últimas correcciones de errores proporcionan una infraestructura estable.
  • Las revisiones de seguridad más recientes refuerzan la seguridad.
  • Acceso actualizado a características de software de código abierto.

Por ejemplo, con las versiones 6.6 y posteriores de Amazon EMR, Log4j 1.x y Log4j 2.x se actualizan a Log4j 1.2.17 y Log4j 2.17.1 (o versiones posteriores), respectivamente. En las versiones superiores, las acciones de arranque no son necesarias para mitigar las vulnerabilidades y exposiciones comunes (CVE).

Resolución

Características de optimización del desempeño de Amazon EMR para aplicaciones de código abierto

Amazon EMR ofrece características de optimización del desempeño para muchas aplicaciones de código abierto.

Spark:

Delta Lake:

Flink:

Hadoop:

HBase:

HCatalog:

Hive:

Hudi:

Iceberg:

Presto y Trino:

Planificación de las actualizaciones de versión de Amazon EMR

Siga estos pasos para prepararse para la actualización de la versión de Amazon EMR:

  1. Investigue los problemas a los que se enfrenta en su versión actual de Amazon EMR.
  2. Aísle un pequeño subconjunto de aplicaciones o consultas que desee utilizar para comprobar el rendimiento del clúster de EMR.
  3. Configure una estrategia de pruebas A/B para decidir la versión de Amazon EMR que mejor se adapte a su solución. En las pruebas A/B para Amazon EMR, se comprueban dos versiones diferentes del servicio para comparar el rendimiento en su entorno.
  4. Migre gradualmente la carga de trabajo a la nueva versión de Amazon EMR. Si descubre problemas importantes en la versión de producción de Amazon EMR, puede finalizar el proceso de migración aquí.
  5. Una vez finalizada la migración, finalice el antiguo clúster de Amazon EMR.

Solucionar problemas relacionados con las actualizaciones de versión de Amazon EMR

Siga estos pasos para solucionar los problemas que surjan al actualizar su versión de Amazon EMR:

  1. Vuelva a configurar la aplicación. Observe si los cambios mejoran el rendimiento de la aplicación.
  2. Compruebe si una versión más reciente de la aplicación ha resuelto los problemas.
  3. Cambie la aplicación o las consultas para ver si puede evitar los problemas.
  4. Compruebe los defectos y las soluciones alternativas disponibles para mejorar la aplicación. Póngase en contacto con AWS Premium Support para averiguar si hay soluciones alternativas.
  5. Detenga la migración a Amazon EMR hasta que se solucione el problema o se encuentre una solución alternativa.

Consideraciones sobre las actualizaciones de versión de Amazon EMR

Al actualizar su versión de Amazon EMR, la regresión del rendimiento puede causar problemas. Las actualizaciones pueden cambiar la API, lo cual puede hacer que el código no pueda ejecutarse en una interfaz más reciente. Es posible que la aplicación se ralentice y se produzcan errores después de actualizar la versión de Amazon EMR.

Cuando esté pensando en actualizar su versión de Amazon EMR, es recomendable leer la sección de novedades de la guía de la versión. La sección de novedades incluye información sobre las versiones y fechas de lanzamiento de Amazon EMR, junto con soluciones a problemas comunes con las aplicaciones de código abierto.

Investigar los cambios en las aplicaciones de código abierto y los problemas pendientes de resolver

Consulte las siguientes notas de la versión y compruebe si presenta defectos antes de decidirse a migrar a una nueva versión de Amazon EMR. La siguiente lista de aplicaciones se basa en la versión 6.9 de Amazon EMR.

Nota: Estos hipervínculos enlazan a sitios web de aplicaciones de terceros, GitHub o el sitio web de Apache.


OFICIAL DE AWS
OFICIAL DE AWSActualizada hace un año