<Talleres/>

Procesamiento de datos a gran escala con PySpark (Español)

Data Science
Machine Learning

Autores

Fecha y Hora

Domingo 09, 09:30

Resumen

En 30 minutos los asistentes tendrán la oportunidad de conocer uno de los frameworks indispensables y más usados en el mundo del Big Data, además de ser una de las habilidades de mayor crecimiento de demanda en la industria. La charla será enfocada en mostrar la facilidad del uso de Apache Spark, su filosofía, sus módulos y cómo estos se convierten en una herramienta increíble. Mostraré las diferentes alternativas que existen para la extracción de información, un recorrido emocionante por las transformaciones y sus métodos de acción. Concluyendo con las opciones de persistencia de los datos. Como organizador de la comunidad de Apache Spark Bogotá, estoy convencido de que dominar Spark, será un camino que se disfrutará, incluso partiendo con un nivel intermedio en Phyton. Mi misión será la de mostrar a los asistentes como con conocimientos de Python el desarrollo en Spark, con PySpark, facilitará el manejo de datos e incrementará hasta 100 veces la velocidad con que se procesa la información