Big Data – Programación Distribuida, Text mining y Data Science
En los últimos 25 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software.
El concepto de programación distribuida existe desde comienzo de Internet, en ámbitos académicos, sin embargo, nunca fue posible y necesario el uso, la administración y la explotación de datos como en tiempos modernos. La baja en precios por unidad de almacenamiento, el crecimiento exponencial de la capacidad de procesamiento, la receptividad del mercado a la explotación de datos, la gran cantidad y variedad de datos (en el orden de los PB de información) favorecieron el surgimiento de herramientas como Spark y Hadoop que cambiaron el paradigma de programación, permitiendo no estar limitado a la potencia de un solo servidor, sino usar varios de ellos como uno solo. Este nuevo surgimiento, trajo nuevos desafíos y problemáticas, para ello, es muy importante entender cómo desarrollar sistemas que estén a la altura de requerimientos y fuentes de datos dinámicas, así como comprender el rol del profesional de datos orientado a resolver problemas de big data dentro de las organizaciones. |
|