El arte de convertir Datos en Acciones

Y tu, ¿qué sabes del Big Data?

Quién es quién en el Análisis de Datos.

Veamos la diferencia entre Big Data, Data Mining, Machine Learning y Estadistica.

Big Data

wp-y-tu-que-sabes-del-data-mining
Trata de conocer al consumidor más “por lo que hace” que “por lo que dice que hace”. Actualmente el consumidor o cliente deja siempre “huellas digitales”, y con el “Internet de las cosas” (las cosas conectadas a Internet, nevera, lavadora, etc) todavía van a ser mayores sus huellas digitales. El reto consiste en ser capaces de guardar estos datos (reto relativamente sencillo) y ser capaces de extraer el conocimiento que en ellos estén escondidos. Este último reto es más complicado ya que hay que dar solución a las tres “V”: Velocidad (en la que queremos el conocimiento, normalmente para ya), Volumen (de datos, en crecimiento exponencial) o Variedad tanto de tipos de datos, de bases de datos de los que proceden, así como de sus fuentes.

Data mining

Es el proceso de descubrir patrones de comportamiento útiles en los datos. Consiste en determinar que tipo de output necesitamos y “alimentar” los posibles algoritmos con datos para que aprendan. Por lo que habrá que determinar, un objetivo, conseguir y preparar los datos adecuados y trabajar con los diferentes algoritmos de “machine learning” y sus posibilidades de parametrización. Una vez seleccionado el mejor output y validado, el “modelo” se podrá utilizar, para predecir, clasificar, etc o para que de manera recursiva sea capaz de mejorar sus capacidades.

Machine learning

Aporta un conjunto de diferentes “algoritmos” cuyo objetivo consiste en extraer el conocimiento de los datos. Estos diferentes algoritmos se clasisfican en función del objetivo perseguido: modelos lineales, árboles de decisión, reglas de clasificación o asociación, distancias entre casos, clusters, etc. Su fuente del saber proviene de las ciencias computacionales y estas, en parte, de las matemáticas.

Estadística

Su objetivo también consiste en extraer conocimiento de los datos. Pero su fuente del saber son directamente las matemáticas. Es difícil determinar donde empieza la estadística o acaba el machine learning, dado que este se alimenta de aquella. Pero si debemos diferenciarlas, machine learning busca patrones de comportamiento (no hace hipótesis “a priori”) mientras que la estadística (aparte de la de meramente descriptiva: medias, desviaciones, etc), busca establecer una hipótesis nula: “de que no existe diferencias significativas entre dos valores” y si soy capaz de anularla, entonces debo quedarme como cierta la hipótesis alternativa “de que si existen diferencias”, utilizando los test adecuados (t-student, chi-cuadrado, etc).

¿Estás deacuerdo, con la diferencia entre Big Data, Data Mining, Machine Learning y Estadistica?

Data Analytics

! Comentario

  1. Clara Clara
    18 enero, 2016    

    Muy buen aporte

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>