Big data. IFCT128PO. José Antonio Castillo Romero

Big data. IFCT128PO - José Antonio Castillo Romero


Скачать книгу
nivel de detalle.

       Datos históricos

       Datos almacenados masivamente y de escaso acceso.

       El business intelligence 2.0

      

HILO CONDUCTOR

      Debido al desconocimiento del business intelligence y un sistema de marketing deficiente, TextilTek, S. L. ha tenido gran cantidad de datos valiosos guardados, sin sacarles el suficiente partido. Gracias a la consultora, ahora son capaces de analizar datos históricos para saber cómo funciona la empresa.

      Hasta ahora puedes darte cuenta de que en ningún momento el tipo de datos ha cobrado importancia para el BI, porque en su gran mayoría eran datos estructurados, y no es hasta la entrada del nuevo siglo cuando esto cobra importancia. Es entonces cuando se empiezan a desarrollar sistemas de análisis para datos no estructurados, ya que con la invención de las nuevas tecnologías más rápidas e inteligentes, los datos comienzan a adquirir una dimensión completamente diferente: nace así el business intelligence 2.0, creándose así el concepto de big data.

      Como síntesis, el procedimiento del business intelligence lo puedes ver en el siguiente gráfico:

      2.4. Evolución del análisis de datos: el data mining

      

HILO CONDUCTOR

      Pero, ¿cómo podría TextilTek, S. L. anticiparse a sus rivales y diseñar una estrategia de marketing eficiente? La respuesta está en el data mining.

      El estudio del BI podría abarcar perfectamente un curso completo, pero ese no es el objetivo, aunque resulta esencial para poder situarnos en un contexto adecuado para lo que viene después. Paralelamente, y con el objetivo de cubrir ciertas carencias del BI nace el data mining.

      A finales de los años 80 surge una nueva expresión, el data mining o minería de datos, que consiste en buscar y extraer información y conocimiento de los datos mediante patrones y modelos que ayuden a estudiar el posible resultado en acciones que ocurrirán en el futuro.

       ¿Por qué llamar así a este procedimiento?

      El data mining se basa en un procedimiento que intenta descubrir patrones de información en conjuntos de datos masivos, siendo semejante a un proceso de minería. Es precisamente por esto que la denominación de este término proviene de la analogía que se hace con los trabajos que se realizan para extraer materia prima valiosa de yacimientos en la tierra, la minería, pero en este caso en lugar de materia prima son datos obtenidos de grandes repositorios y bancos de datos.

      Junto con el data mining, y unido a este término, tambien comienza a utilizarse el llamado KDD o Knowledge Discovery in Databases (en español, Descubrimiento del Conocimiento en Bases de Datos. La diferencia fundamental entre el KDD y el data mining es que para el primero es necesario un profundo conocimiento sobre el área a estudiar, mientras que para el segundo es necesario un conocimiento propiamente técnico.

      En la siguiente imagen podrás ver muy resumidamente los pasos a seguir en un proceso de data mining:

       image image

       Una técnica del data mining: el machine learning

      

HILO CONDUCTOR

      TextilTek, S. L. está implantando con éxito tecnologías big data, concretamente el sistema de análisis con data mining le está dando buenos resultados, ya que en base a los datos que genera mediante las compras de los clientes y las áreas funcionales de la empresa, es capaz de anticiparse a las demandas de un mercado cada vez más saturado y exigente. Aunque la respuesta de los clientes está siendo mucho más positiva que con el antiguo sistema de alertas, el área de marketing ha desechado este y se basa en el análisis de redes sociales y el feedback para identificar los gustos de moda de los jóvenes.

      El machine learning o aprendizaje automático no es más que otra consecuencia de la necesidad de una búsqueda y explotación de patrones de datos en bancos, con el objetivo de construir modelos que predigan las consecuencias que tendrán lo que en ese momento se está haciendo. Este método se comenzó a utilizar por los bancos en la década de los noventa para detectar posibles fraudes y estudio de créditos.

      Pero el machine learning va más allá de esto, y es que es una rama de la inteligencia artificial. Se trata de crear algoritmos que sean capaces de aprender y tomar decisiones y, por tanto, de predecir acontecimientos. Esto se hace tomando información y construyendo ejemplos que generalizan comportamientos, por lo que la estadística representa una parte fundamental.

      Actualmente esto tiene multitud de aplicaciones como, por ejemplo, los motores de búsqueda de internet, que aprenden tus hábitos para luego enviarte información que pueda interesarte. Seguramente lo hayas experimentado y te parezca algo incomprensible a priori, pero todo se deriva precisamente de esto.

      

PARA SABER MÁS

      La inteligencia artificial cada vez más forma parte de nuestra vida. Puede ser una forma excelente de facilitárnosla, pero también implica riesgos como la sustitución de la mano humana por máquinas artificiales y una posible crisis de paro a nivel mundial. Para más curiosidades puedes visitar el siguiente artículo:

image

       https://redirectoronline.com/ifct128po0103

      2.5. Data science y el científico de datos

      La aparición del concepto data science o ciencia de datos surge precisamente del desarrollo de las aplicaciones de data mining y engloba el conjunto de principios científicos y aplicados que definen cómo se extrae el conocimiento de los datos.

      El concepto se introdujo en el nuevo milenio y su fin es englobar los principios en los que se basan los conceptos anteriores: matemáticas, estadística e informática para la extracción de información mediante patrones y relaciones de datos. Con el data science se pretende dar una explicación de la evolución sufrida por los procesos de obtención de conocimiento a partir de los datos y la entrada en la nueva era digital.

      Tal ha sido la repercusión de esto que apareció la figura del científico de datos o persona que se especializa en el tratamiento de datos. En otras palabras, se trata de la conjunción de desarrollo de distintos conocimientos como la estadística mezclada con creatividad y la computología. Estas personas cuentan con unas habilidades muy concretas:

image

      image ACTIVIDAD COMPLEMENTARIA

      1.


Скачать книгу