#4 La historia de Los datos que se muerden la cola.

  • Autor de la entrada:
En este momento estás viendo #4 La historia de Los datos que se muerden la cola.
Imagen de Clipart Darish Pavlish

Tiempo estimado de lectura: 12 minutos.

Hola, ¿qué tal? ¿Cómo estas?

¿Preparado para una siguiente entrada de la serie «La época de la información»?

Hoy os voy a hablar de un círculo virtuoso que nos rodea y lo voy a hacer con una historia: Los datos que se muerden la cola.

Los datos que se muerden la cola

En el capítulo anterior te conté las razones por las que la explosión de la inteligencia artificial es ahora y no antes. En este quiero incidir en la parte de explosión, de crecimiento exponencial que se debe a que los diferentes elementos no son independientes sino que se realimentan entre sí dando lugar a la aceleración del proceso.

La disponibilidad de una mayor cantidad de datos con los que trabajar, nos ha hecho buscar mejores soluciones para almacenarlos y procesarlos. A su vez, la mayor capacidad de procesamiento, ha dado lugar a mejores técnicas y más avanzadas de análisis. Se están generando mejores algoritmos de analítica avanzada que permiten hacer mejores predicciones e incluso prescripciones, es decir, mejor información, generando mejores experiencias y un mayor uso de los dispositivos y productos que produce una mayor producción de datos.

Como en casi todas las historias hay un protagonista y unos actores de reparto.

El protagonista: Tú

Aquí, el elemento principal, si me lo permites, eres y yo y todos nosotros, que le encontramos valor a los sistemas alimentados por mejor información, cada vez más exacta y más aproximada a lo que necesitamos. Estos sistemas y productos extendidos en prácticamente todas las industrias y los ámbitos de nuestra vida.

Algunos ejemplos de aplicaciones que usan información como la parte clave de su funcionamiento y modelo de negocio.

Los japoneses utilizan Inteligencia Artificial para clasificar la calidad del atún

Control de elefantes africanos con Inteligencia Artificial

Deep Nostalgia usa Inteligencia Artificial para dar vida a fotos históricas

Algoritmos que detectan enfermedades

Algoritmos que diseñan la imagen de tu marca

Algoritmos que generan texto de manera automática

Nota: recuerda que si el vídeo está en inglés, Youtube facilita la traducción simultanea a otro idioma. Para activar la traducción simultanea al español, sigue estos pasos: ¿Cómo activar la traducción simultanea en Youtube?

El mejor actor de reparto: La analítica avanzada

Entre más datos, capacidad de procesamiento, analítica avanzada e información, cualquiera podría ganar el Oscar al mejor actor de reparto. En este caso, se lo voy a conceder a la analítica avanzada y ahora veréis porqué.

Voy a definir lo que es analítica avanzada a partir de lo que no lo es.

Tipos de analítica

No son analítica avanzada los análisis descriptivos y diagnósticos que se basan en cuadros de mando y en análisis/inferencias estadísticas para responder preguntas de fenómenos que ya ha pasado. En general no usan grandes volúmenes de datos y se limitan a una evaluación numérica del problema que se quiere responder. Las preguntas que nos haríamos en este tipo de análisis son ¿Qué ha pasado? y ¿Por qué ha pasado algo?

Muchas empresas tradicionales que dicen que están haciendo analítica, están aún en esta parte de la gráfica, haciendo análisis cuantitativo.

Por otro lado, sí son analítica avanzada los análisis predictivos y prescriptivos. Aparte de en nuevos algoritmos y tecnologías, se apoyan en conceptos estadísticos para gestión de grandes volúmenes de información y responden a preguntas del tipo ¿Qué va a pasar? y ¿Qué hacer para que algo pase?

Antes de seguir quiero hacer un inciso en esta parte de conceptos estadísticos. La inferencia estadística es necesaria porque estamos intentando predecir el futuro o prescribir propuestas que no sabemos con ciencia cierta si se van a aceptar o no, por ello entra en juego el concepto de probabilidades que es realmente importante.

Todo lo que estiman los modelos de analítica avanzada ocurre con una cierta probabilidad de error. Para estimar la bondad de un algoritmo se usan métricas que no dejan de ser, simplificando mucho, probabilidades de error. Por eso, cuando una máquina o aplicación nos propone algo, siempre hay posibilidad de un error en la predicción. De hecho, desconfía de un algoritmo que os diga que acierta el 100% de las veces ya que es prácticamente imposible por las aproximaciones y los métodos estadísticos e inferencias usadas. Lo que distingue un buen algoritmo de otro peor es en lo que se acerca a la probabilidad de error casi nula.

Volviendo a nuestro ganador del Oscar al actor secundario, la capacidad de predecir del futuro con un margen pequeño de error así como estimar o prescribir lo que alguien quiere con alta probabilidad de éxito y con ello «facilitar» un comportamiento concreto, convierten a la analítica avanza en la piedra angular de la generación de información útil y valiosa. En el elemento clave que hacer que nuestro protagonista, tú, utilices un producto o no y por tanto, en el motor económico de la época de la información.

Dentro de esta categoría de analítica avanzada se engloban diferentes algoritmos:

  • De aprendizaje supervisado: que usan datos de entrada clasificados para resolver el problemas de predicción.
  • De aprendizaje no supervisado: ajustan el resultado teniendo sólo en cuenta los datos de entrada sin clasificar.
  • De aprendizaje reforzado: son funciones enfocadas en un modelo acción – recompensa.

Por hoy me voy a quedar aquí porque estoy entrando en materia más técnica que solamente ella merece una entrada completa. Espero que hayas disfrutado y si te ha gustado, compártelo en redes y dímelo en comentarios.

Te espero en las siguientes entregas de «La época de la información» donde hablaremos más en detalle de los tipos de modelos y algoritmos de analítica avanzada, las principales métricas para evaluar la bondad de sus resultados y ejemplo de uso.

Bibliografía y referencias

Y si te has quedado con ganas, te dejo algunas referencias a continuación: