#6 Resolviendo problemas en la época de la información

  • Autor de la entrada:
En este momento estás viendo #6 Resolviendo problemas en la época de la información
Imagen de Peshkova de Getty Images Pro en Canva

Tiempo estimado de lectura: 14 minutos.

¡Buenos días y buenos datos!. En fin, espero que me perdones la poca originalidad pero hoy me he dicho, ¡vaya comienzos de entradas tan aburridos que pongo! y esto es a lo más que he llegado. Debe ser que tanto leer de datos, información y analítica avanzada, sólo pienso en modo binario.

Pero dejo de divagar porque luego se me va el tiempo y me quedo a medias con lo que realmente te quiero contar.

El objetivo de hoy es seguir profundizando en los tipos de modelos analíticos. Te recuerdo qué es un modelo de analítica avanzada.

El otro día hablamos de modelos por tipo de aprendizaje. Ahora toca hablar de modelos según el caso de uso que queremos resolver.

La mayoría de las personas gastan más tiempo y energías en hablar de los problemas que en afrontarlos

Henry Ford

Veamos entonces cuales son y como se afrontan los principales problemas resueltos con analítica avanzada.

Prediccion

Regresiones o forecasting

  • Es uno de los tipos de modelos predictivos más habituales donde utilizamos datos históricos para estimar un valor numérico a futuro.
  • Ejemplos de uso: ¿cuál es el precio de una casa?; ¿cuál es el número de ventas el mes que viene?; ¿cuantas llamadas recibirá en una hora un centro de atención al cliente?; ¿qué inventario tengo que mantener de un determinado modelo de ropa para cubrir la demanda en un periodo de ventas determinado?
  • Es aprendizaje supervisado.
Clasificación

Clasificaciones

  • Como el anterior, es uno de los tipos de modelos predictivos más habituales donde utilizamos datos históricos para contestar preguntas categóricas, es decir para indicar a qué categoría de las existentes pertenecerá el elemento que estamos analizado en el futuro.
  • Se usan para responder preguntas binarias (se contestan con «sí» o «no») o multiclase (asignando una dentro de varias categorías)
  • Son de los casos más frecuentes en entornos empresariales.
  • Ejemplos de uso: ¿se va a dar de baja un cliente el próximo mes?; ¿Este cliente va a aceptar este producto?; ¿este correo es spam?; ¿esta foto es un gato?
  • Es aprendizaje supervisado.
Serie temporal

Series temporales

  • Es un caso específico de modelo de forecasting donde se estima una secuencia de valores numéricos a lo largo de un periodo por lo que uno de los datos de entrada es una variable temporal.
  • Normalmente los valores se estiman a medio largo plazo y necesitan un histórico de datos relevante para poder captar las estacionalidades típicas de las líneas temporales. Además, es un buen método para analizar la evolución de un determinado indicador en varios momentos.
  • Ejemplos de uso: ¿número de llamadas recibidas por un centro de atención al cliente en los últimos tres mes?; ¿ventas estimadas en un año?; ¿valor de una acción en 6 meses?
  • Es aprendizaje supervisado.
Búsqueda de anomalía

Búsqueda de anomalías

  • Este tipo de modelos es un modelo predictivo que busca valores atípicos dentro de los conjuntos de datos analizados.
  • Ejemplos de uso: transacciones con la tarjeta bancaria en dos ciudades muy lejanas en un corto periodo de tiempo; acceso a un sistema desde una dirección IP atípica; pico de llamadas en un momento no habitual dentro de un centro de atención al cliente.
  • En general, están orientados a detectar fraudes o situaciones anómalas o a mantenimiento preventivo.
  • Puede ser aprendizaje supervisado, no supervisado o híbrido. Suele ser no supervisado o híbrido porque no sabemos lo que estamos buscando.
Categorias

Búsqueda de categorías o clustering

  • Son modelos predictivos que buscan detectar agrupaciones de los datos de entrada con características similares entre sí.
  • Ejemplos de uso: segmentaciones de tipos de cliente por consumo de productos de una empresa de telecomunicaciones; categorías de series o películas dentro de un servicio de vídeo tipo Netflix (os dejo un ejemplo curioso en las referencias).
  • Es aprendizaje no supervisado.
Redes sociales

Búsqueda de relaciones sociales (SNA- Social Network Analysis)

  • Son modelos predictivos que buscan identificar relaciones sociales y el peso de la relación mediante el uso de redes y teoría de grafos. Utiliza técnicas que caracterizan las relaciones como redes donde los individuos o personas son los nodos y el peso de la relación son los enlaces entre ellos.
  • Ejemplos de uso: identificar a las personas más influyentes dentro de grupos humanos para promover productos; ver como interaccionan las proteínas entre sí para tratamiento enfermedades; ver como se relacionan proveedores dentro de una cadena de suministro para eficientarla.
  • Es aprendizaje no supervisado.
Reducción de dimensinalidad

Reducción de dimensionalidad

  • Son algoritmos que mediante técnicas estadísticas reducen el tamaño de los grupos de datos utilizados quedándose con la información relevante para el entrenamiento de los modelos.
  • Los principales objetivos son: evitar sobreajustes en las estimaciones y optimizar el rendimiento en la ejecución de los modelos. El sobreajuste (overfitting en inglés) es uno de los principales problemas de los modelos de analítica avanzada donde la solución funciona muy bien con los datos de entrenamiento o aprendizaje pero mal con los nuevos datos porque se ha ajustado mucho el resultado a los datos histórico. Seguramente hable más adelante en otra entrada. Por ahora, simplemente quiero que te suene.
  • Ejemplos de uso: compresión de imágenes para uso en redes neuronales.
  • Es aprendizaje no supervisado.
Recomendación

Motores de recomendación

  • Son algoritmos prescriptivos que ofrecen sugerencias de contenido o productos que tienen mayor probabilidad de que los usuarios los consuman.
  • Ejemplos de uso: recomendaciones de productos de Amazon; recomendaciones de vídeos o series en Netflix o recomendaciones de canciones en Spotify.
  • En general es aprendizaje supervisado con información parcial (normalmente no se tienen las etiquetas cuando son «No me gusta»). Al principio, si no tenemos ninguna valoración, se realizaría un aprendizaje no supervisado para comenzar (lo que llamamos «cold start«)

Y hasta aquí por el momento. Espero que hayas disfrutado y que vaya quedando más o menos claro como encajan las piezas en el mundo de la analítica avanzada. Si te ha gustado, compártelo en redes y dímelo en comentarios.

Te espero en las siguientes entregas de «La época de la información» donde terminaré de hablar de las clasificaciones de modelos analíticos, esta vez desde el punto de vista de los modelos matemáticos.

Bibliografía y referencias

Y como ya viene siendo lo habitual, no quiero que te quedes con ganas así que te dejo algunas referencias para seguir profundizando en los conceptos que hemos hablado hoy:

Además, os recomiendo también visitar el blog de Aprende IA donde hay muchísima información sobre inteligencia artificial y analítica avanzada en español.