ETFFIN Finance >> Finanzas personales curso >  >> Gestión financiera >> Finanzas

Modelado predictivo:tipos,

Beneficios, y algoritmos

El modelado predictivo es un método para predecir resultados futuros mediante el modelado de datos. Es una de las principales formas en que una empresa puede ver su camino a seguir y hacer planes en consecuencia. Aunque no es infalible, este método tiende a tener altas tasas de precisión, por eso se usa tan comúnmente.

¿Qué es el modelado predictivo?

En breve, El modelado predictivo es una técnica estadística que utiliza el aprendizaje automático y la minería de datos para predecir y pronosticar posibles resultados futuros con la ayuda de datos históricos y existentes. Funciona analizando datos actuales e históricos y proyectando lo que aprende en un modelo generado para pronosticar resultados probables. El modelado predictivo se puede utilizar para predecir casi cualquier cosa, desde las calificaciones de televisión y la próxima compra de un cliente hasta los riesgos crediticios y las ganancias corporativas.

Un modelo predictivo no es fijo; se valida o revisa periódicamente para incorporar cambios en los datos subyacentes. En otras palabras, no es una predicción única. Los modelos predictivos hacen suposiciones basadas en lo que sucedió en el pasado y lo que está sucediendo ahora. Si es entrante, los nuevos datos muestran cambios en lo que está sucediendo ahora, Debe recalcularse el impacto sobre el posible resultado futuro. también. Por ejemplo, una empresa de software podría modelar los datos históricos de ventas contra los gastos de marketing en varias regiones para crear un modelo de ingresos futuros basado en el impacto del gasto de marketing.

La mayoría de los modelos predictivos funcionan con rapidez y, a menudo, completan sus cálculos en tiempo real. Por eso, los bancos y los minoristas pueden por ejemplo, Calcule el riesgo de una solicitud de tarjeta de crédito o hipoteca en línea y acepte o rechace la solicitud casi instantáneamente en función de esa predicción.

Algunos modelos predictivos son más complejos, como los que se utilizan en biología computacional y computación cuántica; Los resultados resultantes tardan más en calcularse que una aplicación de tarjeta de crédito, pero se realizan mucho más rápido de lo que era posible en el pasado gracias a los avances en las capacidades tecnológicas. incluida la potencia de cálculo.

Los 5 tipos principales de modelos predictivos

Afortunadamente, No es necesario crear modelos predictivos desde cero para cada aplicación. Las herramientas de análisis predictivo utilizan una variedad de modelos y algoritmos examinados que se pueden aplicar a una amplia variedad de casos de uso.

Las técnicas de modelado predictivo se han perfeccionado con el tiempo. A medida que agregamos más datos, computación más musculosa, IA y aprendizaje automático y vea los avances generales en análisis, podemos hacer más con estos modelos.

Los cinco principales modelos de análisis predictivo son:

  1. Modelo de clasificación: Considerado el modelo más simple, categoriza los datos para una respuesta de consulta simple y directa. Un caso de uso de ejemplo sería responder a la pregunta "¿Es esta una transacción fraudulenta?"
  2. Modelo de agrupación en clústeres: Este modelo anida los datos por atributos comunes. Funciona agrupando cosas o personas con características o comportamientos compartidos y planifica estrategias para cada grupo a mayor escala. Un ejemplo es determinar el riesgo crediticio de un solicitante de préstamo en función de lo que hicieron otras personas en la misma situación o en una similar en el pasado.
  3. Modelo de pronóstico: Este es un modelo muy popular, y funciona en cualquier cosa con un valor numérico basado en el aprendizaje de datos históricos. Por ejemplo, al responder cuánta lechuga debería pedir un restaurante la próxima semana o cuántas llamadas debería poder atender un agente de atención al cliente por día o por semana, el sistema mira hacia atrás a los datos históricos.
  4. Modelo de valores atípicos: Este modelo funciona analizando puntos de datos anormales o atípicos. Por ejemplo, un banco puede usar un modelo atípico para identificar el fraude preguntando si una transacción está fuera de los hábitos de compra normales del cliente o si un gasto en una categoría determinada es normal o no. Por ejemplo, un $ 1, 000 de cargo de la tarjeta de crédito por una lavadora y secadora en la gran tienda preferida del titular de la tarjeta no sería alarmante, pero $ 1, 000 gastados en ropa de diseñador en un lugar donde el cliente nunca ha cobrado otros artículos podría ser indicativo de una cuenta violada.
  5. Modelo de serie temporal: Este modelo evalúa una secuencia de puntos de datos en función del tiempo. Por ejemplo, el número de pacientes con accidente cerebrovascular admitidos en el hospital en los últimos cuatro meses se utiliza para predecir cuántos pacientes espera admitir el hospital la próxima semana, el próximo mes o el resto del año. Por tanto, una única métrica medida y comparada a lo largo del tiempo es más significativa que un simple promedio.

Algoritmos predictivos comunes

Los algoritmos predictivos utilizan una de dos cosas:aprendizaje automático o aprendizaje profundo. Ambos son subconjuntos de inteligencia artificial (IA). El aprendizaje automático (ML) implica datos estructurados, como una hoja de cálculo o datos de máquina. El aprendizaje profundo (DL) se ocupa de datos no estructurados como videos, audio, texto, Publicaciones e imágenes en las redes sociales, esencialmente las cosas con las que los humanos se comunican y que no son números ni lecturas métricas.

Algunos de los algoritmos predictivos más comunes son:

  1. Bosque aleatorio: Este algoritmo se deriva de una combinación de árboles de decisión, ninguno de los cuales está relacionado, y puede utilizar tanto la clasificación como la regresión para clasificar grandes cantidades de datos.
  2. Modelo lineal generalizado (GLM) para dos valores: Este algoritmo reduce la lista de variables para encontrar el "mejor ajuste". Puede resolver puntos de inflexión y cambiar la captura de datos y otras influencias, como predictores categóricos, para determinar el resultado de "mejor ajuste", superando así los inconvenientes en otros modelos, como una regresión lineal regular.
  3. Modelo mejorado con degradado: Este algoritmo también utiliza varios árboles de decisión combinados, pero a diferencia de Random Forest, los árboles están relacionados. Construye un árbol a la vez, permitiendo así que el siguiente árbol corrija fallas en el árbol anterior. Se usa a menudo en clasificaciones, como en las salidas de los motores de búsqueda.
  4. K-medias: Un algoritmo rápido y popular, K-Means agrupa los puntos de datos por similitudes y, por lo tanto, se usa a menudo para el modelo de agrupación en clústeres. Puede presentar rápidamente cosas como ofertas minoristas personalizadas a individuos dentro de un grupo enorme, como un millón o más de clientes con un gusto similar por los abrigos forrados de lana roja.
  5. Profeta: Este algoritmo se utiliza en series de tiempo o modelos de pronóstico para la planificación de la capacidad, como para las necesidades de inventario, cuotas de ventas y asignación de recursos. Es muy flexible y puede adaptarse fácilmente a la heurística y a una serie de suposiciones útiles.

Modelado predictivo y análisis de datos

El modelado predictivo también se conoce como análisis predictivo. Generalmente, el término "modelado predictivo" se favorece en entornos académicos, mientras que "análisis predictivo" es el término preferido para las aplicaciones comerciales de modelado predictivo.

El uso exitoso de la analítica predictiva depende en gran medida del acceso sin restricciones a volúmenes suficientes de datos limpios y relevantes. Si bien los modelos predictivos pueden ser extraordinariamente complejos, como los que utilizan árboles de decisión y agrupación de k-medias, la parte más compleja es siempre la red neuronal; es decir, el modelo mediante el cual las computadoras están capacitadas para predecir resultados. El aprendizaje automático utiliza una red neuronal para encontrar correlaciones en conjuntos de datos excepcionalmente grandes y "aprender" e identificar patrones dentro de los datos.

Beneficios del modelado predictivo

En una palabra, la analítica predictiva reduce el tiempo, esfuerzo y costos en la previsión de resultados comerciales. Variables como factores ambientales, inteligencia competitiva, Los cambios en la regulación y las condiciones del mercado pueden tenerse en cuenta en el cálculo matemático para obtener vistas más completas a costos relativamente bajos.

Ejemplos de tipos específicos de pronóstico que pueden beneficiar a las empresas incluyen el pronóstico de la demanda, planificación de la plantilla, análisis de abandono, factores externos, Análisis competitivo, mantenimiento de flotas y hardware de TI y riesgos financieros.

Desafíos del modelado predictivo

Es esencial mantener el análisis predictivo enfocado en producir información empresarial útil porque no todo lo que esta tecnología descubre es útil. Alguna información extraída tiene valor solo para satisfacer una mente curiosa y tiene pocas o ninguna implicación comercial. Desviarse es una distracción que pocas empresas pueden permitirse.

También, poder utilizar más datos en el modelado predictivo es una ventaja solo hasta cierto punto. Demasiados datos pueden sesgar el cálculo y dar lugar a un resultado erróneo o sin sentido. Por ejemplo, se venden más abrigos a medida que desciende la temperatura exterior. Pero solo hasta cierto punto. La gente no compra más abrigos cuando hace -20 grados Fahrenheit afuera que cuando hace -5 grados bajo cero. En un cierto punto, el frío es lo suficientemente frío como para estimular la compra de abrigos y las temperaturas más frías ya no cambian apreciablemente ese patrón.

Y con los enormes volúmenes de datos involucrados en el modelado predictivo, mantener la seguridad y la privacidad también será un desafío. Otros desafíos residen en las limitaciones del aprendizaje automático.

Limitaciones del modelado predictivo

Según un informe de McKinsey, Las limitaciones comunes y sus "mejores soluciones" incluyen:

  1. Errores en el etiquetado de datos: Estos se pueden superar con el aprendizaje por refuerzo o las redes generativas de confrontación (GAN).
  2. Escasez de conjuntos de datos masivos necesarios para entrenar el aprendizaje automático: La solución aposible es "aprendizaje de una sola vez, ”En el que una máquina aprende de una pequeña cantidad de demostraciones en lugar de un conjunto de datos masivo.
  3. La incapacidad de la máquina para explicar qué y por qué hizo lo que hizo: Las máquinas no "piensan" ni "aprenden" como los humanos. Igualmente, sus cálculos pueden ser tan excepcionalmente complejos que los humanos tienen problemas para encontrar, y mucho menos seguir, la lógica. Todo esto dificulta que una máquina explique su trabajo, o que los humanos lo hagan. Sin embargo, la transparencia del modelo es necesaria por varias razones, con el jefe de seguridad humana entre ellos. Soluciones potenciales prometedoras:explicaciones agnósticas del modelo interpretable local (LIME) y técnicas de atención.
  4. Generalizabilidad del aprendizaje , o más bien falta de ella: A diferencia de los humanos, las máquinas tienen dificultades para llevar adelante lo que han aprendido. En otras palabras, tienen problemas para aplicar lo que han aprendido a un nuevo conjunto de circunstancias. Todo lo que ha aprendido es aplicable a un solo caso de uso. Esta es en gran parte la razón por la que no debemos preocuparnos por el surgimiento de los señores supremos de la IA en el corto plazo. Para que el modelado predictivo que utiliza el aprendizaje automático sea reutilizable, es decir, útil en más de un caso de uso; una posible solución es el aprendizaje por transferencia.
  5. Sesgo en datos y algoritmos: La falta de representación puede sesgar los resultados y conducir al maltrato de grandes grupos de seres humanos. Más lejos, los sesgos incorporados son difíciles de encontrar y eliminar más tarde. En otras palabras, los prejuicios tienden a perpetuarse a sí mismos. Este es un objetivo en movimiento, y aún no se ha identificado una solución clara.

El futuro del modelado predictivo

Modelado predictivo, también conocido como análisis predictivo, y el aprendizaje automático son tecnologías jóvenes y en desarrollo, lo que significa que hay mucho más por venir. Como técnicas, métodos, las herramientas y las tecnologías mejoran, también lo serán los beneficios para las empresas y las sociedades.

Sin embargo, estas no son tecnologías que las empresas puedan permitirse adoptar más adelante, después de que la tecnología alcanza la madurez y todos los problemas se resuelven. Las ventajas a corto plazo son simplemente demasiado fuertes para que un usuario tardío las supere y siga siendo competitivo.

Nuestro consejo:Comprenda e implemente la tecnología de vez en cuando para aumentar los beneficios comerciales junto con los avances posteriores en las tecnologías.

Modelado predictivo en plataformas

Para todas las empresas menos las más grandes, Aprovechar los beneficios del análisis predictivo se logra más fácilmente mediante el uso de sistemas ERP que tienen las tecnologías integradas y contienen aprendizaje automático previamente capacitado. Por ejemplo, planificación, Las funciones de previsión y presupuestación pueden proporcionar un motor de modelo estadístico para modelar rápidamente múltiples escenarios que se ocupan de las condiciones cambiantes del mercado.

Como otro ejemplo, una función de planificación de suministro o capacidad de suministro puede predecir de manera similar entregas potencialmente tardías, órdenes de compra o venta y otros riesgos o impactos. Los proveedores alternativos también se pueden representar en el tablero para permitir que las empresas giren para cumplir con los requisitos de fabricación o distribución.

El modelado financiero, la planificación y la elaboración de presupuestos son áreas clave para aprovechar los muchos beneficios de utilizar estas tecnologías avanzadas sin abrumar a su equipo.