Random Forest son potentes algoritmos de clasificación que se pueden entrenar para ayudar a los expertos financieros a tomar mejores decisiones y detectar irregularidades en el mercado.

“¿El aleteo de una mariposa en Brasil provoca un tornado en Texas?” Esta pregunta, planteada por Edward Lorenz, sería la base de lo que hoy la ciencia popular llama el “Efecto Mariposa”. La idea es que pequeños cambios pueden tener repercusiones con consecuencias a gran escala.
Para ser más precisos, el Efecto Mariposa es parte de la Teoría del Caos y puede resumirse como la dependencia sensible de las condiciones iniciales en la que un pequeño cambio en un estado de un sistema determinista no lineal puede resultar en grandes diferencias en un estado posterior.
El mundo financiero está plagado de efectos mariposa, y quizás uno de los mayores ejemplos fue el Lunes Negro, cuando el mercado de Hong Kong se desplomó, su índice cayó rápidamente y las pérdidas aumentaron en un lugar para desayunar. Antes de que nadie pudiera comprender lo sucedido, las consecuencias se sintieron en todo el mundo.
¿Qué tal 2007? Cuando el colapso de una parte ciertamente pequeña del mercado hipotecario estadounidense provocó una crisis generalizada que se sintió en todo el mundo. Se necesitaban rescates, ayuda gubernamental y diferentes formas de apoyo para reiniciar y normalizar la economía global.
Las finanzas son complejas ya que dependen tanto de las fuerzas económicas como de la psicología de los inversores. Todo lo que necesitas es un empujón y las fichas de dominó empiezan a caer. ¿Por qué sucede esto y cómo puede ayudarnos la tecnología a evitarlo?
La fragilidad de los sistemas financieros
Andrew Haldane, director ejecutivo de estabilidad financiera del Banco de Inglaterra, presentó un artículo académico en el que observaba que el sistema financiero se había vuelto progresivamente más complejo, pero cada vez menos diversificado. ¿Qué implica esto?
Imaginemos los sistemas financieros como un edificio: cuanto más diverso es un sistema, más cimientos tiene para soportar la presión. Cuanto más compleja, más grande y complicada es la infraestructura (columnas y vigas que distribuyen el peso junto con la estructura).
Hipotéticamente, podría tener pocos cimientos, pero tener una infraestructura que distribuya el peso y mantenga el edificio en pie. Desafortunadamente, si uno de los cimientos falla, causaría un efecto dominó en todo el edificio e independientemente de la infraestructura, eventualmente colapsaría.
En otras palabras, cuanto menos diverso sea nuestro sistema financiero, menos redes de seguridad tendrá para soportar cambios repentinos y shocks aleatorios. No importa cuán elegante sea su edificio, no puede construirlo sobre hielo fino.
Una introducción a los bosques aleatorios
Antes de entender el bosque, primero tenemos que hablar de los árboles (perdón por el juego de palabras). Los árboles de decisión son potentes algoritmos de aprendizaje automático que se utilizan para la clasificación. Es una estructura similar a un diagrama de flujo donde cada nodo representa una “prueba” de un atributo.
Aunque pueda parecer complicado, en realidad es bastante sencillo. De hecho, inconscientemente utilizamos árboles de decisión todo el tiempo.
Por ejemplo, si quieres comer tacos pero no quieres ir muy lejos, puedes utilizar un árbol de decisiones. Primero haces una lista de todos los restaurantes que conoces en la ciudad, luego los clasificas en dos categorías, los que tienen tacos en el menú y los que no.
Luego clasificamos aquellos que tienen tacos en su menú como “cercanos” o “lejos” dependiendo de qué tan cerca estén de nuestra ubicación actual. Luego, finalmente, los volvemos a clasificar, esta vez como “dentro de nuestro presupuesto” o “muy caros”. Finalmente, terminamos con una lista de restaurantes de tacos cercanos que son asequibles.
En la vida real, un solo experto, por muy bueno que sea, puede cometer errores, por eso dependemos de los comités. En un comité, incluso si un experto comete un error, habrá otras opiniones diferentes que le ayudarán a tomar la decisión correcta al final.
Los Random Forests son como comités digitales, en lugar de tener un único árbol de decisión, tenemos varios árboles trabajando al unísono, cada árbol del bosque hace una predicción y, al igual que en el Congreso, se cuentan los votos. La predicción más votada es el resultado del modelo. Es aprendizaje automático reforzado por el poder de la democracia.
Random Forest funciona porque cada árbol individual tiene poca o ninguna correlación con otros árboles; lo que predice un árbol no está vinculado a lo que predicen los demás árboles. En términos humanos, podríamos decir que cada uno tiene puntos de vista diferentes, lo que a su vez garantiza que no haya sesgos sistemáticos.
Este algoritmo es una solución elegante para hacer predicciones en sistemas altamente volátiles y para trabajar con problemas complejos que pueden tener una cantidad casi infinita de puntos de datos. En otras palabras, el tipo de problemas que enfrentamos constantemente en las finanzas.
Bosques aleatorios en las finanzas
Las investigaciones han demostrado que los bosques aleatorios superan a casi todas las demás formas de pronóstico relacionado con los precios de las acciones, el análisis cualitativo de las acciones y el precio de las opciones, y los diferenciales de crédito . Hay dos cosas a tener en cuenta aquí.
Primero, está el hecho de que las herramientas de pronóstico tradicionales se basan en regresiones lineales, que es un algoritmo extremadamente poderoso, pero solo cuando las relaciones que está estudiando son de naturaleza lineal (en otras palabras, no importa cuántas variables A cambien, la Variable B cambiará). seguir cambiando juntos).
Las relaciones de la vida real suelen ser más complejas que esto, por ejemplo, la altura y el peso humanos. Existe una relación lineal allí (las personas más altas tienden a pesar más), pero esto es cierto hasta cierto punto. Después de eso, el peso puede aumentar mientras que la altura se estanca.
Lo que esto significa es que un modelo de regresión lineal para predecir la altura a partir del peso sólo funcionará hasta cierto punto. Algo similar ocurre con los precios de las acciones, aunque algunos valores predicen un aumento en los precios de las acciones, dentro de ciertos límites estas relaciones cambian.
El otro punto es que Random Forests obliga a los científicos a redefinir sus problemas en términos de análisis de clasificación. En lugar de plantear el problema como "Si X aumenta, entonces ¿cuánto aumentará Y", preguntamos "¿cambiará el valor de X?". Puede que esto no parezca mucho, pero te sorprendería saber cómo incluso una pequeña reformulación puede cambiar nuestra percepción del problema.
Con los datos correctos, los bosques aleatorios pueden ayudarnos a evaluar si un pequeño cambio en un mercado local podría tener enormes ramificaciones en la economía global. Y gracias a las tecnologías de IoT, IA, computación en la nube y minería de datos, recopilar y procesar datos financieros nunca ha sido tan fácil.
Para ser justos, los bosques aleatorios no son perfectos; como cualquier otro algoritmo, el modelo es tan bueno como los datos con los que lo entrenas. Es un hecho bien conocido que los bosques aleatorios son extremadamente susceptibles a pequeños sesgos. Si le das datos incorrectos, terminarás con un modelo poco confiable.
Los Random Forests no revolucionarán el mundo financiero, pero ciertamente son una herramienta poderosa que puede aplicarse a una multitud de problemas, proporcionando nuevas formas de encuadrar los problemas y predecir el comportamiento del mercado.
Fuente: BairesDev