La metodología que se presenta a continuación cumple con la normatividad de segmentación SARLAFT Y SAGRILAFT (Sistema de administración de riesgos lavado de activos y financiación del terrorismo) de la Supersolidaria Superfinanciera y Superintendencia de Sociedades de Colombia, actualizada al año 2020.
La implementación de la metodología le permitirá crear señales de alerta para detectar operaciones inusuales.
Los métodos utilizados en la segmentación SARLAFT y SAGRILAFT, de la base de datos, son los métodos multivariados y el análisis de clúster o conformación de segmentos. Dentro de los métodos multivariados se utilizó el análisis en componentes principales, el cual se encuentra enmarcado en el ámbito de los métodos factoriales, los cuales buscan resumir la información contenida en una matriz de datos, identificando un reducido número de factores que representan a las variables originales con una pérdida mínima de información (para los clientes) y el análisis de correspondencias simples (para los productos, jurisdicciones y canales). Con los factores obtenidos de los métodos anteriores se aplica la técnica de análisis de conglomerados o formación de segmentos por medio de técnicas jerárquicas y no jerárquicas.
Se presenta a continuación un pequeño resumen de los métodos asociados con el fin de comprender su funcionamiento, lograr una mejor comprensión de ellos, y de la segmentación SARLAFT Y SAGRILAFT
- Métodos Factoriales para la segmentación SARLAFT Y SAGRILAFT
En el análisis en componentes principales (ACP), se posee una tabla rectangular de medidas, donde las columnas representan variables de valores numéricos continuos (de mediciones, de tasas, etc.) y donde las filas representan a los individuos sobre los cuales se han medido las variables. El objetivo del ACP es la búsqueda de un sub-espacio de pequeña dimensión, que se encuentre lo más cercano posible al conjunto (nube) de los datos. Esto se logra minimizando la distancia entre el sub-espacio buscado y la nube de datos, o maximizando la inercia (varianza) de la nube proyectada sobre este sub-espacio. La solución utiliza la diagonalización (obtención de los valores y vectores propios) de la matriz de covarianza de los datos (ACP no normado) o la diagonalización de la matriz de correlaciones de los datos (ACP normado). Entre estas variantes, el análisis en componentes principales normado es ciertamente la más utilizada.
En el ACP, las componentes principales son combinaciones lineales con la variable originales centradas o no que poseen la máxima varianza. La notación usual para indicar un análisis en componentes principales es: ACP(X,D,M) donde X representa la tabla de datos, mientras que D y M representan las matrices de pesos para los individuos y las variables (si los poseen, pues de lo contrario se consideran pesos iguales). El análisis de correspondencias simple se utiliza cuando se analiza una tabla de contingencia. En la práctica se realizan dos ACP (uno para los perfiles filas y otro para los perfiles columna de dichas tablas).
- Análisis de conformación de clúster, segmentación SARLAFT
El análisis de segmentación SARLAFT es realizado a través de una clasificación realizada a partir de las coordenadas de los primeros ejes obtenidos del análisis en componentes principales o del análisis de correspondencias simples. Estos grupos, clúster, conglomerados, segmentos o clases, se conforman de tal manera que los elementos dentro de cada segmento sean lo más parecido posible y que los elementos de diferentes segmentos sean lo más diferente posible. En el análisis de conglomerados, es muy importante el concepto de la inercia o varianza total de los elementos a segmentar. Esta inercia se divide en inercia intraclases o intragrupos (varianza de los integrantes de un mismo segmento) e inercia interclases o intergrupos (varianza entre los centros de cada uno de los segmentos).…
Programa segmentación SARLAFT en R
Para la implementación de la metodolgía anterior puede usar nuestro programa de segmentación R, con el cual podra segmentar las veces que considere necesario, sin cobros adicionales. Ir al programa en R