Detección de fraude en transacciones comerciales de clientes aplicando métodos de ML

Florez Bedoya, Laura Andrea

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/24605

Título :	Detección de fraude en transacciones comerciales de clientes aplicando métodos de ML
Otros títulos :	Fraud Detection in Commercial Transactions Applying ML Methods
Autor :	Florez Bedoya, Laura Andrea
metadata.dc.contributor.advisor:	Botía Valderrama, Javier Fernando
metadata.dc.subject.*:	Análisis de datos Data analysis Aprendizaje electrónico Machine learning Fraude Fraud Detección de fraude Aprendizaje supervisado http://aims.fao.org/aos/agrovoc/c_49834 http://aims.fao.org/aos/agrovoc/c_8139c3d0 http://vocabularies.unesco.org/thesaurus/concept2214
Fecha de publicación :	2021
Resumen :	RESUMEN : Después de realizar una revisión de los métodos de aprendizaje automático que han sido reportados en diferentes literaturas para la predicción de fraude se ha encontrado que con ayuda de la aplicación de técnicas de procesamiento es posible encontrar una ruta adecuada para dar solución a una problemática tan actual como lo es el fraude en comercios electrónicos. Entre los métodos de ML evaluados es posible mencionar especialmente, las técnicas de aprendizaje supervisado, cuyos modelos de clasificación pueden etiquetar eventos como buenos (donde las transacciones son genuinas) o malos (cuando el comportamiento asociado no es correcto o fraudulento). Además de la aplicación de los modelos supervisados se hacen uso también, de técnicas de procesamiento que por medio de los mismos datos realizan transformaciones y nuevas inferencias que puedan describir con mayor detalle el comportamiento de un cliente a lo largo de una transacción o en el establecimiento de señales de fraude. Estas implementaciones incluyen la generación de características o el agrupamiento de variables sobre información relevante en una transacción electrónica como, las formas de pago o la identidad de un usuario. Durante la investigación se examinó con detalle el uso de diferentes métodos y subprocesos de ML con el fin de determinar cuál es la mejor opción para lograr una adecuada predicción de fraude sobre una fuente abundante de información recopilada (con gran dimensionalidad). La modelización incluyó un análisis de los modelos y del efecto de algunos métodos de procesamiento (como ingeniería de características, escalamiento y ajuste de desbalanceo) sobre la predicción de casos fraudulentos, evaluando su rendimiento por medio de distintas métricas de clasificación. Los resultados mostraron que al hacer uso del ajuste de hiperparámetros para métodos de aprendizaje supervisado en conjunto con la aplicación de técnicas de procesamiento es posible obtener modelos optimizados que presenten buen comportamiento de predicción en evento fraudulentos. Un factor importante que se observó fue la influencia del escalamiento sobre la predicción, donde la evaluación de dichos modelos con ayuda de distintas métricas evidenció la influencia directa de estas transformaciones numéricas sobre los verdaderos negativos hallados (que representan los casos de fraude). Los resultados de la modelización y del análisis realizado se presentan de forma que puedan ser usados a futuro en estudios más profundos sobre la detección de fraude. ABSTRACT : After reviewing the machine learning methods that have been reported in different literatures for fraud prediction, it has been found that with the help of the application of processing techniques it is possible to find an adequate route to provide a solution to such a current problem as fraud in electronic commerce. Among the ML methods evaluated, it is possible to mention especially supervised learning techniques, whose classification models can label events as good (where the transactions are genuine) or bad (when the associated behavior is not correct or fraudulent). In addition to the application of supervised models, processing techniques are also used, where using the same data, it performs transformations and new inferences that can describe in greater detail the behavior of a customer throughout a transaction or in the establishment of fraud signals. These implementations include the generation of features or the grouping of variables about relevant information in an electronic transaction such as, payment methods or the identity of a user. During the research, the use of different ML methods and sub-processes were examined in detail in order to determine which is the best option to achieve adequate fraud prediction on an abundant source of collected information (with high dimensionality). The modeling included an analysis of the models and the effect of some processing methods (such as feature engineering, scaling and unbalance adjustment) on the prediction of fraudulent cases, evaluating their performance by means of different classification metrics. The results showed that by making use of hyperparameter tuning for supervised learning methods in combination with the application of processing techniques, it is possible to obtain optimized models that exhibit good prediction behavior in fraudulent events. An important factor observed was the influence of scaling on prediction, where the evaluation of these models with the help of different metrics evidenced the direct influence of these numerical transformations on the true negatives found (representing fraud cases). The results of the modeling and analysis performed are presented so that they can be used in the future for more in-depth studies on fraud detection.
metadata.dc.relatedidentifier.url:	https://github.com/fblaura/FraudD
Aparece en las colecciones:	Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
FlorezLaura_2021_ModelosMLFraude.pdf	Trabajo de grado de especialización	1.87 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons