Evaluation of SQL injection (SQLi) attack detection strategies in web applications using machine learning. Industry semester

Taborda Echeverri, Santiago

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/40601

Título :	Evaluation of SQL injection (SQLi) attack detection strategies in web applications using machine learning. Industry semester
Otros títulos :	Evaluación de estrategias de detección de ataques de inyección SQL (SQLi) en aplicaciones web basadas en técnicas de inteligencia computacional. Semestre de industria
Autor :	Taborda Echeverri, Santiago
metadata.dc.contributor.advisor:	Vergara Tejada, Jaime Alberto Triana Maldonado, Jhonny Alexander
metadata.dc.subject.*:	Bosques aleatorios Random Forest Seguridad computacional Computer Security Procesamiento de datos http://vocabularies.unesco.org/thesaurus/concept522 Aprendizaje automático (inteligencia artificial) Machine learning Análisis de regresión logística Logistic regression analysis Integración numérica - procesamiento de datos Numerical integration - data processing Inteligencia artificial Artificial intelligence Data processing Inyección SQL (SQLi) Firewall de Aplicaciones Web SVM de Una Clase AizoOn Technology Consulting https://id.nlm.nih.gov/mesh/D000093743 https://id.nlm.nih.gov/mesh/D016494
Fecha de publicación :	2024
Resumen :	ABSTRACT : This work evaluates strategies for detecting SQL injection attacks based on artificial intelligence to generate a recommendation that allows the improvement of the web application firewall of AizoOn Technology Consulting (Mithril). To achieve this, detection techniques known as Naïve Bayes, logistic regression, random forests, and one-class support vector machines were selected based on their relevance and effectiveness demonstrated in the scientific literature and the company's expressed interests. These techniques were implemented by structuring a hybrid database integrating public data from the "SQL Injection Dataset" available on Kaggle with data processed by Mithril. This process involved data analysis, preprocessing, and conditioning. Data integration proved useful for implementing the machine learning models. Subsequently, hyperparameter tuning was performed to improve the models' performance, identifying the best configurations for each of them, thus increasing detection capabilities and minimizing false positives. The evaluation and benchmarking of the models were conducted using performance metrics such as accuracy, precision, recall, and F1-Score. Finally, the results led to the recommendation of implementing the logistic regression model in Mithril, as it achieved the best performance with accuracy and F1-Score of 99.45%. RESUMEN : Este trabajo se centra en evaluar estrategias de detección de ataques de inyección SQL basadas en inteligencia computacional para generar una recomendación que permita mejorar el firewall de aplicaciones web de la empresa AizoOn Technology Consulting (Mithril). Para ello, se seleccionaron las técnicas de detección conocidas como Naïve Bayes, regresión logística, bosques aleatorios y máquinas de soporte vectorial de única clase, basándose tanto en su relevancia y efectividad demostrada en la literatura científica como en los intereses expresados por la compañía. Estas técnicas se implementaron a partir de la estructuración de una base de datos híbrida integrando datos públicos del conjunto de datos "SQL Injection Dataset" disponible en Kaggle con datos procesados por Mithril. Este proceso incluyó análisis, pre-procesamiento y acondicionamiento de los datos. La integración de los datos resultó útil para la implementación de los modelos de inteligencia computacional. Posteriormente se realizó el ajuste de hiper-parámetros que permitió mejorar el rendimiento de los modelos, identificando las mejores configuraciones para cada uno de ellos, lo que aumentó las capacidades de detección y minimizó los falsos positivos. La evaluación y comparación de los modelos fue realizada utilizando métricas de desempeño como exactitud, precisión, recall y F1-Score. Finalmente, los resultados obtenidos permitieron recomendar la implementación del modelo de regresión logística en Mithril, debido a que fue el modelo que alcanzó el mejor desempeño con una exactitud y F1-Score del 99.45%.
metadata.dc.relatedidentifier.url:	https://github.com/taechsantiago/ml_sqli_evaluation.git
Aparece en las colecciones:	Ingeniería de Telecomunicaciones

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
TabordaSantiago_2024_MachineLearningSqli.pdf	Trabajo de grado de pregrado	2.19 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons