Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/40601
Título : Evaluation of SQL injection (SQLi) attack detection strategies in web applications using machine learning. Industry semester
Otros títulos : Evaluación de estrategias de detección de ataques de inyección SQL (SQLi) en aplicaciones web basadas en técnicas de inteligencia computacional. Semestre de industria
Autor : Taborda Echeverri, Santiago
metadata.dc.contributor.advisor: Vergara Tejada, Jaime Alberto
Triana Maldonado, Jhonny Alexander
metadata.dc.subject.*: Bosques aleatorios
Random Forest
Seguridad computacional
Computer Security
Procesamiento de datos
http://vocabularies.unesco.org/thesaurus/concept522
Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de regresión logística
Logistic regression analysis
Integración numérica - procesamiento de datos
Numerical integration - data processing
Inteligencia artificial
Artificial intelligence
Data processing
Inyección SQL (SQLi)
Firewall de Aplicaciones Web
SVM de Una Clase
AizoOn Technology Consulting
https://id.nlm.nih.gov/mesh/D000093743
https://id.nlm.nih.gov/mesh/D016494
Fecha de publicación : 2024
Resumen : ABSTRACT : This work evaluates strategies for detecting SQL injection attacks based on artificial intelligence to generate a recommendation that allows the improvement of the web application firewall of AizoOn Technology Consulting (Mithril). To achieve this, detection techniques known as Naïve Bayes, logistic regression, random forests, and one-class support vector machines were selected based on their relevance and effectiveness demonstrated in the scientific literature and the company's expressed interests. These techniques were implemented by structuring a hybrid database integrating public data from the "SQL Injection Dataset" available on Kaggle with data processed by Mithril. This process involved data analysis, preprocessing, and conditioning. Data integration proved useful for implementing the machine learning models. Subsequently, hyperparameter tuning was performed to improve the models' performance, identifying the best configurations for each of them, thus increasing detection capabilities and minimizing false positives. The evaluation and benchmarking of the models were conducted using performance metrics such as accuracy, precision, recall, and F1-Score. Finally, the results led to the recommendation of implementing the logistic regression model in Mithril, as it achieved the best performance with accuracy and F1-Score of 99.45%.
RESUMEN : Este trabajo se centra en evaluar estrategias de detección de ataques de inyección SQL basadas en inteligencia computacional para generar una recomendación que permita mejorar el firewall de aplicaciones web de la empresa AizoOn Technology Consulting (Mithril). Para ello, se seleccionaron las técnicas de detección conocidas como Naïve Bayes, regresión logística, bosques aleatorios y máquinas de soporte vectorial de única clase, basándose tanto en su relevancia y efectividad demostrada en la literatura científica como en los intereses expresados por la compañía. Estas técnicas se implementaron a partir de la estructuración de una base de datos híbrida integrando datos públicos del conjunto de datos "SQL Injection Dataset" disponible en Kaggle con datos procesados por Mithril. Este proceso incluyó análisis, pre-procesamiento y acondicionamiento de los datos. La integración de los datos resultó útil para la implementación de los modelos de inteligencia computacional. Posteriormente se realizó el ajuste de hiper-parámetros que permitió mejorar el rendimiento de los modelos, identificando las mejores configuraciones para cada uno de ellos, lo que aumentó las capacidades de detección y minimizó los falsos positivos. La evaluación y comparación de los modelos fue realizada utilizando métricas de desempeño como exactitud, precisión, recall y F1-Score. Finalmente, los resultados obtenidos permitieron recomendar la implementación del modelo de regresión logística en Mithril, debido a que fue el modelo que alcanzó el mejor desempeño con una exactitud y F1-Score del 99.45%.
metadata.dc.relatedidentifier.url: https://github.com/taechsantiago/ml_sqli_evaluation.git
Aparece en las colecciones: Ingeniería de Telecomunicaciones

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TabordaSantiago_2024_MachineLearningSqli.pdfTrabajo de grado de pregrado2.19 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons