Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/44466
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorBotía Valderrama, Javier Fernando-
dc.contributor.authorGómez Vahos, Jhonatan Stick-
dc.contributor.authorSaldarriaga Arias, Sebastián-
dc.date.accessioned2025-01-28T17:52:28Z-
dc.date.available2025-01-28T17:52:28Z-
dc.date.issued2024-
dc.identifier.urihttps://hdl.handle.net/10495/44466-
dc.description.abstractRESUMEN : El presente trabajo, también llamado PredictLab, desarrolla un programa interactivo basado en una interfaz web que permite a los usuarios realizar análisis predictivo supervisado de manera eficiente. Facilita la carga del conjunto de datos, el preprocesamiento personalizado y la selección del modelo de predicción que mejor se ajusta a los datos en función de métricas específicas. El enfoque se centra exclusivamente en modelos supervisados de clasificación binaria y regresión. Para la clasificación, se consideran algoritmos como regresión logística, random forest, máquinas de soporte vectorial (SVM), KNN y clasificadores de Bayes ingenuo como GaussianNB y BernoulliNB. En el caso de regresión, se evalúan regresión lineal, ridge, random forest, AdaBoost y gradient boosting. Los parámetros de estos modelos son personalizables y se optimizan mediante un proceso de búsqueda de rejillas (grid search) (Scikit-learn Developers, 2023). La selección del modelo óptimo se basa en el puntaje F1 para tareas de clasificación y el error absoluto medio (MAE) para regresión. Algunos de los resultados más representativos se obtuvieron al entrenar los conjuntos de datos, “Bank Marketing” obtenido desde UCI Machine Learning Repository (2014) para clasificación y “Credit Card Limit Prediction” disponible en Kaggle (s.f.) para regresión. En el caso de clasificación se obtuvo el mejor puntaje F1 de 0.92 para máquinas de soporte vectorial (SVM).En el caso de la regresión, se obtuvo el mejor valor en el error absoluto medio (MAE) de -0.006 para regresión logística y ridge, -0.02. Estos resultados fueron alcanzados sin configuraciones avanzadas ni depuración previa de los datos, teniendo en cuenta que dichos resultados se obtuvieron cargando los datos tal y como están en los repositorios y con la configuración por defecto de PredictLab. Palabras clave: Clasificación, regresión, búsqueda de rejillas, puntaje F1, error absoluto medio (MAE).spa
dc.description.abstractABSTRACT : This project, named PredictLab, develops an interactive program with a web-based interface that enables users to perform supervised predictive analysis efficiently. It facilitates dataset uploading, custom preprocessing, and selecting the prediction model that best fits the data based on specific metrics. The approach focuses exclusively on supervised binary classification and regression models. For classification, algorithms such as logistic regression, random forest, support vector machines (SVM), KNN, and naive Bayes classifiers such as GaussianNB and BernoulliNB are considered. In the case of regression, linear regression, ridge, random forest, AdaBoost, and gradient boosting are evaluated. The parameters of these models are customizable and are optimized using a grid search process (Scikit-learn Developers, 2023). The selection of the optimal model is based on the F1 score for classification tasks and the mean absolute error (MAE) for regression. Some of the most representative results were obtained by training the data sets, “Bank Marketing” obtained from UCI Machine Learning Repository (2014) for classification and “Credit Card Limit Prediction” available in Kaggle (n.d.) for regression. In the case of classification, the best F1 score of 0.92 was obtained for support vector machines (SVM). In the case of regression, the best value was obtained in the mean absolute error (MAE) of -0.006 for logistic regression and ridge, -0.02. These results were achieved without advanced configurations or prior data cleaning, taking into account that these results were obtained by loading the data as it is in the repositories and with the default configuration of PredictLab. Keywords: Classification, regression, grid search, F1 score, mean absolute error (MAE).spa
dc.format.extent48 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.titleAplicación web para entrenar y predecir datos financieros, basado en algoritmos supervisados de clasificación y regresión (PredictLab)spa
dc.title.alternativeWeb application to train and predict financial data, based on algorithms Supervised Classification and Regression (PredictLab)spa
dc.typeinfo:eu-repo/semantics/otherspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameEspecialista en Analítica y Ciencia de Datosspa
thesis.degree.levelEspecializaciónspa
thesis.degree.disciplineFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datosspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellín, Colombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_46ecspa
dc.type.redcolhttp://purl.org/redcol/resource_type/COtherspa
dc.type.localTesis/Trabajo de grado - Monografía - Especializaciónspa
dc.subject.lembAprendizaje automático (inteligencia artificial)-
dc.subject.lembMachine learning-
dc.subject.lembAnálisis de regresión-
dc.subject.lembRegression analysis-
dc.subject.lembClasificación (computadores electrónicos)-
dc.subject.lembSorting (electronic computers)-
dc.relatedidentifier.urlhttps://github.com/jhonatanvahos/AutoMLspa
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
GomezJhonatan_2024_WebClasificacionRegresion.pdfTrabajo de grado especialización1.04 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.