Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/29178
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorRodríguez Colina, Sebastián-
dc.contributor.authorSabogal Aristizábal, Camilo Andrés-
dc.date.accessioned2022-06-14T14:07:05Z-
dc.date.available2022-06-14T14:07:05Z-
dc.date.issued2022-
dc.identifier.urihttp://hdl.handle.net/10495/29178-
dc.description.abstractRESUMEN: La digitalización de documentos es una ciencia que permite traducir tipos de documentos escaneados o imágenes en datos analizables, editables y buscables. Esto es muy útil, ya que permite guardar datos históricos, jurídicos, culturales, científicos, etc. de forma segura y pueden ser de utilidad para investigaciones futuras. Sin embargo, digitalizarlos de forma manual es laborioso y puede tomar mucho tiempo lo que genera grandes costos. Este tipo de digitalizaciones se pueden clasificar en dos categorías: el reconocimiento de caracteres basado en reglas y el reconocimiento de caracteres basado en aprendizaje automático. Por las razones anteriores, es importante contar con herramientas que automaticen este proceso como el aprendizaje automático, ya que así se podrán digitalizar un mayor número de manuscritos en menor tiempo. El proyecto persigue la automatización de la conversión de documentos escaneados a texto editable. Se utilizaron datos de documentos escaneados, exactamente 600 archivos de palabras y documentos, de diferentes fuentes y se siguió una estrategia de mejora incremental para las iteraciones, con el objetivo de desarrollar un modelo de OCR para manuscritos que sea de utilidad al servicio de la comunidad. Los principales obstáculos encontrados fueron la falta de una base de datos de entrenamiento robusta, adecuada y la variabilidad de los formatos de documentos escaneados.spa
dc.format.extent24spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.type.hasversioninfo:eu-repo/semantics/draftspa
dc.rightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titleImplementación de reconocimiento óptico de caracteres para la digitalización de documentosspa
dc.title.alternativeOptical recognition implementation of characters for digitizing documentsspa
dc.typeinfo:eu-repo/semantics/otherspa
oaire.versionhttp://purl.org/coar/version/c_b1a7d7d4d402bccespa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
thesis.degree.nameEspecialista en Analítica y Ciencia de Datosspa
thesis.degree.levelEspecializaciónspa
thesis.degree.disciplineFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datosspa
thesis.degree.grantorUniversidad de Antioquiaspa
dc.rights.creativecommonshttps://creativecommons.org/licenses/by-nc-sa/4.0/spa
dc.publisher.placeMedellín - Colombiaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_46ecspa
dc.type.redcolhttp://purl.org/redcol/resource_type/COtherspa
dc.type.localTesis/Trabajo de grado - Monografía - Especializaciónspa
dc.subject.unescoDigitalización-
dc.subject.unescoDigitization-
dc.subject.lembAprendizaje automático (inteligencia artificial)-
dc.subject.lembMachine learning-
dc.subject.lembProcesamiento de imágenes-
dc.subject.lembImage processing-
dc.subject.lembProcesamiento óptico de datos-
dc.subject.lembOptical data processing-
dc.subject.unescourihttp://vocabularies.unesco.org/thesaurus/concept7411-
dc.relatedidentifier.urlhttps://github.com/CamiloSaboA-csv/digitalizador_manuscritosspa
Aparece en las colecciones: Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
SabogalCamilo_2022_ImplementaciónReconocimientoOpticoTrabajo de grado de especialización1.71 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons