Implementación de reconocimiento óptico de caracteres para la digitalización de documentos

Sabogal Aristizábal, Camilo Andrés

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10495/29178

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Rodríguez Colina, Sebastián	-
dc.contributor.author	Sabogal Aristizábal, Camilo Andrés	-
dc.date.accessioned	2022-06-14T14:07:05Z	-
dc.date.available	2022-06-14T14:07:05Z	-
dc.date.issued	2022	-
dc.identifier.uri	http://hdl.handle.net/10495/29178	-
dc.description.abstract	RESUMEN: La digitalización de documentos es una ciencia que permite traducir tipos de documentos escaneados o imágenes en datos analizables, editables y buscables. Esto es muy útil, ya que permite guardar datos históricos, jurídicos, culturales, científicos, etc. de forma segura y pueden ser de utilidad para investigaciones futuras. Sin embargo, digitalizarlos de forma manual es laborioso y puede tomar mucho tiempo lo que genera grandes costos. Este tipo de digitalizaciones se pueden clasificar en dos categorías: el reconocimiento de caracteres basado en reglas y el reconocimiento de caracteres basado en aprendizaje automático. Por las razones anteriores, es importante contar con herramientas que automaticen este proceso como el aprendizaje automático, ya que así se podrán digitalizar un mayor número de manuscritos en menor tiempo. El proyecto persigue la automatización de la conversión de documentos escaneados a texto editable. Se utilizaron datos de documentos escaneados, exactamente 600 archivos de palabras y documentos, de diferentes fuentes y se siguió una estrategia de mejora incremental para las iteraciones, con el objetivo de desarrollar un modelo de OCR para manuscritos que sea de utilidad al servicio de la comunidad. Los principales obstáculos encontrados fueron la falta de una base de datos de entrenamiento robusta, adecuada y la variabilidad de los formatos de documentos escaneados.	spa
dc.format.extent	24	spa
dc.format.mimetype	application/pdf	spa
dc.language.iso	spa	spa
dc.type.hasversion	info:eu-repo/semantics/draft	spa
dc.rights	info:eu-repo/semantics/openAccess	spa
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/2.5/co/	*
dc.title	Implementación de reconocimiento óptico de caracteres para la digitalización de documentos	spa
dc.title.alternative	Optical recognition implementation of characters for digitizing documents	spa
dc.type	info:eu-repo/semantics/other	spa
oaire.version	http://purl.org/coar/version/c_b1a7d7d4d402bcce	spa
dc.rights.accessrights	http://purl.org/coar/access_right/c_abf2	spa
thesis.degree.name	Especialista en Analítica y Ciencia de Datos	spa
thesis.degree.level	Especialización	spa
thesis.degree.discipline	Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos	spa
thesis.degree.grantor	Universidad de Antioquia	spa
dc.rights.creativecommons	https://creativecommons.org/licenses/by-nc-sa/4.0/	spa
dc.publisher.place	Medellín - Colombia	spa
dc.type.coar	http://purl.org/coar/resource_type/c_46ec	spa
dc.type.redcol	http://purl.org/redcol/resource_type/COther	spa
dc.type.local	Tesis/Trabajo de grado - Monografía - Especialización	spa
dc.subject.unesco	Digitalización	-
dc.subject.unesco	Digitization	-
dc.subject.lemb	Aprendizaje automático (inteligencia artificial)	-
dc.subject.lemb	Machine learning	-
dc.subject.lemb	Procesamiento de imágenes	-
dc.subject.lemb	Image processing	-
dc.subject.lemb	Procesamiento óptico de datos	-
dc.subject.lemb	Optical data processing	-
dc.subject.unescouri	http://vocabularies.unesco.org/thesaurus/concept7411	-
dc.relatedidentifier.url	https://github.com/CamiloSaboA-csv/digitalizador_manuscritos	spa
Aparece en las colecciones:	Especializaciones de la Facultad de Ingeniería

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
SabogalCamilo_2022_ImplementaciónReconocimientoOptico	Trabajo de grado de especialización	1.71 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons