Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorFinlay Estrella, David Esteban-
dc.contributor.authorGualteros Sinsajoa, Daniel Clemente-
dc.contributor.authorTrejo Quintero, Andrés Sebastián-
dc.date.accessioned2024-09-03T22:17:21Z-
dc.date.available2024-09-03T22:17:21Z-
dc.date.issued2024-09-03-
dc.identifier.citationFinlay Estrella, D. E. & Gualteros Sinsajoa, D. C. & Trejo Quintero, A. S. (2024). Desarrollo de una herramienta de adquisición automática de datos de fuentes externas, para el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante crawlers y web scraping. [Trabajo de pregrado. Universidad CESMAG]. Repositorio Institucional de la Universidad CESMAG. http://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175en_US
dc.identifier.otherCEIS019-
dc.identifier.urihttp://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175-
dc.description.abstractLa Vicerrectoría de Investigaciones de la Universidad CESMAG requiere de un sistema de gestión de información que le permita recopilar y organizar de manera eficiente los datos necesarios para el desarrollo de sus investigaciones. Para ello, se propone el desarrollo de una herramienta de adquisición automática de datos de fuentes externas utilizando técnicas de crawlers y web scraping. El objetivo principal de este trabajo de grado es diseñar, implementar y evaluar un módulo de adquisición automática de datos que permita la recolección y organización de la información necesaria para la gestión de información en la Vicerrectoría de Investigaciones. Esta herramienta se basó en la utilización de técnicas de crawlers y web scraping para la adquisición automática de datos de fuentes externas relevantes. Las variables a trabajar en el proyecto, las cuales fueron autor, descripción, fuente externa de la investigación, fecha de publicación, enlace del documento, número de citas del documento, tipo de documento consultado, cantidad de versiones del documento, palabras clave y número de descargas del documento. Todas estas variables son importantes para la gestión de información en la Vicerrectoría de Investigaciones y permitirán tener una visión más completa y detallada de las investigaciones en curso. Es importante destacar que, para garantizar la validez y confiabilidad de los datos recolectados, se utilizaron técnicas y herramientas de recolección de información confiables y validadas en el campo de los crawlers y web scraping. Además, se realizarán pruebas y ajustes necesarios para asegurar la eficacia y precisión de la herramienta de adquisición automática de datos. El desarrollo de esta herramienta de adquisición automática de datos utilizando técnicas de crawlers y web scraping, es un proyecto adscrito al proyecto de investigación profesoral “Desarrollo de un módulo KDD, para la exploración y análisis robusto de los datos generados por el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante algoritmos de data mining y machine learning” mediante la modalidad de instancia en línea. El cual permitirá a la Vicerrectoría de Investigaciones de la Universidad CESMAG contar con una herramienta eficiente y precisa para la recolección y organización de la información necesaria para sus investigaciones. Además, la utilización de técnicas y herramientas validadas garantizará la confiabilidad y validez de los datos recolectados.en_US
dc.language.isoesen_US
dc.publisherSan Juan de Pasto - Nariño [Colombia] : Universidad CESMAGen_US
dc.subjectBASES DE DATOSen_US
dc.subjectDESARROLLO WEBen_US
dc.subjectEXTRACCIÓN DE INFORMACIÓNen_US
dc.subjectFRAMEWORKS DE DESARROLLOen_US
dc.subjectINTELIGENCIA ARTIFICIALen_US
dc.subjectLIBRERÍAS DE PROGRAMACIÓNen_US
dc.subjectMETODOLOGÍA CRISP-DMen_US
dc.subjectREPOSITORIOS EDUCATIVOS;en_US
dc.subjectSCRAPINGen_US
dc.subjectWEB CRAWLERen_US
dc.titleDesarrollo de una herramienta de adquisición automática de datos de fuentes externas, para el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante crawlers y web scrapingen_US
dc.typeThesisen_US
Aparece en las colecciones: Ingeniería de Sistemas

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
CEIS019-IS F511 2024.pdf4,48 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.