Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175
Título : Desarrollo de una herramienta de adquisición automática de datos de fuentes externas, para el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante crawlers y web scraping
Autor : Finlay Estrella, David Esteban
Gualteros Sinsajoa, Daniel Clemente
Trejo Quintero, Andrés Sebastián
Palabras clave : BASES DE DATOS
DESARROLLO WEB
EXTRACCIÓN DE INFORMACIÓN
FRAMEWORKS DE DESARROLLO
INTELIGENCIA ARTIFICIAL
LIBRERÍAS DE PROGRAMACIÓN
METODOLOGÍA CRISP-DM
REPOSITORIOS EDUCATIVOS;
SCRAPING
WEB CRAWLER
Fecha de publicación : 3-sep-2024
Editorial : San Juan de Pasto - Nariño [Colombia] : Universidad CESMAG
Citación : Finlay Estrella, D. E. & Gualteros Sinsajoa, D. C. & Trejo Quintero, A. S. (2024). Desarrollo de una herramienta de adquisición automática de datos de fuentes externas, para el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante crawlers y web scraping. [Trabajo de pregrado. Universidad CESMAG]. Repositorio Institucional de la Universidad CESMAG. http://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175
Resumen : La Vicerrectoría de Investigaciones de la Universidad CESMAG requiere de un sistema de gestión de información que le permita recopilar y organizar de manera eficiente los datos necesarios para el desarrollo de sus investigaciones. Para ello, se propone el desarrollo de una herramienta de adquisición automática de datos de fuentes externas utilizando técnicas de crawlers y web scraping. El objetivo principal de este trabajo de grado es diseñar, implementar y evaluar un módulo de adquisición automática de datos que permita la recolección y organización de la información necesaria para la gestión de información en la Vicerrectoría de Investigaciones. Esta herramienta se basó en la utilización de técnicas de crawlers y web scraping para la adquisición automática de datos de fuentes externas relevantes. Las variables a trabajar en el proyecto, las cuales fueron autor, descripción, fuente externa de la investigación, fecha de publicación, enlace del documento, número de citas del documento, tipo de documento consultado, cantidad de versiones del documento, palabras clave y número de descargas del documento. Todas estas variables son importantes para la gestión de información en la Vicerrectoría de Investigaciones y permitirán tener una visión más completa y detallada de las investigaciones en curso. Es importante destacar que, para garantizar la validez y confiabilidad de los datos recolectados, se utilizaron técnicas y herramientas de recolección de información confiables y validadas en el campo de los crawlers y web scraping. Además, se realizarán pruebas y ajustes necesarios para asegurar la eficacia y precisión de la herramienta de adquisición automática de datos. El desarrollo de esta herramienta de adquisición automática de datos utilizando técnicas de crawlers y web scraping, es un proyecto adscrito al proyecto de investigación profesoral “Desarrollo de un módulo KDD, para la exploración y análisis robusto de los datos generados por el sistema de gestión de información de la Vicerrectoría de Investigaciones de la Universidad CESMAG, mediante algoritmos de data mining y machine learning” mediante la modalidad de instancia en línea. El cual permitirá a la Vicerrectoría de Investigaciones de la Universidad CESMAG contar con una herramienta eficiente y precisa para la recolección y organización de la información necesaria para sus investigaciones. Además, la utilización de técnicas y herramientas validadas garantizará la confiabilidad y validez de los datos recolectados.
URI : http://repositorio.unicesmag.edu.co:8080/xmlui/handle/123456789/1175
Aparece en las colecciones: Ingeniería de Sistemas

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
CEIS019-IS F511 2024.pdf4,48 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.