Resumen:
Actualmente, el procesamiento y análisis de datos desempeñan un papel vital en la toma de decisiones en diversos campos, desde la industria hasta la ciencia y la medicina. Aunque los datos actuales se caracterizan por su creciente diversidad en estructura y formato. Se pueden dividir en dos categorías: estructurados y no estructurados. Los datos estructurados, organizados en tablas y relaciones, facilitan su uso y análisis. Por el contrario, los datos no estructurados, como imágenes, audio, vídeo y texto sin formato carecen de este orden, lo que dificulta el análisis automático. Las herramientas disponibles actualmente se basan en enfoques con distintos niveles de acoplamiento, un concepto que hace referencia al grado de integración entre los módulos del sistema. Existen varios niveles de acoplamiento; en esta investigación se consideran tres de ellos. El primero es el bajo acoplamiento, se trata de soluciones donde los módulos funcionan de manera independiente, es decir, la funcionalidad de uno no afecta al otro. Esto puede darse, por ejemplo, en soluciones externas que no están incluidas en el código del sistema, como módulos que operan en un tercer sistema. El acoplamiento medio, o acoplamiento de estampilla, se caracteriza por el uso de una misma estructura de datos, como funciones definidas o construidas por el usuario dentro del sistema, este es el caso de las User Defined Function (UDF) [1], aunque pueden variar en su implementación. Finalmente, el alto acoplamiento implica una fuerte dependencia entre los módulos, donde en este caso la modificación de uno afecta directamente módulos del núcleo del sistema. Esto es similar a lo que ocurre con las UDF, pero de manera más profunda, ya que pueden ser importadas o construidas directamente en el núcleo. Este concepto es ampliamente reconocido como clave en el diseño de software, ya que se utiliza como una métrica para evaluar la mantenibilidad de un sistema, siendo el bajo acoplamiento lo más deseable. Sin embargo, se propone un enfoque de alto acoplamiento con redes neuronales, ya que la dependencia entre estos dos módulos podría aportar beneficios en una funcionalidad nativa de comparación de imágenes, gracias al mayor control que el modelo podría ejercer dentro del núcleo o motor del SGBD.Actualmente ninguna de las soluciones presenta una función nativa ni de alto acoplamiento a modelos de inteligencia artificial (IA) para su funcionamiento, este es un obstáculo, debido a que las herramientas como las Redes Neuronales Convolucionales (CNN) pueden contribuir significativamente a la medición de la eficiencia mediante un alto acoplamiento en la administración de datos no estructurados, específicamente imágenes, a través de la extracción de características para su comparación.