Producción científica de alta calidad

Artículos

Más allá de la calidad: predicción del impacto de las citas en la investigación empresarial mediante la ciencia de los datos

octubre 14, 2025

Encuentra más información en nuestro repositorio digital

El volumen de publicaciones científicas ha aumentado exponencialmente en las últimas décadas en prácticamente todas las disciplinas académicas. En este panorama de sobrecarga de información, se necesitan criterios objetivos para identificar la investigación de alto impacto

Los recuentos de citas han servido tradicionalmente como indicador primario de la relevancia científica; sin embargo, subsisten dudas sobre si reflejan realmente la calidad intrínseca de una publicación.

Este estudio investiga la relación entre la frecuencia de las citas y una amplia gama de variables editoriales, autoras y contextuales. Se analizó un conjunto de datos de 339.609 artículos indexados en Scopus, recuperados mediante la consulta de búsqueda TITLE-ABS-KEY (gestión) AND LIMIT-TO (subárea, «Busi»).

La investigación empleó un análisis descriptivo seguido por dos enfoques de modelado predictivo: un algoritmo Random Forest para evaluar la importancia de las variables y una regresión logística binaria para estimar la probabilidad de que se cite un artículo.

Los resultados indican que factores como el cuartil de la revista, el país de afiliación, el número de autores, la disponibilidad de acceso abierto y el uso de palabras clave influyen significativamente en los resultados de las citas.

El modelo de Bosque Aleatorio explica el 94,9% de la varianza, mientras que el modelo logístico alcanza un AUC de 0,669, permitiendo la formulación de una ecuación de cita predictiva.

Los hallazgos sugieren que múltiples determinantes más allá de la calidad del contenido impulsan el comportamiento de las citas, y que la probabilidad de cita puede predecirse con una precisión razonable, aunque deben reconocerse las limitaciones inherentes al modelo.

Accede al artículo completo aquí