MAPAS DE LA CIENCIA CON VOSVIEWER
24 y 25 de septiembre de 2024
Departamento de Organización de Empresas
UCM
Este seminario está dirigido a investigadores interesados en el mapeo de la ciencia sin conocimientos previos.
Día 1 – Sesión 1
Introducción al análisis de redes y mapas de la ciencia
El análisis de redes es una herramienta fundamental en el estudio de relaciones complejas, muy útil en diversas disciplinas, especialmente en el campo de la ciencia. Para entender mejor cómo funciona, es clave conocer la diferencia entre la teoría de grafos y el análisis de redes, que aunque se relacionan, tienen enfoques diferentes.
📌 Teoría de grafos y redes
Teoría de grafos
Es una rama de las matemáticas que se centra en el estudio de estructuras abstractas llamadas grafos, compuestas por vértices (nodos) y aristas (conexiones). Su objetivo es analizar propiedades puramente matemáticas, como el recorrido entre nodos, la conectividad, o la existencia de ciclos.
Análisis de redes
Aplica conceptos de la teoría de grafos para estudiar redes reales en contextos concretos, como las redes sociales o los mapas de la ciencia. El análisis de redes tiene una mayor orientación práctica, enfocándose en cómo fluyen las interacciones entre los nodos (personas, artículos, instituciones, etc.).
📌 Conceptos básicos de redes
Para realizar un buen análisis de redes, es esencial entender algunos conceptos clave. Estos términos son los pilares sobre los que se construye el estudio de cualquier red.
Elemento | Descripción | Ejemplo |
---|---|---|
🟢 Nodo | Representa una entidad o actor dentro de la red. | Autores de una publicación |
🔗 Arista | Conexión entre dos nodos. Indica una relación o interacción. | Una cita entre dos artículos |
🔢 Grado | Número de conexiones que tiene un nodo. | Total de coautorías |
⚖️ Peso | Valor asignado a una arista que refleja la fuerza de la relación. | Número de citas entre dos instituciones |
🛤️ Caminos | Secuencias de aristas que conectan un conjunto de nodos. | La ruta de citas entre autores |
🧩Clúster | Grupo de nodos que tienen más conexiones entre ellos que con el resto de la red | Un grupo de palabras que coocurren con frecuencia |
📌 Los roles de los nodos
Son de manera general varios los tipos de nodos que podemos encontrar en base a sus relaciones:
- 🔥 Hub: Es un nodo con muchas conexiones, que actúa como un «centro» dentro de la red.
- 🌉 Puente: Es un nodo que conecta dos o más partes de la red que, de otro modo, estarían separadas.
- 🛰️ Satélite: Es un nodo con pocas conexiones que suele estar en los márgenes de la red y que puede representar entidades especializadas o independientes.
📌 Aspectos visuales
Una visualización efectiva de redes requiere ajustar parámetros clave para resaltar información importante y hacerla más comprensible:
- Eliminar nodos y relaciones no valiosos: Filtrar nodos con pocas conexiones o relaciones insignificantes evita saturar la visualización y mejora la claridad. Esto permite que los elementos importantes destaquen sin ruido.
- Escalar nodos y aristas: Ajustar el tamaño de los nodos según su conectividad u otros atributos permite identificar fácilmente los más importantes. De igual forma, ajustar el grosor de las aristas según el peso de las relaciones destaca las conexiones más relevantes.
- Asignar colores: Usar colores para agrupar nodos por categorías o clústeres (temas, autores, instituciones) facilita la interpretación y ayuda a identificar patrones, subredes o áreas clave en la red.
- Distribuir nodos: Aplicar algoritmos de distribución de nodos permite que estos se sitúen de manera más ordenada e intuitiva, sacando a relucir relaciones.
⚠️ Advertencia
El análisis de redes no es un método exacto, ya que indicadores como la centralidad y los algoritmos de distribución pueden ser sensibles a los parámetros iniciales o presentar variabilidad. Los resultados pueden variar ligeramente según las configuraciones y ajustes utilizados
📌 Los mapas de la ciencia
Un mapa de la ciencia es una red que representa visualmente las relaciones entre los diferentes actores del mundo académico, como autores, artículos, instituciones y temas de investigación. En esta red, los nodos son los elementos científicos (autores, publicaciones, etc.) y las aristas son las conexiones que indican interacciones entre ellos, como citas, coautorías o coocurrencias.
Los mapas de la ciencia permiten mapear:
- Estructuras sociales: Muestran cómo las entidades analizadas están conectadas a través de colaboraciones y relaciones académicas.
- Estructuras cognitivas: Revelan cuáles son los temas y áreas de conocimiento.
📌 Tipologías comunes
Tipo de mapa | Descripción | Utilidad | Entidades comunes |
---|---|---|---|
Mapa de citación | Muestra cómo se citan entre sí las entidades | Evaluar la influencia y el impacto dentro de una comunidad | artículos autores países revistas |
Mapa de coocurrencia | Visualiza entidades que aparecen juntos con frecuencia | Identificar temas recurrentes y tendencias emergentes | palabras clave términos |
Mapa de colaboración | Muestra las conexiones entre entidades que han trabajado juntas | Analizar las redes de colaboración o coautoría | autores instituciones países |
Mapa de cocitación | Refleja cómo dos entidades son citadas juntas por otras | Identificar relaciones conceptuales y temáticas | artículos autores |
Mapa de emparejamiento bibliográfico | Agrupa entidades que comparten las mismas fuentes o referencias | Detectar agrupaciones basadas en similitud teórica o metodológica | artículos autores |
📌 Overlay maps
Los overlay maps (mapas superpuestos) es un método que permite superponer información adicional sobre un mapa de red ya existente.
¿Cómo funcionan?
- Un mapa base muestra la estructura de una red (por ejemplo, un mapa de coautoría), con nodos y aristas representando las relaciones entre los elementos.
- Sobre este mapa, se puede superponer una capa de datos adicionales añadiendo color o tamaño a los nodos, para ofrecer información adicional.
📌 Errores a evitar
Son varios los errores o elementos críticos que se pueden identificar comúnmente en este tipo de análisis:
- Cualquiera puede ejecutarlo sin saber qué está haciendo
- Ejecución apresurada y sin control
- Datos limitados o sesgados
- Problemas de filtrado
- Ausencia de interpretación y lectura
- Métricas mal interpretadas
- Uso excesivo de visualizaciones sin sentido
- No ajustar correctamente los parámetros visuales
📌 Ejemplos
Investigación
Vargas-Quesada, B., Arroyo-Machado, W., Muñoz-Écija, T., & Chinchilla-Rodríguez, Z. (2023). Science overlay maps: A tribute to Loet Leydesdorff. Profesional De La información, 32(7). https://doi.org/10.3145/epi.2023.dic.05
Informes
Mapas interactivos de la región de Murcia – Fundación Seneca
📌 Principales herramientas
El desarrollo de mapas de la ciencia ha sido facilitado por una serie de herramientas especializadas y gratuitas:
- VOSviewer: La herramienta más popular para los mapas de la ciencia. [🔗 enlace]
- CiteSpace: Otra de las herramientas más populares con visualizaciones más complejas. [🔗 enlace]
- Biblioshiny: Herramienta cada vez más popular entre cuyas opciones está la posibilidad de generar mapas. [🔗 enlace]
- Pajek: Herramienta clásica para los mapas de la ciencia con multitud de opciones. [🔗 enlace]
- SciMAT: Herramienta clásica en los mapas de la ciencia y que ofrece muchas opciones en la parametrización [🔗 enlace]
Día 1 – Sesión 2
Preparación e importación de datos
📌 Compatibilidad de datos
VOSviewer admite tres tipos principales de datos para generar redes:
- Archivos de redes: Estos contienen directamente los nodos (entidades) y las conexiones (aristas) entre ellos. Se usan para representar relaciones predefinidas, como coautorías o citas.
- Datos bibliográficos: Extraídos de bases de datos académicas, como Scopus, Web of Science o archivos RIS, permiten generar redes de citas, cocitación, coautoría y más.
- Datos de texto: Basados en la coocurrencia de palabras clave o términos dentro de un corpus de documentos, ideales para identificar relaciones semánticas y temáticas.
📌 Archivos de redes
- VOSviewer: Es el formato propio de la herramienta y permite importar dos archivos distintos:
- Map (opcional): Define los nodos de la red.
- Network (requerido): Define las conexiones entre los nodos, es esencial para la creación de cualquier red.
- JSON: Es un formato flexible y muy utilizado para el intercambio de datos estructurados.
- GML (Graph Modelling Language): Un formato estándar para describir redes.
- Pajek: Formato utilizado por el software Pajek para analizar redes.
📌 Datos bibliográficos
Datos a través de API: VOSviewer permite conectar directamente con APIs de varias bases de datos y fuentes bibliográficas.
- ✅ Esta opción es ideal para obtener datos de forma directa y actualizada desde estas plataformas
- 📝 Las APIs compatibles son: OpenAlex, Crossref, Europe PMC, Semantic Scholar, OCC (OpenCitations Corpus), COCI (OpenCitations Index) y Wikidata
Datos de archivos de bases de datos bibliográficas: Permite importar datos que previamente se hayan descargado de bases de datos académicas en formatos compatibles.
- ✅ Esta opción facilita el análisis de redes usando datos que ya han sido exportados de estas
- 📝 Los formatos compatibles son: Web of Science, Scopus, Dimensions, Lens y PubMed
Datos de archivos de gestores de referencias: También admite archivos exportados desde gestores de referencias bibliográficas como RIS, EndNote o RefWorks.
- ✅ Permite crear redes a partir de las referencias bibliográficas guardadas en estos gestores
- 📝 Los formatos compatibles son: RIS, EndNote y RefWorks
📌 Datos de texto
Esta opción permite la compatibilidad con los datos bibliográficos mencionados previamente y, además, ofrece mediante la opción de VOSviewer la posibilidad de leer un archivo de texto para extraer texto.
Día 2 – Sesión 1
Análisis principales con VOSviewer
📌 Tipos de análisis
Los análisis que permite VOSviewer son los siguientes:
- Co-authorship (Coautoría): Genera una red basada en las colaboraciones entre autores, instituciones o países. Cada nodo representa un autor o institución, y las aristas muestran las relaciones de coautoría (documentos escritos conjuntamente).
- 💡 Tips – Usa el filtro para ignorar documentos con demasiados autores para evitar que la red se sobrecargue.
- Co-occurrence (Coocurrencia): Este análisis crea una red de términos clave o palabras que aparecen juntos en un conjunto de documentos. Cada nodo es un término, y las aristas muestran la frecuencia con la que estos términos coocurren en los documentos.
- 💡 Tips – Filtra términos con pocas ocurrencias, y selecciona el 60% más relevante para destacar los términos clave y elimina términos incluidos en la consulta (si fuese el caso)
- Citation (Citas): Genera una red de citas. Cada nodo representa un documento o autor, y las aristas indican la frecuencia con la que se citan mutuamente.
- 💡 Tips – Usa el conteo fraccionado para equilibrar el impacto de los documentos con muchas citas.
- Bibliographic coupling (Emparejamiento bibliográfico): En este análisis, los documentos están conectados si comparten referencias bibliográficas. Las conexiones indican cuántas referencias tienen en común.
- 💡 Tips – Filtra documentos menos citados para centrarte en los estudios más influyentes.
- Co-citation (Cocitación): En esta red, los nodos son documentos o autores que son citados juntos en otros trabajos. Dos nodos estarán conectados si son mencionados conjuntamente en la misma referencia.
- 💡 Tips – Filtra documentos con un mínimo de citas en común para evitar ruido.
⚠️ Advertencia
En función de los datos importados a VOSviewer, este ofrecerá diferentes tipos de análisis como disponibles o no.
📌 El tesauro
Un tesauro es un archivo que permite normalizar términos y unificar variantes de palabras clave. Esto es útil para evitar duplicidades y mejorar la coherencia del análisis de redes:
- Función: Agrupa sinónimos o términos similares, como «AI» y «Artificial Intelligence» o «University of Almeria» y «Universidad de Almería«, para que se traten como un solo nodo en la red.
- Recomendación: Usa el tesauro especialmente en análisis de coocurrencia para mejorar la precisión cuando hay múltiples formas de escribir un término.
Día 2 – Sesión 2
Opciones visuales y exportación
📌 Opciones visuales
Cuando configures las opciones visuales en VosViewer, es importante equilibrar la claridad y detalle de la red. Aquí algunas recomendaciones generales para mejorar la interpretación de las redes:
- Escala y pesos: Ajustar la escala permite incrementar o reducir de manera uniforme el tamaño, mientras que el peso determina la variable del tamaño.
- Tamaño de etiquetas: El control de tamaño de etiquetas no solo ajusta el texto, sino también las diferencias visuales entre el nodo más grande y el más pequeño. Aumentar este valor incrementará la disparidad entre el tamaño.
- Líneas: Controla el tamaño de las líneas para destacar conexiones importantes, especialmente en redes con muchas aristas y ajusta la fuerza mínima para filtrar relaciones débiles.
- Colores: Asigna manualmente colores de clusters y/o overlay o exporta e importa configuraciones.
📌 Algoritmos de distribución
Existen varios métodos de distribución de los nodos en la red:
- No normalization (Sin normalización): Este método es útil si quieres que los nodos se distribuyan de acuerdo a sus relaciones directas, sin ningún ajuste adicional.
- Association strength (Fuerza de asociación): Es el método más utilizado en análisis bibliométricos porque distribuye los nodos en función de la fuerza de las relaciones entre ellos, ajustando la distancia entre nodos.
- Fractionalization (Fraccionamiento): Este método distribuye los nodos de manera que las conexiones entre nodos más pequeños o menos conectados se representen con más precisión.
- LinLog/modularity (LinLog/Modularidad): Este método tiende a maximizar la modularidad, lo que significa que está diseñado para crear grupos bien diferenciados. Es útil cuando el objetivo es identificar clusters o grupos dentro de la red.
📌 Clustering
Las opciones de clustering en VosViewer permiten ajustar cómo se agrupan los nodos. La resolución controla el nivel de detalle: valores más bajos generan grupos más amplios y menos específicos, mientras que valores más altos dividen la red en clusters más pequeños. El tamaño mínimo del clúster determina el número mínimo de nodos por grupo, filtrando los clusters irrelevantes. La opción de unir clusters pequeños combina automáticamente aquellos de menor tamaño con otros más grandes si están conectados, lo que ayuda a simplificar la visualización.