Ir al contenido principal

Gestión de datos de investigación (GDI)

Guía completa para investigadores sobre gestión de datos científicos y plan de gestión de datos de investigación: planificación, metadatos, preservación y acceso abierto.

¿Qué es la gestión de datos de la investigación o GDI?

  • La gestión de datos de investigación se refiere al tratamiento que se da a los datos dentro del ciclo de vida de la investigación, con el objetivo de favorecer su reproducción, su reutilización, accesibilidad, conservación, autenticidad y su integridad mientras tienen valor o son de interés: académico, administrativo o de archivo.
  • Facilita garantizar la verificación de los resultados de una investigación.
  • Permite hacer visibles, disponibles, seguros y compartibles los datos que se generan desde el inicio de la investigación hasta la obtención de resultados.

¿Qué son los datos de investigación?

  • Todos los datos que son creados por investigadores(as) en el curso de su trabajo, y sobre los cuales la institución es responsable.
  • Datos de terceras partes que puedan haberse creado al interior de la institución o que provienen de otro lugar.
  • Las evidencias de las hipótesis o preguntas que se plantea el/la investigador(a), sin importar su formato (impreso, digital o físico)
  • Información cuantitativa o cualitativa recogida a través de la experimentación, observación, modelamiento, entrevistas, y otros métodos de investigación.

Ciclo de los datos de investigación

El ciclo de los datos científicos describe las etapas que siguen los datos a lo largo de una investigación, desde la planificación hasta su reutilización. Su objetivo es asegurar calidad, trazabilidad, acceso responsable y preservación a largo plazo.

Infografía del ciclo de los datos científicos (REBIUN/CRUE)
Fuente: CRUE – REBIUN, El ciclo de los datos científicos. Licencia CC BY.

Etapas del ciclo

  • Diseñar: definir objetivos, preguntas de investigación y metodología.
  • Planificar: establecer el plan de gestión de datos (estándares, formatos, roles y responsabilidades).
  • Crear/recoger: obtener datos mediante experimentación, observación, encuestas o recopilación.
  • Describir: asignar metadatos que documenten contexto, procedencia, variables y condiciones de uso.
  • Procesar: limpiar, transformar y organizar los datos para su análisis.
  • Archivar: almacenar de forma ordenada con convenciones de nombres y estructuras claras.
  • Seleccionar: decidir qué conjuntos conservar a largo plazo según valor y requisitos.
  • Preservar: aplicar estrategias y copias de seguridad para garantizar integridad y legibilidad futuras.
  • Acceder y usar: definir licencias, niveles de acceso y condiciones de utilización ética.
  • Compartir: difundir datos en repositorios confiables para su descubrimiento y citación.
  • Reutilizar: emplear los datos en nuevos estudios, favoreciendo la verificación y la ciencia abierta.

¿Cuáles son beneficios de la gestión de datos de investigación?

  • Inciden en el crecimiento económico y tienen beneficio social, ya que favorece el uso eficiente de los recursos públicos. 
  • Contribuyen a la transparencia y con ello el incremento de la confianza pública en la investigación.
  • Los resultados de la investigación pueden ser sometidos a escrutinio, testeados, validados, replicados o reproducidos.
  • Permiten mejorar el acceso y el intercambio de los datos.
  • Favorecen la cooperación y generación de redes entre investigadores(as).
  • Promueven la responsabilidad de asegurar que los datos sean gestionados apropiadamente,  sean accesibles, inteligibles, evaluables y usables por otros.
  • Elevan el estándar de la investigación y resguardo de las buenas prácticas de investigación.

Profesora Lynn Jamieson - La importancia de la gestión de datos

(Subtítulos en español)

Este video es parte de MANTRA, el curso gratuito en línea de Gestión de Datos de Investigación creado por la Biblioteca de Datos de la Universidad de Edimburgo: http://mantra.edina.ac.uk/. Profesora Lynn Jamieson, University of Edinburgh.

Buenas prácticas

  • Documentar metadatos correctamente: Registra de forma clara la descripción de los datos, su origen, metodología, formatos y condiciones de uso para facilitar su comprensión, reutilización y validación.
  • Usar formatos abiertos y no propietarios: Prioriza formatos como CSV, TXT, XML o TIFF, que no dependen de software específico, garantizando la preservación a largo plazo.
  • Almacenar copias de seguridad periódicas: Mantén al menos tres copias de los datos en diferentes ubicaciones (principio 3-2-1) y verifica su integridad regularmente.
  • Definir políticas de acceso y licencias de uso: Establece de antemano quién puede acceder a los datos, bajo qué condiciones, y utiliza licencias abiertas (como Creative Commons) cuando sea posible.
  • Proteger datos sensibles cumpliendo normativas: Aplica cifrado, anonimización y medidas de seguridad para datos personales o confidenciales, cumpliendo con el RGPD y la Ley chilena de protección de datos.

Fuentes

  1. CEPAL. (2020). Gestión de datos de investigación. Recuperado de https://biblioguias.cepal.org/gestion-de-datos-de-investigacion/
  2. CEPAL. (2016). Gestión de datos de investigación: algunos conceptos básicos. Recuperado de http://www.cepal.org/es/notas/gestion-datos-investigacion-algunos-conceptos-basicos
  3. Universidad de Valladolid. (2023). Datos de investigación: Gestión de datos de investigación. Recuperado de http://biblioguias.uva.es/datos-investigacion/gestion

Datos abiertos