La gestión de datos, fase importante en la investigación.

18 de febrero de 2022

Empecemos respondiendo a la pregunta “¿Qué son los datos de investigación?”

Existe gran variedad de definiciones sobre los datos de investigación, ya que están relacionados al contexto en el que se hace la pregunta. Por ejemplo: las fotografías son datos de investigación, así como una tabla donde se recolecta información o, también los propios datos que hacen parte de una matriz. Todos son soportes y materiales obtenidos de una investigación. Por ello, la definición que consideramos más apropiada para este ensayo es la dada por Couto (2017). “Los datos de investigación son todas las evidencias que un investigador necesita para validar sus conclusiones tras una investigación” (p.28). Esto incluye metadatos, bitácoras, memorias, encuestas, entrevistas, imágenes, videos, audios, etc.

Según lo anterior, es importante conocer cómo se clasifican estos datos, resaltando que deben ser fiables, accesibles, interoperables y reusables (FAIR). Principalmente, tenemos datos cuantificables, aquellos que se pueden expresar numéricamente, y cualitativos, aquellos que soportan una descripción o que intentan reflejar la calidad y atributos del sujeto u objeto de estudio (Couto, 2017). Asimismo, y como complemento, la National Science Board (2005) clasifica los datos de investigación en las siguientes categorías:

Datos observacionales: son obtenidos a partir de las observaciones realizadas en una investigación en cierto momento, por lo tanto, no pueden volver a ser recolectados y su preservación es crítica.
Datos computacionales: son resultado de ejecutar un modelo o simulación de computación. En este caso, puede no ser necesario preservar los outputs, pero sí los parámetros del modelo (hardware, software, inputs).

Datos experimentales: son obtenidos usualmente a través de mediciones en laboratorios. Si bien las experiencias pueden ser reproducidas en muchos de los casos, su preservación es importante, también, en cuanto a los costos que puede suponer volver a colectarlos o por la dificultad de conseguir, exactamente, las mismas condiciones.

Igualmente, en el mismo documento, se menciona otra clasificación relacionada a la etapa de procesamiento en que se encuentren:

Datos en bruto: tal y como son producidos o recolectados.
Datos derivados: son aquellos construidos a partir del análisis, procesamiento o sistematización de datos en bruto, pudiendo generarse distintas versiones de datos.
Datos intermedios: colectados en etapas preliminares de la investigación.

Datos finales: el conjunto de datos seleccionados que finalmente se utilizan para validar los resultados.

Swan y Brown (2008) agregan una clasificación adicional según el objetivo de recolección:

Propósito específico: para un proyecto particular y pueden tener poco de interés fuera de dicho proyecto.
De mediano alcance: pueden proveer información de interés o ser de referencia para una disciplina o grupo de disciplinas.
De amplio interés: pueden constituir una referencia canónica para un gran número de investigadores en el mundo.

Una vez ya tenemos claro qué son los datos de investigación y su clasificación, debemos centrarnos en la creación del “Plan de Gestión de Datos” (PGD). En el cual se especifican cuáles son las políticas que acobijan la investigación, por ejemplo, los requisitos de un ente financiador o los requisitos de la revista en que se piensa publicar la investigación.

Estos son algunos de los elementos que debe incluir un PGD:

Características de los datos de investigación almacenables
Recopilación de los datos
Almacenamiento y copias de seguridad

Selección y preservación
Asignación de responsabilidad y recursos para su sostenibilidad.

Se puede utilizar una herramienta como DMP Tool o el Data Management Planning Tool y, a través de una serie de preguntas, facilitar la construcción del PGD.

Cuando ya está definido el PGD, podemos garantizar que nuestros datos cumplan los requisitos FAIR y, así, dependiendo el repositorio donde se almacenen, otros investigadores podrán consultar y reutilizar estos datos. Por ende, estos deberán ser citados y referenciados respectivamente a través del DOI, Handle o URL fija.

Ejemplo de cómo citar y referenciar datos de investigación en APA 7th:

Cita entre paréntesis: (Remesar et al., 2015)

Cita narrativa: Remesar et al. (2015)

Referencia

Remesar, X., Antelo, A., Lliviana, C., Albá, E., Berdié, L., Agelini, S., … Alemany, M. (2015). Influence of hyperlipidic diet on the composition of the non-mebrane lipid 6 pool of red blood cells of male and famale rats Versión de 22 de junio de 2015 [Dataset]. Dipósit digital de documents de la UAB. https://hdl.handle.net/2445/66010

Autor (es): Remesar Betlloch, X., Antelo, A., Lliviana, C., Albá, E., Berdié, L., Agelini, S., … Alemany, M.

Año de publicación: (2015).

Título: Influence of hyperlipidic diet on the composition of the non-mebrane lipid 6 pool of red blood cells of male and famale rats.

Tipo de recurso: [Dataset]

Número o fecha de la versión de los datos citados: Versión de 22 de junio de 2015.

Repositorio donde están almacenados los datos: Dipósit digital de documents de la UAB.

Identificador único o enlace permanente: https://hdl.handle.net/2445/66010

Es de resaltar la importancia para los autores evitar la manipulación de datos, la cual es considerada como una mala conducta en la investigación científica y definida por Lam (2018) como el proceso de “falsificación, fabricación o plagio al proponer, realizar o revisar investigaciones o reportar los resultados de los estudios”. De ahí, la importancia en que los investigadores realicen un correcto PGD, que sirva como herramienta de apoyo y soporte a su investigación en caso de ser acusados de manipulación de datos de investigación y dejarse llevar por la presión de publicar y conseguir un reconocimiento-(lo que ha empujado a muchos investigadores a gestionar de manera ilícita sus datos de investigación), sin tener en cuenta que, en el momento de ser descubiertos, dicho acto impactará de manera negativa su reputación como científicos y autores académicos.

Un ejemplo de este tipo de conducta fue el de la investigadora Haruko Obokata y la publicación de su estudio de células madre, quien, poco tiempo después de publicar su artículo en el que aseguraba haber descubierto una forma novedosa y sencilla de obtener células madre, fue criticada y evaluada por la veracidad de su propia investigación, siendo, finalmente, encontrada culpable de mala conducta científica (Cyranoski, 2014). Por lo que dos de sus artículos fueron retractados de la revista Nature por mala conducta, es decir, que cometió algún tipo de fraude intencional (Campos y Ruano, 2019) y posiblemente fue la manipulación de datos de investigación, porque fue imposible replicar los experimentos de la investigación y, además, se descubrieron imágenes duplicadas y alteradas. Lo anterior perjudicó su credibilidad en la comunidad científica, perdió la rigurosidad metodológica de un investigador y su prestigio como profesional.

Imagen tomada de: https://bit.ly/350NuLU

En conclusión, los beneficios de salvaguardar la información son muchos. podemos resaltar que la correcta gestión de los datos de investigación permite, en gran medida, evitar el mal uso de los datos, proteger y soportar la autoría de su trabajo y sobre todo, preservar y garantizar el acceso a los datos de investigación en tiempos futuros. Para esto, pues, es de vital importancia crear un Plan de Gestión de Datos y coordinar un proceso que permita mantener los archivos con los datos de investigación correctamente almacenados, identificados y preservados para que puedan ser de fácil acceso.

Por último, recomendamos usar el repositorio institucional Séneca como herramienta para almacenar y compartir sus datos de investigación de una forma segura y confiable, proporcionando acceso libre a los ciudadanos y realizando un gran aporte a la ciencia abierta.

Si desea ampliar información sobre el uso y gestión de datos de investigación, no dude en acercarse al Sistema de Bibliotecas o escribirnos por redes sociales.

Referencias:

Angelozzi, S. (2020). La gestión de datos de investigación en abierto: introducción al rol emergente paralas bibliotecas universitarias y científicas argentinas. Memoria Académica. 9 (2),e091. http://www.memoria.fahce.unlp.edu.ar/art_revistas/pr.11737/pr.11737.pdf

Campos, I. y Ruano, A. (2019). Misconduct as the main cause for retraction. A descriptive study of retracted publications and their authors. Gaceta Sanitaria. 33 (4). 356 – 360. https://doi.org/10.1016/j.gaceta.2018.01.009

Couto Corrêa, F. (2017). Gestión de datos de investigación. Universitat Oberta de Catalunya. https://www-digitaliapublishing-com.ezproxy.uniandes.edu.co/a/47348

Cyranoski, D. (2014) Papers on ‘stress-induced’ stem cells are retracted. Nature. News. https://doi-org.ezproxy.uniandes.edu.co/10.1038/nature.2014.15501

Lam Díaz, R. (2018). Mala conducta científica en la publicación. Revista Cubana de Hematología, Inmunología y Hemoterapia, 34(1). Recuperado de http://www.revhematologia.sld.cu/index.php/hih/article/view/546/776

National Science Board. (2005). Long-lived digital data collection: enabling research and education in the 21st century.Arlington: NSF. https://www.nsf.gov/pubs/2005/nsb0540/nsb0540.pdf

Swan, A. y Brown, S. (2008). To share or not to share: publication and quality assurance of research data outputs. Areport commissioned by the Research Information Network. London. https://eprints.soton.ac.uk/266742/1/Published_report_-_main_-_final.pdf

Imagen principal tomada de Freepik

Realizado por:

Tatiana Boada – Especialista en nuevas tecnologías en educación.

Jefferson Garcia – Magister en gestión social empresarial.

La gestión de datos, fase importante en la investigación.

i-rus.png

recursos_electronicos.png

biblioguia.png

repositorio_institucional_seneca.png

logo-andes.svg

logo-biblioteca-2020.svg

Redes sociales

La gestión de datos, fase importante en la investigación.

Compartir

i-rus.png

recursos_electronicos.png

biblioguia.png

repositorio_institucional_seneca.png

logo-andes.svg

logo-biblioteca-2020.svg

Redes sociales