Plan de gestión de datos
A plan de gestión de datos o DMP es un documento formal que describe cómo se manejará sus datos durante su investigación, y después de completa el proyecto.[1] El objetivo de un plan de gestión de datos es considerar los aspectos de la gestión de datos, metadatos generación, preservación de datos y análisis antes de que comience el proyecto; Esto asegura que los datos son bien administrados en el presente y preparado para la preservación en el futuro.
Contenido
- 1 Importancia
- 2 Componentes principales
- 2.1 Información sobre datos y formato de datos
- 2.2 Formato y contenido de metadatos
- 2.3 Políticas de acceso, compartir y reutilizar
- 2.4 Administración de datos y almacenamiento a largo plazo
- 2.5 Presupuesto
- 3 Plan de manejo de datos NSF
- 4 Plan de manejo de datos ESRC
- 5 Referencias
- 6 Enlaces externos
Importancia
Preparación de un plan de manejo de datos antes de que se recogen datos asegura que datos en el formato correcto, organizado bien y mejor anotado.[2] Esto ahorra tiempo en el largo plazo porque no hay ninguna necesidad de reorganizar, volver a formatear o tratar de recordar los detalles acerca de los datos. También aumenta la eficacia de la investigación puesto que tanto el recopilador de datos y otros investigadores será capaces de entender y utilizar datos bien comentadas en el futuro. Uno de los componentes de un plan de manejo de datos es archiving de datos y conservación. Al decidir sobre un archivo antes de tiempo, el recopilador de datos puede formatear los datos durante la recogida para facilitar su futura presentación a una base de datos. Si se conservan datos, que son más relevantes ya que pueden ser utilizados nuevamente por otros investigadores. También permite el recopilador de datos dirigir las solicitudes de datos a la base de datos, en lugar de dirección peticiones individualmente. Datos que se conservan tienen el potencial de conducir a descubrimientos nuevos, no anticipados, y evitan la duplicación de los estudios científicos que ya se han realizado. Archiving de datos también ofrece seguro contra la pérdida por el recopilador de datos.
Las agencias financiadoras comienzan a exigir planes de manejo de datos como parte del proceso de evaluación y propuesta.[3]
Componentes principales
Información sobre datos y formato de datos
- Incluir una descripción de los datos a ser producida por el proyecto. Esto podría incluir (pero no se limita a) datos que son:
- Experimental
- Observacionales
- Crudo o derivados
- Colecciones físicas
- Modelos
- Simulaciones
- Materiales curriculares
- Software
- Imágenes
- ¿Cómo se adquirirán los datos? ¿Cuándo y dónde serán adquirido?
- ¿Después de la recolección, cómo los datos se procesarán? Incluir información sobre
- Software utilizado
- Algoritmos
- Flujos de trabajo científicos
- Se describen los formatos de archivo que se utilizará, justifican esos formatos y describen las convenciones de nomenclatura utilizadas.
- Identificar las medidas de aseguramiento y control de calidad de calidad que se tomarán durante el procesamiento, análisis y recolección de muestras.
- Si se utilizan los datos existentes, ¿cuáles son sus orígenes? ¿Cómo se combinarán los datos recogidos con los datos existentes? ¿Cuál es la relación entre los datos recogidos y los datos existentes?
- ¿Cómo se gestionará los datos en el corto plazo? Considere lo siguiente:
- Control de versiones los archivos
- Respaldar datos y productos de datos
- Seguridad y protección de datos y productos de datos
- ¿Quién será responsable de gestión
Formato y contenido de metadatos
Metadatos son los detalles contextuales, incluyendo cualquier información importante para el uso de datos. Esto puede incluir las descripciones de los datos temporales y espaciales, instrumentos, parámetros, unidades, archivos, etc.. Metadatos se conoce comúnmente como "datos sobre datos".[4] Considere lo siguiente:
- ¿Qué metadatos son necesarios? Incluir cualquier información que datos significativos.
- ¿Cómo se crea o capturado los metadatos? Los ejemplos incluyen los cuadernos de laboratorio, unidades de GPS de mano, almacenados automáticamente archivos de instrumentos, etc..
- ¿Qué formato se utilizará para los metadatos? Considerar la normas de metadatos comúnmente utilizados en la disciplina científica que contiene tu trabajo. Debe existir justificación para el formato elegido.
Políticas de acceso, compartir y reutilizar
- Describir las obligaciones que existen para compartir los datos recogidos. Esto puede incluir las obligaciones de los organismos de financiación, las instituciones, organizaciones profesionales y los requisitos legales.
- Incluir información acerca de cómo se compartirán datos, incluso cuando los datos serán accesibles, cuánto tiempo estarán disponibles los datos, cómo puede obtenerse acceso y cualquier derecho que se reserva el recopilador de datos para el uso de datos.
- Dirección problemas éticos o privacidad con uso compartido de datos
- Dirección propiedad intelectual & derechos de autor cuestiones. ¿Quién posee los derechos de autor? ¿Cuáles son los institucional, editor, o las políticas de la Agencia de financiación asociados con la propiedad intelectual? ¿Hay embargos por razones políticas, comerciales o patentes?
- Describir los usos futuros previstos/usuarios para los datos
- Indican cómo deben citarse los datos por otros. ¿Cómo se abordará el tema de la citación persistente? Por ejemplo, si los datos se depositarán en un archivo público, el conjunto de datos tendrá un Identificador de objeto digital (doi) asignado.
Administración de datos y almacenamiento a largo plazo
- Los investigadores deben identificar un archivo adecuado para la preservación a largo plazo de sus datos. Identificando el archivo temprano en el proyecto, los datos pueden ser formateados, transformados y documentados adecuadamente para cumplir con los requisitos del archivo. Investigadores deben consultar con colegas y sociedades profesionales en su disciplina para determinar la base de datos más apropiada e incluyen un archivo de copia de seguridad en su plan de manejo de datos en caso de que su primera opción sale de existencia.
- Temprano en el proyecto, el investigador principal debe identificar qué datos se conservará en un archivo. Por lo general, preservando los datos en su forma más cruda es deseable, aunque los productos y derivados de datos también pueden ser preservados.
- Un individuo debe ser identificado como la principal persona de contacto para los datos archivados y debe asegurarse una información siempre actualizada en caso de que hay solicitudes de datos o información sobre los datos.
Presupuesto
Los costos de manejo y preservación de datos pueden ser considerables, dependiendo de la naturaleza del proyecto. Anticipando los costos antes de tiempo, los investigadores aseguran que los datos sean correctamente administrados y archivados. Posibles gastos que deben ser considerados son
- Tiempo personal para preparación de datos, gestión, documentación y preservación
- Hardware o software necesario para la gestión de datos, realizar copias de seguridad, seguridad, documentación y preservación
- Costos asociados con la presentación de los datos a un archivo
El plan de manejo de datos debe incluir cómo se pagará estos costos.
Plan de manejo de datos NSF
Toda concesión de propuestas presentadas a NSF debe incluir un Plan de manejo de datos que es no más de dos páginas.[5] Esto es un suplemento (no forma parte de la propuesta de la 15 página) y debe describir cómo la propuesta se ajusta a la política de concesión y Administration Guide (véase abajo). Puede incluir lo siguiente:
- Los tipos de datos
- Los estándares para ser utilizado para el contenido y formato de datos y metadatos
- Políticas de acceso y distribución
- Las políticas y disposiciones para su reutilización
- Planes para archiving de datos
Política resumido de la NSF Premio and Administration Guide, sección 4 (difusión y el intercambio de resultados de investigación):[6]
- Publicar puntualmente con autoría apropiada
- Compartir datos, muestras, colecciones físicas y materiales de apoyo con otros, dentro de un plazo razonable
- Compartir software y las invenciones
- Los investigadores pueden mantener sus derechos legales sobre su propiedad intelectual, pero que todavía tienen que poner a disposición de otros sus resultados, datos y colecciones
- Se implementarán políticas vía
- Revisión propuesta
- Premio negociaciones y condiciones
- Soporte/incentivos
Plan de manejo de datos ESRC
Desde 1995, el Reino Unido Consejo de investigación económica y Social (ESRC) han tenido una política de investigación de datos en el lugar. La actual política de datos de investigación ESRC afirma que datos de la investigación creados como resultado de investigaciones financiadas por el ESRC deben disponerse abiertamente a la comunidad científica a la medida de lo posible, a través de preservación a largo plazo y gestión de datos de alta calidad.[7]
ESRC requiere un plan de gestión de datos para todas las aplicaciones del premio de investigación donde se crean nuevos datos. Estos planes están diseñados para promover un enfoque estructurado para la gestión de datos a lo largo del ciclo de vida de la información, resultando en mejores datos de calidad que está listos para archivar para compartir y reutilizar. El Servicio de datos del Reino Unido, servicio de datos del ESRC insignia proporciona orientación práctica sobre planificación de la gestión de datos de investigación adecuada para investigadores de las ciencias sociales en el Reino Unido y en todo el mundo.[8][9]
ESRC tiene un acuerdo de larga data con la UK Data Archive, con sede en la Universidad de Essex, como un lugar de depósito de datos de la investigación, con los titulares de la concesión necesarios para ofrecer datos resultantes de sus investigaciones le otorga mediante el servicio de datos del Reino Unido.[10] El archivo permite reutilizar datos por preservar los datos y poniéndolos a disposición de la investigación y enseñanza de las comunidades.
Referencias
- ^ https://www2.lib.Virginia.edu/Brown/Data/plan.html
- ^ https://libraries.mit.edu/Guides/subjects/Data-Management/Why.html
- ^ https://www.NSF.gov/BFA/dias/Policy/dmpfaqs.jsp
- ^ Michener, WK y JW Brunt. 2000. Datos ecológicos: Diseño, manejo y procesamiento. Blackwell Science, 180p.
- ^ https://www.NSF.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp#DMP
- ^ https://www.NSF.gov/BFA/dias/Policy/DMP.jsp
- ^ Política de datos de investigación ESRC 2010
- ^ Preparar y administrar los datos: Guía del servicio de datos del Reino Unido
- ^ SAGE manual: manejo y uso compartidos de datos: una guía de buenas prácticas
- ^ UK Data Archive: ¿Quién puede depositar datos?
Enlaces externos
- Manual de Salvia:: Administrar y compartir datos de investigación: una guía de buenas prácticas
- DMPTool:: Orientación y recursos para planes de gestión de datos
- Biblioteca Digital de California, Universidad de California Centro de curación (UC3)
- DataONE
- Biblioteca de la Universidad de Virginia
- DMPonline
- Centro de conservación digital
- Biblioteca de la Universidad de Michigan
- NSF Grant propuesta directrices
- Consorcio Interuniversitario para la investigación política y Social
- LTRO Blog: Cómo escribir un plan de manejo de datos
- Más información sobre planes de manejo de datos en GESIS – Instituto de Leibniz para las ciencias sociales
- Servicio de datos del Reino Unido:: Preparar y administrar datos: orientación y herramientas para investigadores de las ciencias sociales