《Nature》科研数据管理很重要!应拿出5%研究经费
2020-03-09 09:39:16 作者:本网整理 来源:材料科学网 分享至:

日前,《Nature》期刊发文称:5%的研究经费应用于确保科研数据可重复利用(鼓励重复性研究和无效结果)。荷兰 Barend Mons教授认为只拨经费支持研究而不负责数据管理是不负责任的。目前对科研数据管理有着迫切需求。应该对 科研数据管理投入部分管理经费,并且聘用专业的数据管理人员,利用专业的数据管理工具对科研数据进行科学管理 ,这不仅能解放科研人员获得更多的时间,以便更加投入研究工作,并且使得科研人员具有进一步利深入挖掘实验数 据进行科学分析。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.jpg

Nature 578, 491 (2020)


Barend Mons教授提出了FAIR法则(即可找到,可访问,可互操作和可再利用)作为科研数据管理的基本准则。并且其 同仁和荷兰政府制定了相关政策,目前正处于初步实施阶段。国际上其他国家也开始逐渐在科研数据管理领域加大投 入。Barend Mons教授还呼吁,利用项目研究经费的5%作为项目管理经费,并且项目负责人在申请项目时必须提交详细 的科研数据管理方案。项目资助方也应该要求项目实施方进行此项管理,否则不予以资助。这种科学的管理方式将使 得科研的产出比更高。


这种管理方式特别适用于目前高校和研究所的实际情况。高校中学生们自己管理自己的实验和研究数据,这不仅分散 了学生的经理,不利于深入开展研究工作。并且导致学生往往只关注对自己实验结果有利的部分数据,缺乏对实验数 据的深层次挖掘,一定程度上造成实验研究的不全面。因此,专职的数据管理人员在科研中十分必要。


许多棘手的问题只有通过数据密集型计算机辅助研究才能解决。绝大多数研究数据从未发布过。因为无法重复使用这 些数据而浪费了巨额研发资金。 数据再利用的相关政策已经有了,但是解决该问题所需要的资源可能是科学界难以面 对的。


2013年,Barend Mons教授作为荷兰专家小组的一员并且呼吁国家科学研究资助支持数据管理。七年后,协助起草的相 关政策开始实施。要求设备和研究人员创建的数据需满足FAIR原则。 目前Barend Mons教授主导一个国际全球开放展 览会(FAIR)办公室,负责帮助研究团队实施这一准则。并且认为这个举措将需要大量的专业数据管理人员,估计约 每20名研究人员中就需要一个数据管理人员。


即使数据共享,也缺少重复使用所需的原始数据、专业知识、技术支持以及基础设施。大多数已公开发表的数据集分 散在“补充文件”中,而补充文件中的数据是难以找到并且重复利用。这种做法使研究人员之间无法互相借鉴。例如 ,在疾病暴发的情况下,数据的确实可能造成死亡人数增加。


Barend Mons教授认为研究经费的5%应该用于数据管理。欧盟有3000亿欧元(3250亿美元)的公共资金用于研究,因 此在数据管理上应话费150亿欧元。而研究人员,尤其是经验更丰富的科学家认为这使得研究经费减少了5%。


首先,妥善保管数据是一项道德责任,应成为良好研究实践的一部分。第二,如果数据得到适当处理,研究人员将有 更多时间进行研究。攻读博士学位的学生最多将80%的时间花在“数据处理”上,不应将时间浪费在修改格式等小错 误使数据适合分析。如果有400名这样的学生,那将至少相当于200名全职雇员的薪水。因此,雇用20名专业数据管理 员来减少因数据争用而浪费的时间将提高有效的研究能力。许多顶级大学开始意识到不共享数据的代价是巨大的,并 且要大于相关的风险。而科学的数据管理可提供可观的投资回报。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.jpg

欧盟委员会2018年的一份报告估计,仅在学术领域,数据再利用问题每年就给欧盟造成至少100亿欧元的损失,以及 160亿欧元的创新机会损失。 


如今,FAIR指导原则每天被引用3次,但引用并不等同已经应用于实践。Barend Mons教授和她的同事们以及欧洲开放 科学云(European Open ScienceCloud)是一项旨在促进开放科学实践的计划,其范围涉及整个大陆范围的数据共享 基础架构的要求。据估计,在欧洲的7000万科技专业人员和170万研究人员中,欧洲将至少有1000万严肃数据生成者。 因此,我们将需要教育大约500,000种各种类型的数据管理员,以通过实验设计和数据捕获,管理,存储,分析,发布 和重用为研究人员提供支持。


由于数据管理太过于繁杂且耗时,不能留给研究人员去做。很少有研究人员将数据管理作为他们的核心业务,特别是 当前的激励机制不鼓励数据共享,并巩固了古老的和几乎完全基于叙事的学术交流文化。幸运的是,世界各地的研究 机构正在建立数据竞争力中心以提供帮助,其中包括荷兰的瓦赫宁根大学和意大利都灵大学的数据中心。但是这个运 动还处于起步阶段。


研究资助机构应坚持:如果没有经过适当审查和预算的数据管理计划,就不再拨付研究经费。 而FAIR数据可以提供更 有效的人工智能(FAIR也可以意味着“完全AI就绪”),这将开创前所未有的研究机会并提高可重复性。


一些数据密集型组织正在数据管理方面加大投入,例如制药公司和医疗中心。(注意FAIR与“公开”不同;保密规则 仍然适用。)在莱顿大学,一个计算肿瘤学程序可为患者体内分析的每个肿瘤创建一个机器可操作的信息文件,无需 手动干预。该项目预算的大约10%用于这些文件的设计和管理,我们称之为FAIR数字双胞胎。


更多的研究机构和项目资助方必须做出类似的承诺。关键是数据管理能力的建设,使各个研究团队能够在国内和国际 上进行合作并共享好的实践,以便使得数据管理成为良好的规则,而非负担。

免责声明:本网站所转载的文字、图片与视频资料版权归原创作者所有,如果涉及侵权,请第一时间联系本网删除。