当你选择在PLOS上发表文章时,你的研118bet金博宝金宝慱世界杯买球究就会产生影响。让所有人都可以无限制地访问您的工作,并通过预印本和已发表的同行评审等选项加速科学发现,使您的工作更加开放。

公共科学图书馆博客 公共科学图书馆官方博客

开放数据项目赢得了威康基金会、NIH和HHMI开放科学奖

编者注:相关项目见公共科学图书馆生物学而且公共科学图书馆官方博客

“如果为了对现实世界产生潜在影响而公开和快速地共享数据,科学家们可以用他们自己的数据做更多的事情。——特雷弗·贝德福德,开放科学奖获奖团队的负责人。

开放科学奖是由美国国立卫生研究院(NIH)、霍华德休斯医学研究所(HHMI)和威康信托基金会发起的一项新倡议,鼓励和支持为社会带来利益、推进研究和刺激创新的开放科学方法。一个不可或缺的组成部分的选择过程中演示使用和生成开放数据因此,PLOS为今年的获奖者感到自豪公开科学奖是PLOS的作者,也是进化计算生物学家特雷弗贝德福德华盛顿州西雅图的弗雷德·哈钦森癌症研究中心。奖项入围名单也是公共科学图书馆的作者,包括迈克尔·巴姆舍德的团队,在一篇博客文章中提到罕见病日钟表的而且Ann-Shyn蒋介石的果蝇大脑观测站和Ben Goldacre的OpenTrialsFDA团队。

这些科学家及其团队正在确保来自出版物、数据集、代码和其他研究成果的开放内容被发现、访问和重用。贝德福德和他的团队因开发nextstraain.org而获奖网站它将来自全球研究团队的共享开放序列数据整合到一个实时跟踪病毒进化的模型中。这为更大的社区提供了一个强大的图形工具促进病原体监测和流行病学调查。

开放数据工具加速政策和研究

在一次讨论开放科学方法价值的采访中,贝德福德谈到了开放数据、归因、许可以及他使用预印本来支持快速发布数据的出版策略的经验,同时为他自己、他的国际合作者、他的博士后和学生提供同行评审的引用。

评判该奖项的三个最终标准之一是所提议的服务或工具所表现出的需求和效用水平。这一标准对nextstrain.org很有帮助,因为该团队使用公开的病毒序列数据来推断传播模式和进化动态。根据贝德福德的说法,在过去的15年里,方法已经达到了一个很好的地步。最近,“快速的基因组周转时间意味着更多可操作的信息成为可能。这在疫情爆发期间造成了一种强大的局面,在这种情况下,需要有可靠的结论,因此调查人员愿意分享数据,”Bedford说。“我们需要把数据集放在一起,对正在发生的事情进行全面的推断,”他继续说。

在创建nextstraain.org网站时,贝德福德想做一些有用的事情,而不是为了发表文章而窃取别人的数据。他认为该网站是一种很好的方式,可以为社区提供价值,并与其他实验室的数据合作,但又不会被认为想要以与实验室相同的方式声称所有权预印本或已出版的论文会。参与该项目的人员承诺使用和重用公开的、可引用的、具有适当属性的发布前和发布后数据。

贝德福德的合作者凭什么拥有知识产权?他说:“我承认目前对序列数据来说,这是一个狂野的西部。”他补充说,许多研究人员在发表前将序列存放在GenBank中,“但担心不清楚这是发表前的数据”(GenBank没有这种类型的设置)。科学家还将数据发布到实验室网站或GitHub需要说明的是,这些数据是预发表的;他的网站使用了所有这些资源。在GitHub上发布的序列会立即与通知数据使用的来源合并。

当被问及是否每个人都是开放数据的信奉者时,是否遇到过阻力或犹豫共享数据贝德福德回答说,他们用什么人都行想要分享.不过,他也注意到共享风气的积极趋势。在埃博拉爆发期间,有一个明显的滞后,而到寨卡病毒爆发时,这种滞后有所减少。的出版商达成协议他认为,由公共科学图书馆和其他机构签署的、旨在快速公开提供数据的协议在这一领域有所帮助。Bedford说:“要求将序列数据存入GenBank或在手稿提交时(而不是发表时)以其他方式公开提供,有助于提高研究的可重复性。”公共科学图书馆,通过它自己序列沉积策略而且增强方法报告的伙伴关系美国一直致力于加强这些问题。

对于一些人来说,开放获取,开放科学社区需要更好地展示这种更透明和开放的科学研究方式的价值,从实验到出版等等。到目前为止,世界卫生组织通过相关工具积极参与流感疫苗毒株的选择,nextflu.org(最终计划迁移到nextstrain网站)。贝德福德设想有三种用户会实际使用他的团队的开放数据工具:

  • 进行病毒测序或使用序列数据作为比较和共享数据的有用平台
  • 参与疫情应对的人员,作为了解数据、传播模式和毒株演化的工具
  • 研究人员或其他对突变体的特征和研究历史突变的能力感兴趣

发布和许可选择

贝德福德对他的实验室和工作有一个综合的出版策略,最好地利用各种可用的场所。他在开放获取和付费期刊上发表文章,创建网络工具,存储数据集并发布预印本。一种策略是发布一篇统计模型或方法的文章,将模型开发成一个网站或网络工具,并在发表的文章中链接到该网站(而不是将工具的JavaScript直接嵌入到文章中)。

他喜欢围绕一项工作建立生态系统的模式:发布带有已发表/发布基因组链接的预印本,更新预印本用新的数据或分析,然后将论文提交给同行评审的期刊。这使他的团队能够捕捉整个研究和进展的链条,建立信用证来源一路走来。对发布在GitHub或GenBank上的数据集被独家报道的担忧与对预印本服务器对话的独家报道担忧类似。帮助人们理解他们通过发布信息对他们的数据(或论文)提出了知识主张,这改善了,但并没有消除这些担忧。

那些使用源代码为开放科学开发工具的人在许可方面有几种选择。对于较小的项目,Bedford更倾向于使用MIT许可证在公共科学图书馆开发的代码作为开源发布的),提供免费和无限的使用和重用权,只要属性明确。他的其他项目,包括nextstraain.org,都是根据GNU通用公共许可证(GPL)向公众发布的。该许可规定,任何使用源代码生成派生产品的人都必须反过来使该产品开源。换句话说,如果一个商业实体采用了他的开源代码,该公司也必须开放源代码提供他们的代码。许可证状态本质上是继承的,并与代码一起传递给下一代产品。选择限制较少的MIT许可(类似于已发表文章的CC BY)的一个好处是最大限度地不受限制地重用。

祝贺开放科学奖的所有入围者,为基础科学、转化研究和全球公共卫生的利益分享他们的工作和数据。

图片致谢:开放科学奖nextstrain

留下回复

你的电邮地址将不会公布。必填字段已标记


在这里添加您的ORCID。(例如:0000 - 0002 - 7299 - 680 - x)

回到顶部
Baidu
map