数据可用性
简介
《公共科学图书馆》期刊要求作者在发表时不受限制地公开复制其研究结果所需的所有数据。当特定的法律或道德限制禁止公开共享数据集时,作者必须说明其他人可能如何获得数据的访问权。
当提交稿件时,作者必须提供一份数据可用性声明,描述符合公共科学图书馆的数据政策。如果文章被接受发表,数据可用性声明将作为文章的一部分发表。
下面列出了可接受的数据共享方法,并为作者提供了关于他们的数据可用性声明中必须包括什么以及如何遵循的指导研究报告的最佳实践.
公共科学图书馆认为,共享数据促进科学进步。数据可用性允许并促进:
- 验证、复制、再分析、新分析、重新解释或纳入元分析;
- 研究的可重复性;
- 努力确保数据存档,增加资助科学研究的投资价值;
- 减轻作者在保存和查找旧数据以及管理数据访问请求方面的负担;
- 引用和链接研究数据及其相关文章,提高能见度,确保作者、数据生产者和策展人的认可。
发表的条件是遵守本政策。如果数据访问限制在发表后被曝光,我们保留张贴更正、编辑关注表达、联系作者所在机构和资助人的权利,或者,在极端情况下,撤回文章。
最小数据集定义
作者必须共享他们提交的“最小数据集”。PLOS定义了最小数据集,包括复制文章中报告的所有研究结果所需的数据,以及相关的元数据和方法。此外,PLOS还要求作者在适用的情况下遵守数据准备、记录和沉积的领域特定标准。
例如,作者应提交以下数据:
- 所报告的平均数、标准差和其他度量背后的值;
- 用于构建图形的值;
- 从图像中提取的用于分析的点。
如果报告的研究只使用了一部分数据,作者不需要提交他们的整个数据集。此外,如果该领域的标准是共享已处理的数据,作者不需要提交调查期间收集的原始数据。
公共科学图书馆不允许引用“未显示的数据”。作者应将相关数据存放在公共数据存储库中或在稿件中提供数据。
我们要求作者提供样本图像数据以支持所有报告的结果(例如免疫组化图像、功能磁共振成像图像等),无论是提交文件还是在公共存储库中。
投稿至《公共科学图书馆·生物学》上,公共科学图书馆综合,公共科学图书馆气候,公共科学图书馆水或公共科学图书馆全球公共卫生2019年7月1日或之后,作者必须提供原始的、未裁剪的和最小调整的图像,支持文章数据和支持信息文件中报告的所有印迹和凝胶结果。虽然在初次提交时不需要提供原始图像,但我们会在同行评审过程中或在提交被接受发表之前要求提供这些文件。
在审查发表后引起的与所显示图像有关的问题时,我们可以要求文章中描述的任何图像文件的可用基础数据,以解决这些问题。
可接受的数据共享方式
在数据存储库中存储(强烈推荐)
所有报告结果的数据和相关元数据都应存放在适当的公共数据存储库中,除非已作为提交文章的一部分提供。存储库可以是接受特定类型结构化数据的特定于主题的存储库,也可以是接受多种数据类型的跨学科通用存储库。
如果存在特定领域的数据沉积标准,PLOS要求作者遵守这些标准。作者应该选择适合他们研究领域的存储库(例如,微阵列数据的ArrayExpress或GEO;基因序列的GenBank, EMBL或DDBJ)。
数据可用性声明必须列出存储库的名称以及数字对象标识符(DOIs)、登录号或代码等持续的标识符所有相关数据。
数据引用
公共科学图书馆鼓励作者在他们的参考列表中引用任何公开的研究数据。对数据集的引用(数据引用)必须包含一个持久标识符(如DOI)。数据集的引用,当它们出现在参考列表中时,应包括由推荐的最少信息DataCite遵循日记的风格。
例子:
Andrikou C, Thiel D, Ruiz-Santiesteban JA, Hejnol A.通过消化组织的主动排泄模式先于排泄器官的起源。2019.树精数字资源库。https://doi.org/10.5061/dryad.bq068jr.
公共科学图书馆支持科学出版商的数据引用路线图由出版商早期采用者专家组开发,作为数据引用实施试点(DCIP)项目的一部分,该项目是FORCE11和NIH BioCADDIE项目的一个倡议。
“支持信息”文件中的数据
尽管鼓励作者直接将数据存入适当的存储库,数据可以包含在支持信息文件。当在“支持信息”文件中包含数据时,作者应以其领域标准的文件格式提交数据,并允许广泛传播。如果该领域目前没有标准,作者应该通过选择可以有效提取数据的文件格式来最大限度地提高数据的可访问性和可重用性(例如,在提供表格数据时,电子表格优于pdf或图像)。
在文章发表后,PLOS将所有与文章相关的支持信息文件上传到figshare存储库中,以增加与公平的原则(可查找、可访问、可互操作、可重用)。
支持信息文件完全按照所提供的内容发布,不进行复制。每个文件应该小于20mb。
数据管理计划
一些资助机构有关于数据管理计划(dmp)的编制和共享的政策,从一些机构获得资助的作者可能被要求编制dmp作为资助的条件。
公共科学图书馆鼓励作者在进行研究之前准备dmp,并鼓励作者将这些计划提供给希望对其进行评估的编辑、审稿人和读者。
还可参考以下资料,以获得有关数字生产计划的指导:
可接受的数据访问限制
公共科学图书馆认识到,在某些情况下,由于法律或伦理原因,作者可能无法公开他们的基础数据集。此数据政策不违反当地法规、立法或伦理框架。如果这些框架阻止或限制数据发布,作者必须在提交时在数据可用性声明中明确这些限制。可接受的公共数据共享限制详述如下。
请注意,作者作为唯一负责确保数据访问的具名人员是不可接受的。
第三方数据
对于涉及第三方数据的研究,我们鼓励作者分享他们可以合法发布的任何特定于其分析的数据。然而,公共科学图书馆认识到,作者可能正在使用他们没有权利共享的第三方数据。当第三方数据不能公开共享时,作者必须提供所有必要的信息,以便感兴趣的研究人员申请访问数据。
- 数据集和第三方来源的描述
- 如果适用,验证使用数据集的权限
- 其他人将需要申请所有必要的联系信息以获得访问数据的权限
作者应正确引用和确认稿件中的数据来源。请注意,如果数据是从第三方来源获得的,我们要求其他研究人员能够以与作者相同的方式访问数据集。
人类研究参与者数据和其他敏感数据
对于涉及人类研究参与者数据或其他敏感数据的研究,我们鼓励作者分享去身份识别或匿名数据。然而,当数据不能公开共享时,我们允许作者根据请求提供他们的数据集。
- 详细解释限制(例如,数据包含潜在的识别性或敏感的患者信息)
- 提供数据访问委员会、伦理委员会或其他机构的联系信息,数据请求可能会发送到这些机构
人类研究参与者数据的一般指南
在共享人类研究参与者的数据之前,作者应咨询伦理委员会,以确保数据共享符合参与者的同意和所有适用的当地法律。
数据共享绝不应损害参与者的隐私。因此,公开分享人类研究参与者的个人身份数据是不合适的。以下是不应共享的数据示例:
- 姓名,首字母,物理地址
- IP (Internet protocol)地址
- 具体日期(出生日期、死亡日期、考试日期等)
- 联系信息,如电话号码或电子邮件地址
- 位置数据
不能直接识别的数据也可能不适合共享,因为它们的组合可能成为识别的。例如,从一小部分参与者、弱势群体或私人群体收集的数据,如果涉及到可能危及研究参与者身份的间接标识(如性别、种族、位置等),就不应共享。
保护隐私的必要步骤可能包括去识别数据、添加噪声或阻塞数据库的部分内容。在不可能做到这一点的情况下,可以通过专门针对隐私问题的许可协议来限制数据共享。关于准备发表的人类研究参与者数据的其他指导,包括如何正确地去识别这些数据的信息,可以在这里找到:
关于共享人类研究参与者数据的指导,也可以参考以下资源:
- 共享临床试验数据:收益最大化,风险最小化
- 欧洲药品管理局:临床试验数据的出版和获取
- 美国国立卫生研究院:保护人体主体的权利和隐私
- 加拿大卫生研究所卫生研究中保护隐私的最佳做法
- 英国数据档案:匿名化概述
- 澳大利亚国家数据服务:伦理、同意和数据共享
定性数据指南
对于分析定性研究中收集的数据的研究,作者应将与研究相关的抄本摘录放在适当的数据存储库中,在论文中,或者在不能公开分享的情况下应要求提供。如果即使共享摘录也会违反参与者同意的协议,作者应该在他们的数据可用性声明中解释这一限制以及他们能够共享什么数据。
看到定性数据库有关管理和存储定性数据的更多信息。
其他敏感资料
一些没有描述人类研究参与者的数据也可能是敏感的,不适合分享。对于分析其他类型敏感数据的研究,作者应在参考既定的现场指南和所有适用的当地法律后,酌情共享数据。可能受到限制的敏感数据包括但不限于保护区的实地研究数据、敏感考古遗址的地点和濒危或受威胁物种的地点。
额外的帮助
请联络期刊办公室(climate@www.othits.com)如果:
- 你担心分享你的数据的道德或合法性
- 您的机构没有一个固定的联络点来处理访问敏感数据的外部请求
- 你觉得不能共享数据的原因不是上面提到的
不可接受的数据访问限制
有以下因素影响作者分享数据能力的稿件,PLOS期刊将不予考虑:
- 作者不会因为个人利益而分享数据,比如专利或潜在的未来出版物。
- 这些结论完全依赖于对专有数据的分析。我们认为专有数据是由个人、组织、资助者、机构、商业利益或其他数据所有者不会共享的方拥有的数据。如果使用了专有数据,并且其他人无法以作者获得这些数据的相同方式访问它们,那么稿件必须包括对公开可用数据的分析,以验证研究的结论,以便其他人可以复制分析,并在研究发现的基础上进行构建。
常见问题
一般的问题
在可能的情况下,我们建议作者将受限制的数据存放在允许受控制的数据访问的存储库中。如果这是不可能的,将数据请求转给非作者机构的联络点,如数据访问或伦理委员会,有助于保证数据的长期稳定性和可用性。为感兴趣的研究人员提供一个持久的联络点,可以确保即使作者更改了电子邮件地址、机构或无法回复请求,也可以访问数据。
数据政策于2014年3月3日实施。在此日期之前提交的任何论文将没有数据可用性声明。对于在此日期之前提交或发表的所有稿件,数据必须根据合理要求提供。
所有文章必须包括数据可用性声明,但一些提交的文章,如注册报告协议和实验室或研究协议文章,可能不包含数据。对于不报告数据的稿件,作者必须在他们的数据可用性声明中声明他们的文章不报告数据,数据可用性政策不适用于他们的文章。
存放数据
如果我在提交数据集时不能提供登录号码或doi,该怎么办?
作者可以提交他们的手稿,并在他们的数据可用性声明中包含占位符语言,表明登录号和/或doi将在接受后可用。期刊办公室将在出版前联系作者询问这些信息,并将保留论文直到收到。
在同行评审过程中向审稿人和编辑提供私有数据访问是可以接受的。许多存储库允许出于审查目的的私人访问,并有在发布时公开发布的策略。
公共科学图书馆是否与任何存储库集成?
公共科学图书馆与存储库合作,以支持数据共享和遵守公共科学图书馆数据政策。我们的提交系统与合作伙伴存储库集成,以确保文章及其底层数据是成对的,一起发布和链接。目前的合作伙伴包括Dryad和FlowRepository。
合作伙伴存储库可能需要支付数据提交费。公共科学图书馆无法支付这笔费用,作者也没有义务使用任何特定的存储库。公共科学图书馆不从我们与任何一体化合作伙伴的合作中获得经济利益。
此外,PLOS将所有与文章相关的支持信息文件上传到figshare存储库中,以增加与FAIR原则(可查找、可访问、可互操作、可重用)的一致性。
如何将数据存入数据存储库集成合作伙伴?
当作者将数据存入集成存储库时,他们将收到一个临时数据集DOI和一个私有审阅者URL链接。在提交给PLOS时,作者应该在数据可用性声明中包括数据集DOI。他们还应该提供审稿人URL,这将允许在同行评审期间对数据进行限制访问。如果一篇手稿被PLOS杂志编辑接受,文章的发表和数据集的公开发布将自动协调。
我负担不起储存大量数据的费用。我该怎么办?
公共科学图书馆鼓励作者调查所有的选择,如果他们在提供研究基础数据方面有困难,请联系他们的机构。公共科学图书馆推荐了一些专门处理大型数据集的存储库。
我的资料储存可接受的许可证是什么?
如果作者使用带有声明的许可策略的存储库,则该策略的限制不应超过创作共用署名(CC BY)许可.
公共科学图书馆数据咨询委员会
公共科学图书馆成立了一个外部顾问委员会,涵盖在公共科学图书馆期刊上发表的许多研究领域。该委员会将与我们一起制定跨各领域数据共享的社区标准,就提交给期刊的特别复杂的数据共享情况提供输入和建议,定义数据共享合规性,并积极努力完善我们的政策。如果您有任何问题或意见,欢迎您写信给我们data@www.othits.com.
Greg Barsh |
Stephen Koslow |
Marc Robinson-Rechavi |