跳到主要内容

找到数据

找到数据

在数据仓库中发现来自各个学科的数千个研究数据集.

有成千上万的数据仓库存放着来自广泛研究领域的数据集, 它极大地支持开放研究. 然而,这意味着数据集的发布分散在数千个存储库中,这将需要几种搜索方法来找到相关的数据集. 此外,每个存储库的工作方式略有不同,因此需要不同的搜索策略. 找到数据集后,应该评估其质量并考虑如何重用数据. 

存储库和数据搜索引擎

  • Re3data 是否每个领域都有超过2500个研究数据仓库. 您可以搜索超过40个属性,包括主题, 在您的规程中查找存储库的内容类型和许可.
  • Datcite 提供一个搜索功能,可以帮助您找到您所在区域的数据集. 此搜索将在多个存储库中找到与您的主题相关的数据集.
  • 谷歌 数据集的搜索 类似于Datacite,因为它根据你的标准搜索存储库来找到感兴趣的数据集. 

多学科的存储库

搜索多学科存储库可以帮助在您的领域找到更多的数据集,因为它们的广泛内容和覆盖范围.

数据访问语句

在出版物中加入一个 数据访问声明 概述在何处以及如何访问数据. 您可以在文献中找到您所在领域的相关数据集,然后在您的研究领域使用相同的存储库.

作为数据的社交媒体

社交媒体内容是一个快速增长且潜在丰富的研究数据来源. 然而,它带来了法律、伦理和技术上的挑战. 即使信息是在互联网上,这并不意味着它可以自动访问和重用. 因为数据涉及到人类参与者, 您将需要解决这些方法和伦理方面的考虑 数据管理计划 和伦理应用程序.

在考虑和获取社交媒体数据时,你应该:

  • 查看主机平台的服务条款
  • 如果可用,使用API(应用程序编程接口)请求数据
  • 负责任地进行网页抓取
  • 确保您将获得的数据量有足够和适当的存储空间
  • 计划移除直接标识符

第三方数据

若要从第三方获取数据,您可能需要填写问卷或文件. 这通常旨在向资料提供者确认资料会安全地储存及处理. 如果你被要求填写一份,并且需要指导,请 太阳2