Skip to main content

Organise your Data

Organise your Data

从项目一开始就制定计划,这样可以节省时间.

从项目开始就对该活动进行规划可以节省时间并防止错误. 

Naming files

为你的项目开发一个文件命名约定. 有效的文件名是一致的、简洁的、有意义的和可查找的:

  • 与您的文件和文件夹命名一致
  • 以适当的比例编号版本. 例如,如果你要收集15个样本,第一个是01而不是1
  • 对于包含版本号的重要文档,要包含版本控制表, author, purpose/ changes and date
  • 如果需要,可以在文件/文件夹的开头使用YYYY_MM_DD标记文档的日期
  • 有些软件无法读取带有空格的文件名,因此避免使用空格可能会更容易一些. 可选字符包括下划线、连字符和驼色大小写

Examples

2016_10_31_Eye_Tracking__012 
ActiveDataStorage_05
2016-10-31-Interview-audio-V1

File structure

访问文件、避免重复和足够的文件备份需要一点规划. 就像命名文件一样,保持一致也很重要:

  • 大多数操作系统默认采用分层文件结构:文件夹内的文件, 哪些可以存储在其他文件夹中. 力求在广度和深度之间取得平衡,这样就不会没完没了地点击找文件夹了. 从数量有限的广泛主题开始并在其中创建文件夹可能更容易一些
  • 确保你的文件夹被备份:当使用大学文件存储时,这是自动的
  • 文件夹以工作名称命名,而不是以个人名称命名
  • 检查你的文件夹和文件,确保它们没有被不必要地保存, 并将当前活动和已完成活动分开. 分层结构中的存档文件夹可以用于移动文件和文件夹,这样就不会有一个混乱的工作空间
  • depending on your work, 标记您的文件和文件夹以支持它们跨重叠文件夹的可发现性可能是有帮助的

File formats

如何收集和分析数据将决定在研究项目中使用的文件格式. 对于长期存储,考虑使用没有使用限制的格式. 这意味着它们在未来更有可能被访问.  下表显示了流行的数据格式和文件格式选项.

FormatGreat for preservationOkay for preservation
Textual data

.rtf; .txt; .xml

doc; .docx; .html 
Tabular data .por; .csv; .tab xls; .xlsx; .sav; .mdb; .txt; .dbf; .dta; .ods
Image .tif (verison 6) .jpeg; .jpg; .pdf; .raw; .psd
Video .mj2; .mp4  
Audio .flac; .wav .mp3; aif
Geospatial data .shp; .shx; .dbf; .tiff; .tfw; .mdb; .mif; .kml; .dxf; .svg

Documentation and metadata

元数据(关于数据的数据)和支持文档为研究数据提供了上下文. 提供上下文将允许数据易于检索和, importantly, understood in the future.

在存储库中存储数据时,需要使用元数据来描述数据. 还需要概述数据收集方法的支持文档. 这通常更容易在研究项目期间收集.  

Examples

元数据提供了数据、位置、访问条件和数据重用的概述. 存在不同的元数据需求,但需要以下标准信息:

  • title – how the data are known
  • 描述-数据的简要方法概述. 它类似于论文的摘要,可以包含关于数据是什么的信息, 如何以及为什么收集,以及如何处理
  • 关键词——与内容相关的数据
  • 创造者——参与创建数据的主要研究人员
  • 资助者-为收集数据提供资金支持的来源
  • 访问条件—如何访问数据以及是否存在任何限制

支持文档描述了数据,包括:

  • 代码、字段和标签说明
  • software used
  • methodology
  • dates of collection
  • geographic location
  • 有些软件会在数据收集过程中自动生成元数据
  • 学科中可能存在特定于主题的元数据和文档, 数据仓库和资助机构 DCC提供了一个外部概述

When uploading to data.NCL强烈建议您填写一份 README 为数据记录提供上下文.