“在 DARIAH-DE 中,数字人文与文化研究数据是指在人文与文化研究问题的背景下收集、生成、描述和/或评估的所有来源/材料和结果,并且可以以机器可读的形式存储,以便存档、引用和进一步处理。« [12]
相互关联的对象,从任何来源(Blumenbach-online、Wolfenbütteler Digitale Bibliothek)的数字副本和文本数据(带有或不带有使用内容标记的深入索引)、带有索引信息的艺术品或建筑照片(Deutsche Inschriften Online)、多媒体数据(GlobalDiverCities)、3D 扫描(Blumenbach-online)到个人和位置数据库(Berliner Klassik)——仅举几例——可以采用多种格式,包括 TIFF、JPEG、PNG、PDF、DOC、XML、RTF、MP3、MP4 或 MySQL。[13]所有这些数字对象都可以被提供不同的元数据,尽管这里的人文学科也存在着高度的多样性。[14]
如果我们看看传统的人文出版文化及其产生的数据,很明显它是由专著和个人论文等经典文本格式主导的,至少如果忽略研究过程中产生的中间数据或工作数据(所谓的吞吐量)。 [15] 尽管并非所有长期存档问题都已得到详细澄清,但至少从技术角度来看,这种情况下的原始数据和结果或出版数据的情况都不太复杂[16],而研究和出版文化的情况则由于数字媒体和方法的使用增加以及 澳大利亚电报数据 出版物的多媒体化而发生了根本性的变化,即朝着基于网络的复杂连接对象呈现方向发展。[17]将原始数据整合到研究过程中,例如通过深入的索引和注释,以及通过复杂的基于网络的信息门户跨越传统出版物的界限,这对可用的存储和出版基础设施提出了质疑[18],并需要扩展服务以便有效地应对科学带来的挑战 - 例如研究数据的异质性、其知识可重用的长期保存以及引用、参考和版权问题。