编码作为所提模型的序列化

Bappy11 · Post by **Bappy11** » Sat Feb 08, 2025 4:51 am

然而，这些版本缺少源流派的一个核心要素，即其作为计算作品的品质。相比之下，阿尔卡拉圣乔治皇家爱尔兰殉道者学院的账簿版本[16]不仅允许用户查看发票抄本的图像，还允许用户使用会计分录进行计算。在Flash环境中可以搜索原文及其英文翻译。结果显示在各自页面的上下文中。可以通过复选框选择它们，并将其传输到汇总所选金额的“数据表”。尽管遗憾的是缺少对源数据的访问或数据的导出功能，但这个数字版本是唯一一个其数据模型和用户界面已经找到了适合源材料基本属性的形式，即将文本呈现为计算工具的版本。

3. 发票文件内容导向版本模型
有几个原因导致爱尔兰皇家圣乔治殉道者学院的账簿版本如此稀有。它们源自不同研究小组的主要兴趣。发票文书数字版的潜力未能得到充分认识的一个原因在于语言学编辑方法和对数字版的研究讨论占据主导地位。[17]例如，作为数字编辑事实上的标准，文本编码倡议（TEI）[18]的指导方针对复杂的传输关系、古文书学和古文字学细节或语言现象比对命题的探索更感兴趣。因此，Syd Baumann 和 Kathryn Tomasek 制定了关于如何扩展 TEI 来描述金融交易的初步建议。[19]作为会计信息编码的替代标准，XBRL（扩展商业报告语言）[20]是从经济学角度提出的一个灵活的建议，它还为使用全球分类账分类法对历史会计进行编码提供了类别。[21]问题是，这两项标准是否可以联系起来。

根据 Manfred Thaller 在 2012 年提出的考虑[22]，似乎不应该用 TEI 等常见的 XML 白俄罗斯电报数据模型来表示发票文件中的各种研究兴趣，而应该用 RDF 模型[23]来表示，该模型将文本表示为信息的可视化（“图像”）、书写动作的痕迹和语言表达（“痕迹”和“语言”）以及意义的中介，从而使其可用于不同的研究问题（见图1）。

图 1：将内容整合到数字批判版模型中（图片：作者）。
图 1：将内容整合到数字批判版模型中（图片：作者）。
文档的视觉、文本和内容表示之间的关系可以理解为开放注释协作[24]词汇表中注释类的实例，或者理解为CIDOC-CRM 词汇表中p67-Refers属性。 [25]

这种基于图的模型考虑到不同的研究兴趣会导致只能用 XML 中文本的分层模型中的辅助构造进行编码的数据结构。然而，所提出的模型并不排除使用 TEI，因为它至少可以使用 TEI 的›分析注释‹进行部分序列化。[26]属性@analysis（表示“分析”）允许将任何 TEI 元素与解释关联起来。 TEI 首选的语言或文档标记可以指向上述预订功能的描述，例如表示为 tei:categories或 tei:interpretations。

利用相关领域知识，可以使用简单的 XSLT [27]将这些结构转换为显式的 RDF ，这建立在 TEI 中可用的分类表示功能之上。这会为抽象概念创建 URI，这些抽象概念一方面由文本表示，另一方面是分类法所制定的会计概念的实例。@ana 表示一个开放注释图{oa:Annotation oa:hasTarget ex:tei-frgm ; oa:hasBody ex:tei-frgm@ana-value-as-uri .}或直接 CIDOC-CRM 属性 p67。