图 4:通过平均特征向量对多页手稿进行一对多分类(左)。通过投票对多页手稿进行一对多分类(右)(来源:作者)。
图 4:通过平均特征向量对多页手稿进行一对多分类(左)。通过投票对多页手稿进行一对多分类(右)(来源:作者)。
5.实验
本章展示了书写者识别实验的典型结果。进行的实验包括手稿内部作者分析、两份手稿的直接比较和一对多分类。实验中使用了拉丁文和阿拉伯文手稿。
5.1 稿件作者内部分析和两份稿件直接比较实验
为了解决这两个问题,我们定义了以下工作方法并在此基础上选择了测试材料:
选取作者已知的稿件(1)进行训练。应该证明整篇手稿是由同一位作者撰写的,以便为算法提供足够的训练材料。该手稿可作为手稿 1 的参考。
手稿 1 的作者也应该可以在另一份手稿 (2) 中得到验证,不过,这份手稿中的作者并非唯一的作者,而且已经证明有其他人的笔迹。然后,其他写字的手就应该可以通过它们自己的特征向量与手 1 区分开来。
在材料筛选过程中,我们发现两份手稿符合上述条件:Cod. Guelf。 62 魏森堡和圭尔夫郡。 63 魏森堡。这两份手稿均以中世纪早期最重要的书籍字体——加洛林小写字母书写,这种字体的特点是形式统一、相对高度标准化,且个体差异很小。这些一般特性支持了加洛林手稿数字副本的可用性及其通常较高的抄本学水平,而这几乎不需要用适当的摄影设备进行后期处理。这两份手稿也来自作为Europeana Regia 项目的一部分而数字化的魏森堡抄本收藏,该项目还有进一步的优势:绝大多数抄本来自阿尔萨斯魏森堡修道院的缮写室,因此可以轻松地按地区和时间顺序进行分类。这些手稿还通过 Hans Butzmann 编制的目录(符合 DFG 指南)进行了很好的编纂索引。这些描述提供了作者识别的模板,必须进行验证(或伪造)。圭尔夫郡62白色。根据跋,此书是由修道士瓦尔德曼 (Waldmann) 于 819 至 826 年间在魏森堡的阿尔萨斯修道院格尔霍 (Gerhoh) 修道院院长任期内撰写的。[19]见《Guelf 法典》。 63白色。,同样写于 9 世纪上半叶,古典古文字学鉴定出三只手写体,其中一只为瓦尔德曼 (Waldmann) 的手写体。第 82r 页至第 107r 页为 Waldmann 所作。[20]
5.1.1 使用 62 Weiss 进行手稿内作者分析。
图 5 以三维形式显示了确定的距离矩阵。由此可见该书基本是由一位抄经士(以下 简 孟加拉国电报数据 (以下称为作者B),这反映在较高的距离上。图 6(左)显示了手稿中间由主要抄写员书写的一页。,图 6(右)展示了手稿末尾的一页,其写作风格与书中间的页面明显不同。
图 5:手稿 62 Weiss 的手稿内部作者分析的距离矩阵。 (来源:作者)
图 5:手稿 62 Weiss 的手稿内部作者分析的距离矩阵。 (来源:作者)
图 6:手稿 62 Weiss 的第 20 页。首席书记员(左)。摘自手稿 62 Weiss 的第 209 页。手稿最后几页有不同抄写员(右)(来源:作者)。
图 6:手稿 62 Weiss 的第 20 页。首席书记员(左)。摘自手稿 62 Weiss 的第 209 页。手稿最后几页有不同抄写员(右)(来源:作者)。
5.1.2 使用 63 Weiss 进行手稿内作者分析。
Cod. Guelf 的距离矩阵显示出略有不同的结果。 63白色。如图7所示。根据距离的差异,这里可以识别出三位不同的作家A,B,C。这里引人注目的是抄写员之间的差异,与 Cod. Guelf 中的差异形成鲜明对比。 62白色。非常小,导致距离明显缩短。其原因可能是在同一个写字间工作或属于同一所学校。图 8(左、中、右)展示了每位作者手稿中的一页。在这些方面,相似之处显而易见,相反,很难注意到差异。现在字体的差异仅在于个别字母形状(例如 G 形)、大小写字母的使用以及字体样式。