连接历史:1500-1900英国历史建立的资料

以早期现代和19世纪英国历史为研究对象,对大量电子资料进行深度联邦检索。

该项目创建了一个联邦检索工具,名为“连接历史”,该工具汇集了大量的优质内容,这些内容以近代早期和19世纪英国历史为研究对象,对大量电子资料进行深度联邦检索。除了简单地创建一个访问这些历史资源的门户外,该项目还结合了网络爬虫和自然语言处理技术,以便远程“标记”以前非结构化的文本,并允许对名称、地点和日期进行一致的结构性搜索。通过这样做,该项目为搜索过程增加了一个新的精度,使其更为严谨。

“连接历史”搜索引擎是由HRI开发的,并由伦敦大学历史研究所(IHR)托管,作为集群中所有资源的“保护伞”。该引擎经谢菲尔德、哈特福德的历史学家和历史研究所(Institute of Historical Research)测试,由伦敦大学国王学院人文计算中心进行评估。

在第一个例子中,“连接历史”包含了以下分散的历史资源:

  • 英国历史在线,包括即将发布的人物数据库
  • 伦敦中央刑事法庭诉讼程序在线,1674-1913
  • 平民生活及近代伦敦的形成 ,(整合了若干前AHDS的数据库;网站推出于2011年3月)
  • 17-19世纪伯尼报纸收藏,大英图书馆
  • 起源网络
  • 议会文件
  • 1540-1835英国教会数据库中的神职人员
  • 历史学家Strype的伦敦研究
  • 查理布斯在线档案
  • 拼贴画

总而言之,“连接历史”可访问14个主要原始文本数据库,这些原始文本包含超过4.12亿单词、46.9万份出版物、310万页文本、8.7万张地图和图片、25.4万人的数据库以及1亿多个姓名实例。

“连接历史”会不断结合更多数据集,不断扩大体量,向公众提供超过100亿字的优质内容。

网站

项目周期:2009.10.01-2011.03.31

项目团队

  • Robert Shoemaker教授(谢菲尔德大学)
  • Tim Hitchcock教授(哈特福德大学)
  • Jane Winters博士(伦敦大学历史研究所)
  • Sharon Howard博士(项目经理——数字人文研究所)
  • Katherine Rogers(开发人员——数字人文研究所)

翻译:张嘉琪