现代西方思想的语言DNA
这个项目的目的是通过模拟在英语语篇中发生的语义和概念上的变化,来理解早期现代思想的演变(约1500-约1800年)。该项目将使用信息提取技术和数据可视化技术来识别25万份文本中的词汇模式。
这个项目旨在通过模拟在英语语篇中发生的语义和概念上的变化来理解早期现代思想的演变(约1500- 约1800年)。它将通过下列目标来实现这一目标:
1. 使用信息提取技术,在约3700万页中识别词汇模式,使用48327个来自早期在线英语书籍(EEBO)的重新键入文本和来自Gale Cengage的18世纪在线语料库(ECCO)的约20.5万个经证实的文本。整个数据集包含超过25万个文本。
2. 使用数据可视化,评估信息提取技术对项目研究问题的准确性。这些研究问题可分为三个研究主题:
- 语义变化的语境,将探讨概念发展的历史和话语环境。
- 词汇家族和概念领域,将探讨概念及其组成关键字的语言特征。
- 词汇化压力,将探索概念领域内的构词特征和词汇量。
3.发展和分享有关该项目的方法,通过两个研讨会,将集中在计算机辅助语言分析,语言变化和数据可视化
4. 将研究主题的结果作为一系列已发表的成果提出:1500年至1800年期间关于范型术语的论文卷;关于语言和概念变化的合著书籍;篇文章;以及一个关于技术方法的在线开放源码文集。
5. 使结果数据库的词汇模式,加上搜索和可视化功能,可为更广泛的社区,为他们自己的研究目的。这将以一个公共网站的形式,以及一个Web API和数据下载功能,使整个数据集能够共享和重用。
6. 通过开发一个现代学术体系的演示程序来展示信息提取和概念建模技术的更广泛的适用性(例如,主办两个知识建模影响研讨会。
网站
数字结果
- Early Modernity: EEBO-TCP and ECCO-TCP (concept modelling interface)
- Data XYZ
- Militarisation 2.0 (Youtube comments)
OED Concept Interface (Restricted access)
BBC Radio News Scripts (Restricted Access)
项目团队
- Susan Fitzmaurice教授(项目带头人——谢菲尔德大学)
- Michael Pidd(合作研究员——DHI)
- Justyna Robinson博士(合作研究员——苏赛克斯大学)
- Marc Alexander博士(合作研究员——格拉斯哥大学)
- Iona Hine博士(研究助理——谢菲尔德大学)
- Seth Mehl博士(研究助理——谢菲尔德大学)
- Fraser Dallachy 博士(研究助理——格拉斯哥大圩)
- Matthew Groves(开发人员——DHI)
- George-Andrei Ionita(开发人员——DHI)
- Brian Aitken (数字人文研究所——格拉斯哥大学)
翻译:张嘉琪