财务数据集的转录和规范化

 
 

埃默里大学(埃默里大学)和金融研究中心(Center for Financial Studies [Gesellschaft für Kapitalmarktforschung])的经济历史学家研究了历史上的全球金融增长. 主要来源是19世纪末20世纪初的纽约和德国报纸, 其中包括纽约证券交易所和柏林证券交易所的详细每日股票表. 因为扫描的质量, 表格格式和字体大小, 数据需要手工输入, 清理, deduped, 和规范化的. 

埃默里大学(埃默里大学)的经济历史学家研究历史上的全球金融增长,与DDD合作,从英语和德语报纸中捕获并验证了400多万个金融数据点,并对数据进行清理和标准化,包括标准化的缩写和名称. 利用这些数据, 合作者成功地完成了他们对数据的分析,并将在下一步发表他们的发现.