卜凯农户调查、满铁东北实态调查是民国时期不可多得的高质量农户微观历史调查数据,二者地域互补、口径相似。学界鲜有人针对二者进行综合利用。本研究项目从历史学与人工智能结合的视角出发,对两套历史数据进行了系统整合。研究通过对卜凯农户调查、满铁东北实态调查中的部分农户层级数据进行含义厘清、数据清洗、人工分类匹配、机器自然语言模型匹配、分类统合等工作,初步建立一套可以覆盖中国绝大部分农业地区、口径统一、含义清晰、可供计量分析的量化数据库。目前,数据库已整合多层级数据,形成覆盖人口、土地、生产、收支等多维度的结构化数据集,并通过数据库网站公开。研究成果为近代农业经济史研究开辟了新的空间,是人工智能与历史学深度融合的一次数字人文实践。