2023年3月19日晚,复旦大学经济学院教授,博士生导师陈硕教授做客“洙泗讲堂”,为全校师生作了题为《机器学习在清史研究中的应用》的学术讲座。讲座由600cc全讯白菜网经理吴佩林教授担任主持人,张世慧副教授、吴延民博士担任与谈人,体育科学学院经理姜付高教授等300余名师生共聚孔子会堂参与此次学术活动。
讲座伊始,陈硕教授展示了一组骑士雕塑的图片,火枪的兴起摧毁了骑士阶层,面对新技术要主动去认识它接受它利用它。聚焦历史研究,有的老先生穷其一生所作的成果,可能放到现在人工智能仅需要一两个月的时间就可以完成。然后,陈教授以自己的博士论文为例引出了技术进步对于整个人类社会的影响并进行解释,提醒我们要知道我们培养出来的人力资本在哪些方面可以被人工智能所替代,要避免做无用功,并指出人作为行为主体的价值判断的可贵性。
讲座的第一部分,关于机器学习的定义,借用统计学家Trevor Hastie和哈佛大学经济学教授Susan Athey的观点就是通过一种软件或者技术在海量信息中得到某些规律性的结果,如果能触及到到经济学关注的因果关系是更好的,并向我们推荐了两位大师的论文以供深入了解和学习。
讲座的第二部分,陈教授围绕“机器学习在业界及自然科学中的应用”做了详细分析。主要分为四个方面:认知、预测、决策及集成解决方案。并以IBM图像辨别,科大讯飞语音转文本,淘宝、腾讯和网易云的个性化推荐,财富管理公司和AlphaGo的决策以及人工智能的集大成者无人驾驶的集成解决方案为例,生动清晰的解释了这四个方面的具体内涵。关于机器学习在自然科学领域的应用,以机器学习在物理学上的应用为例,主要是涉及到高维数据的分类和降维,需要用机器学去降维到人可以判断的程度。同时它还能帮助我们找新粒子,比如医学上的应用比较。
讲座的第三部分,陈教授就我们的专业,重点讲述“机器学习在社会科学及清史研究中的应用”,主要可以分为三个类别:数据生成、帮助预测、因果识别。其中最重要的也是最常用到的数据生成(data generating process):传统的人力收集数据,数据量很大而且有一些数据源散落在人的日常行为之中很难找到,此时机器学习就发挥用途了。例如:我们平常会在特别熟悉的私下场景说肆无忌惮的话和在匿名的场所说肆无忌惮的话,学者Alice.Wu利用机器学习在匿名论坛把关键词都给收集出来论证人的“歧视”问题。
陈教授以自己的文章《Rebel on the Canal: Disrupted Trade Access and Social Conflict in China,1650-1911》为例,利用机器学习提取数据形成图表,据表得出结论:有理由怀疑大运河的废弃与和华北地区1820年之后的动乱有相关关系。随后陈教授以文章《从权贵到富贵:中国传世名画产权变动与社会流动性研究,960-1911》为例具体讲解机器学习在历史研究的几个步骤及具体操作内涵,包括确定研究对象和研究目的、把控数据来源、构建数据库、信息提取等步骤。陈教授以二十四史中列传所选择记载的大臣为例向我们介绍关于数据生成中的情感倾向,机器学习可以通过分析这些大臣的出身而得出史书编纂者的情感倾向。
最后,陈教授留下一些展望和讨论问题“技术革命下的社科及人文研究,哪些人力资本能够被替代?哪些则更具价值和竞争力?”、“技术进步对学界,特别定史学界不平等的影响”、“技术进步对史学和社科向跨学科合作的影响”。
在讲座的评议环节,张世慧副教授分享了自己的感受:新技术为历史提供了新的研究方向,技术影响是一个全面的影响,学习要朝着不可替代的方向努力,机器学习使得问题研究更加便利可行。吴延民博士针对工作是否可以被替代、国民教育的不可替代性以及史料利用方式的变化等问题进行畅谈。
在讲座的问答互动环节,老师和同学们就“数据库建设所用到的软件”、“不同语言数据的提取”、“未来数字化史料的地位以及如何分析”、“阈值的设定与可解释的区间”等问题与陈教授进行了一系列的探讨与交流。
讲座的最后,主持人吴佩林经理总结了本次讲座的主要内容,分享了自己的学习心得:利用新技术做史学研究迫在眉睫,历史研究的理论提升势在必行,并衷心感谢陈教授带来精彩的学术报告。
本次讲座在热烈的掌声中圆满结束。
陈硕,复旦大学经济学院教授,博士生导师,中宣部文化名家暨“四个一批”人才,研究兴趣为发展经济学、政治经济学及经济史。中文成果发表在《经济研究》《管理学世界》《世界经济》《金融研究》《统计研究》《经济学季刊》等期刊上。目前主持国家自然科学基金青年、面上及重点项目,以及省部课题及重大课题。
编辑:郑万鹏
审核:吴佩林 张世慧 刘贤贤
上一条:名家讲坛之张帆:元朝的民族关系 下一条:名家讲坛预告|孙竞昊:明清区域史研究中的几重面相
【关闭】