2023年12月12日,美国康奈尔大学Clarke讲席教授张永健访问法与经济学研究院,并在学院路校区作了以“以机器学习做比较法”为题的学术讲座。本次讲座由徐文鸣教授主持,法与经济学研究院院长李曙光教授至开幕词。清华大学公共管理学院陈天昊副教授、北京大学法学院吴雨豪助理教授、中国人民大学法学院彭雅丽助理教授、中国政法大学法与经济学研究院贵斌威副教授参加与谈。
张永健教授的讲座主要分为三部分内容:
讲座的第一部分介绍运用机器学习做比较法研究的背景知识。第一,指出了大数据是指包含大量数据的集合,而大数据不仅包括数据本身,还包括如何处理和分析数据的方法,如人工智能、机器学习和深度学习等。第二,讲述了人工智能与机器学习的区别与应用,即机器学习是一种自动化地发现某种趋势的方法,可以帮助我们理解数据的结构;而深度学习则更加强大,但仍有可解释性。第三,概述了如何运用机器学习做物权法的比较研究:首先了解各种类型的机器学习和降维方法,接着通过观察数据中的特征来判断哪些因素有助于预测某个国家的物权法是否与其竞争对手相同,最后通过具体的例子展示了如何使用这些知识来进行数据分析。
讲座的第二部分内容讲述了不同方法的优缺点和应用场景。张永健教授首先讲述了主成分分析、层次聚类等无监督式机器学习方法,特别讲述了如何进行主成分分析,包括将原始变量转化为新变量,并使用高斯消元法等数学工具进行计算;接着讨论了监督式机器学习,如决策树、支持向量机等,以及如何通过训练数据进行特征选择和模型调整。同时,他补充了两种数据可视化方法:一种是基于算法的图形展示,另一种是基于数据的散点图展示。
讲座的第三部分分析了人工智能与法律研究的融合。张永健教授主要讨论了法律的三个关键问题:(1)如何更好地解决比较法问题?(2)机器学习在法律研究中能起到什么作用?(3)如何在法学、政治学和经济学等领域中选择合适的方法。他表示研究人员应关注更新人类知识库,不断学习新的方法和工具;同时,跨学科合作有助于拓宽知识边界,提高研究的质量。他强调了未来法律研究的重点应该是方法和数据分析相结合,以期取得更加卓越的研究成果。
评论环节中,清华大学公共管理学院陈天昊副教授对机器学习、大语言模型等方法在法学实证的应用以及不同方法间的协调融合等问题发表了意见。北京大学法学院吴雨豪助理教授就类型化的分析方法、如何追求结果准确性以及结果的解释力度等问题进行了探讨。中国人民大学法学院彭雅丽助理教授就如何完成法律文本中信息的数据化以及机器学习在法律史的应用前景问题发表了看法。中国政法大学法与经济学研究院贵斌威副教授就距离函数、降维方法以及实证信息的进一步充分挖掘的问题展开讨论。张永健教授对以上话题逐一解答,结合自己的实证研究案例进一步阐释了机器学习方法的应用原理和应用前景。学生们也踊跃发言,在法律制度的分类、实证研究如何解决语言和文化差异、衡平法的数据来源以及机器学习的软件使用等问题上进行热烈交流。
本场讲座在热烈掌声中圆满结束。