2023年11月10日,清华大学统计学研究中心张静怡助理教授和中国人民大学应用统计科学研究中心孟澄助理教授应罗雪老师的邀请,分别为统计与运筹系师生带来了一场题为“Optimal transport and its interactions with statistical methods”和“大数据与子抽样方法”的学术报告。
张老师首先介绍了最优输运(Optimal transport)的简单数学基础,高维数据下计算规模与可能成本的增加是目前大数据问题面临的挑战。张老师在报告中介绍了一些最优输运与统计方法之间的相互作用,用于解决高维数据“维数诅咒”的问题。报告还介绍了最优输运问题在现实世界中的应用,包含图像的色彩传输、AI辅助医疗中冠心病的早期筛查等。
大数据的出现对数据的分析、储存、和传输等方面都提出了重大挑战。孟澄助理教授主要介绍了大数据中的子抽样方法,目标是从样本(数据)中挑选“最重要”的一个子样本来代替原样本进行下游分析任务。以通俗易懂的方式讲解从统计的角度应该如何定义何为“重要”,对不同的下游任务应该如何应用不同的子抽样策略,以及当前国际上主流的子抽样算法和思想。
报告结束后,参会师生就相关问题与张静怡、孟澄助理教授展开了热烈的讨论与交流,拓宽了研究思路。
报告人简介:张静怡,清华大学统计学研究中心助理教授。2011年毕业于武汉大学;2013年于武汉大学获得统计学硕士学位;2020年于美国佐治亚大学获得统计学博士学位,师从钟文瑄教授与马平教授。2020年开始在清华大学统计学研究中心担任助理教授。主要研究方向为:联邦学习、大数据统计计算、医疗AI等,在Biometrika,JCGS,NeurIPS,等统计与机器学习期刊会议上发表文章12篇。获得国自然青年项目支持,参与国家重点项目与北京市面上项目,与多家医院有长期科研合作和横向项目。孟澄,中国人民大学应用统计科学研究中心助理教授,博士生导师。2015年毕业于清华大学数学系,2020年于美国乔治亚大学获得统计学博士学位。主要研究方向为大数据快速算法、最优输运问题、计算机视觉等,主持国自科青年基金,参与面上基金,在Biometrika, JMLR, JCGS, NeurIPS等统计期刊和会议上发表论文近20篇。孟澄获得过华为“难题揭榜”火花奖、2023年泛华统计学会Junior Researcher Award。