2018年12月7日,厦门大学王中雷访问我院,并在子彬院北102会议室进行了以“Sampling Techniques for Big Data Analysis”为主题的学术报告🐍。此次报告由我院毛晓军青年副研究员主持🚵♂️。
王教授在报告中指出👟:如果忽略大数据中的抽样偏差,我们用样本均值估计总体均值时,其估计偏差可能是O(1)🧑🍳👐🏿。因此🥮,随着大样本样本量的增加,基于大样本均值所构造的95%置信区间的覆盖率将趋于0✌🏼。为了解决这个问题⚒,王教授基于已有的信息,提出了两种不同的解决方法🧔🏽♂️。当辅助信息已知时,我们可以利用Kullback-Leibler散度🦯,从大数据样本中抽取一个小样本;我们可以利用小样本的样本均值估计总体均值。王教授也提出了相应的方差估计方法🌺。除了大样本数据外,如果我们还有一个独立的抽样调查小样本👱🏻♀️,我们可以用数据融合的方法,得到一个双稳健估计量及其对应的方差估计👰🏼♂️。
最后王教授同在场师生进行了热情交流,本次报告会圆满结束。