课程1 分类数据分析
主讲人:
应志良教授(YING Zhiliang,哥伦比亚大学)
杨亚宁教授(YANG Yaning,中国科学技术大学)
课程时间及地点安排:
- 6月7日 8:30——11:30,地点:公共教学一楼1402
14:00——17:00,地点:公共教学一楼1402
- 6月8日8:00——12:00,地点:公共教学一楼1402
- 6月9日 8:00——10:00,地点:公共教学一楼1101
课程内容:
此短期课程的主要内容涵盖了分类数据分析的一些基本概念, 重点是其统计推断的方法和它们的应用. 课程最后简要讨论该学科的发展前沿。课程大纲如下:
- 2 X 2 列联表(contingency table), 优比(odds ratio), 独立性, prospective/restrospective优比, 卡方检验, 费舍尔精确检验(FISHER exact test), 方差估计,点估计和区间估计
- 2 X k列联表, 独立性检验,自由度
- 2 X 2 列联表序列, Mantel-Haenszel 方法, 三维列联表
- 用于二元变量 (binary data) 的Logistic 回归模型, 用于计数变量 (count data) 的泊松(Poisson)回归模型
- 用于分析RXC列联表的对数线性模型 (log-linear model), 泊松(Poisson)模型, 关联图 (association graph), 以及他们和logistic回归的关系
- 分类数据分析的发展前沿简介
课程2 新时期的统计学:降维
主讲人:
何旭明教授(HE Xuming,伊利诺依大学University of Illinois at Urbana- Champaign)
左义君教授(ZUO Yijun,密西根州州立大学 Michigan State University)
课程时间:
- 6月8日13:30——17:30,地点:公共教学一楼1402
- 6月9日 10:15——12:15,地点:公共教学一楼1101;
14:00——18:00,地点:公共教学一楼1101
- 6月12日 8:00——10:00,地点:公共教学一楼1402
课程内容:
课程的第一部分由何教授讲授,提供一个对21世纪统计研究和教育总体概览。重点讲解统计研究的趋势和美国统计学系毕业生的规划模式, 课程的第二部分重点当今统计学中最活跃的研究领域之一:降维。左教授将会为大家介绍分析高维度数据的传统和非传统降维方法。包括:
- Principal component analysis(主成分分析)
- Factor analysis(因子分析)
- Clustering(聚类)
- Ridge regression(岭回归)
- Sliced inverse regression(—— 逆回归)
- Projection pursuit
- Data depth(数据深度)
- Independent component analysis(独立成份分析)
- Generalized principal component analysis(广义主成份分析)
- Algebraic curve and surface fitting(代数曲线和曲面拟合)
- Principal curves(主曲线)
课程3 缺失数据的分析
主讲人:
邵军教授(SHAO Jun,威斯康星大学 University of Wisconsin at Madison)
课程时间:
- 6月12日 10:15——12:15,地点:公共教学一楼1402
14:00——18:00,地点:公共教学一楼1402
- 6月13日 8:30——11:30,地点:公共教学一楼1402
14:00——17:00,地点:公共教学一楼1402
课程内容:
处理缺失数据是调查数据和其他形式数据的统计分析中的常见却有挑战性的部分。此课程介绍缺失数据问题的现代统计拟合。课程大纲如下:
- 缺失的方式
- 可忽略的缺失(随机缺失)
a)基于参数似然的分析
b)插补方法
i.确定性插补
ii.随机插补
iii.多重插补
c)方差估计与推断
i.单一插补与多重插补
ii.直接求导法
iii.重抽样法
- 不可忽略的缺失
a)参数似然方法
b)经验似然方法
c)其它
- 带有缺失值的截面数据
a)遗失信息与缺失值
b)处理遗失信息的方法
i.随机缺失情况下的参数似然方法
ii.随机缺失情况下的插补
iii.末次观察推进法
iv.末次观察分析
c)资料缺失(Informative missing)
i.参数似然方法
ii.分组
d)整群抽样与多元插补
e)截面插补
f) 测量误差