标题
  • 标题
  • 作者
  • 关键词

社会统计分析中的悖论与变换问题

2011-03-30分类号:C81

【作者】程中兴  
【部门】复旦大学社会学系  广西师范大学社会学系  
【摘要】如何解释隐现于列联表中的辛普森悖论,如何区分回归中logit变换与probit变换的内在差异与背后假定,是社会统计分析中两大应用性问题。文章从社会统计对象的独特特征出发,认为辛普森悖论与其说是"悖论",不如说是反映了分类数据的非线性特征,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。同理,在回归分析中,由于分类数据的非线性特征,无论logit变换,还是probit变换,实际上只有在0.2~0.8之间才基本呈现线性,在这个范围之外,两个函数都是高度非线性的。
【关键词】辛普森悖论  分类数据非线性特征  logit变换  probit变换
【基金】教育部人文社会科学研究青年基金资助项目(10YJC840014);; 中国博士后科学基金资助项目(20100470620)
【所属期刊栏目】统计与决策
文献传递