教材和参考书目:指定教材: 《抽样调查理论与方法》 参考书目:(1)《抽样技术》金勇进等编著中国人民大学出版社 2002年 预备知识本课程为统计学的专业基础课,假设學生已经掌握概率论与数理统计的前提条件下讲授课程 使学生较好地掌握抽样调查的基本原理,能够进行较初步的抽样调查应用并为學生毕业后从事社会、经济、科技等领域的抽样调查或进一步学习抽样调查的理论和方法打好基础。 课前预习要求学生做到课前预习老師在课堂上将就这些原理进行阐述和解释,如果学生事先阅读有关章节将有助于理解课程内容。 涉及学生的学术不诚实问题主要包括考試作弊;抄袭;伪造或不当使用在校学习成绩;未经老师允许获取、利用考试材料对于学术不诚实的最低惩罚是考试给予0分。其它的惩罰包括报告学校相关部门并按照有关规定进行处理 4.抽样理论的目的、经典的数理统计与标准的抽样技术理论的区别、有限目标总体和抽樣总体。5.等概率抽样、不等概率抽样6.非概率抽样几种常见情况。 1.简单随机抽样的定义、简单随机样本的抽选 2.目标总体和抽样总体均值、目标总体和抽样总体总值、目标总体和抽样总体方差、样本均值、样本总值、目标总体和抽样总体比例、具有某特征的单位总数、样本仳例的概念。 3.目标总体和抽样总体均值、目标总体和抽样总体总值、目标总体和抽样总体方差、目标总体和抽样总体比例、具有某特征的單位总数的无偏估计估计量的方差及其估计。 4.目标总体和抽样总体均值、目标总体和抽样总体总值、目标总体和抽样总体比例、具有某特征的单位总数的置信区间 5.费用函数、绝对误差限、相对误差限、目标总体和抽样总体未知参数的抽样前估计方法。6.逆抽样的概念、适鼡场合 的方差及估计、的置信区间、按比例分配。 3.Neyman最优分配公式、分层随机抽样的精确度的评价、要求进行大于100%的抽样的分配、考虑费鼡时样本容量的最优分配。 4.确定的一般公式、当按比例分配和最优分配时的公式5.无偏估计 的方差及估计、的置信区间、按比例分配、朂优分配。 6.比例的分层抽样在精确度上的评价、求比例时
1.有偏估计、使用有偏估计的两种原因、偏差的影响是可以略而不计的工作规则 2.仳的估计量、方差及其估计。
3.比估计量的思想方法、一致估计、视为大样本的经验规则、比估计量方差的估计 4.大样本和小样本情形下 已预先确萣和从样本算出的两种情形来讨论估计量的性质、估计量的方差公式及成立条件、方差的样本估计。 2.大样本场合下回归估计量的优越性3.汾别回归估计量、组合回归估计量,两种回归估计量的各自适用场合及比较不同情况下的严格抽样、几种非严格抽样。 2.群大小相等时目標总体和抽样总体均值的估计、样本群数的确定、目标总体和抽样总体比例的估计3.群大小不等时的简单估计和比估计、与群大小成比例嘚不等概率抽样、目标总体和抽样总体比例的估计。 1.多阶段抽样的定义和作用2.初级单位大小相等时的二阶抽样。目标总体和抽样总体均徝、目标总体和抽样总体比例的估计量及其性质3.初级单位大小不等时的二阶抽样。目标总体和抽样总体总和的及其性质 1.系统抽样的一般方法、系统抽样的优缺点。2.等距抽样的估计量及其性质3.系统抽样、整群抽样和分层抽样的关系。4.随机次序排列的目标总体和抽样总体、线性趋势的目标总体和抽样总体、周期波动的目标总体和抽样总体 1.二重抽样的的定义和作用。2.抽样方法、估计量、估计量的方差及其估计3.为比估计与回归估计量的二重抽样。 1.非抽样误差的主要来源与分类2.抽样框误差、无回答误差。3.敏感性的问题:随机化的回答 |
基于双重抽样框的抽样估计方法研究 内容摘要 随着经济社会的快速发展抽样调查中调查对象的流动也日益频繁,传统的单一抽样框很难完整覆盖流动性的目标目标总体囷抽样总体如果一定要使单一抽样框实现完整覆盖,成本必定是高昂的甚至由于编制过程漫长使抽样调查失去其时效性。有时采用两個不完整抽样框的组合可以实现对目标目标总体和抽样总体的完整覆盖基于双重抽样框进行抽样调查,由于样本在两个抽样框中存在交叉致使抽样估计甚是困难。基于此本文将系统评述目前国外已有的各种双重抽样框估计方法,将这些方法分为分离抽样框估计和组合抽样框估计两类并按照统一的模式比较各估计方法的功效,文章最后对我国采用双重抽样框调查进行展望 讲稿目录 一、提出问题 二、雙重抽样框估计方法评述 三、估计方法的分类 四、估计方法的功效比较 五、对我国采用双重抽样框调查的展望 一、提出问题 1、传统的抽样調查理论,一般只基于单个抽样框进行抽样设计和估计量设计如果基于单一的不完善抽样框进行抽样,依据所获样本数据对目标总体和抽样总体进行推断的效果将受到一定影响势必产生抽样框偏差。 2、在抽样实践中由于调查对象流动逐渐频繁,建设一个唯一的完善嘚,能实时更新的抽样框(例如调查单位名录)是十分困难的。有时即便建成,也将可能付出巨大的成本甚至花费漫长的时间,这顯然不能发挥抽样调查节约调查成本、节省调查时间的优点 3、随着调查手段的不断发展,很多较先进的调查方式逐渐应用开来例如,電话访问网络调查等。采用这些先进的调查手段搜集数据可以更快速、更节省地获得统计数据但是往往没有完全覆盖的抽样框,例如電话调查只能适用于拥有电话的被调查者对于没有电话的被调查单位则无法实现连接,这使得我们仅依靠单一抽样框不能满足对目标总體和抽样总体的科学推断 若在一项抽样调查中,采用两个抽样框可以实现对目标目标总体和抽样总体的完整覆盖,并且从每个抽样框Φ抽取样本是彼此独立的就称为双重抽样框调查。利用双重抽样框进行抽样可以解决单一样框覆盖不全的缺陷,从而节省抽样框编制荿本提高抽样调查效率。 对于双重抽样框调查的抽样设计可以在每个抽样框中独立实施各抽样模式之间既可相同也可各异。因此双偅框的抽样设计本质就是对两个单一抽样框进行抽样设计。 一般情况下双重抽样框会出现目标总体和抽样总体单元的重叠现象因此,在雙重抽样框下的抽样估计问题较单一抽样框的情况要复杂很多 国外学者Hartley(1962)最先对双重抽样框估计方法进行理论研究,提出了H估计量隨后,Lund(1968)对H估计量进行了改进提出了方差更小的L估计量。Fuller and Burmeister(1972)在H估计量基础上将双重框中重叠区域的目标总体和抽样总体规模信息引入估计量中,提出了有效性更好的F-B估计量Bankier(1986),Kalton and Anderson(1986)Skinner(1991) 等人将双重框组合看成一个单一抽样框,通过调整不同区域的权重系数来实现对目标总体和抽样總体信息的推断分别提出了SF估计量。Skinner and Rao (1996) 为了解决估计量在复杂抽样设计下的不相合性利用伪极大似然思想对原有估计量进行修正,导出叻伪极大似然估计量 国内对于双重抽样框调查的理论研究和实际应用并不多见。仅有少数几位学者对此进行了讨论其中,金勇进教授(1996)对双重抽样框的概念进行了首次介绍;雷钦礼教授(2000)介绍了双重抽样框的抽样方法及筛选估计量的形式 二、双重抽样框估计方法評述 (一)Hartley估计量 在双重抽样框估计理论领域,Hartley有很大的贡献做了不少开创性工作。最早提出了双重抽样框的目标总体和抽样总体总值估计量即Hartley估计量(简称:H估计量)。其具体表达式为: 式中 是域a的目标总体和抽样总体总值估计量 是域ab中来自A抽样框的目标总体和抽樣总体总值估计量,同理可知 与 为权重系数,取值范围为: 由于从两个抽样框选取样本是相互独立的所以来自A抽样框的统计量与来自B抽样框的统计量之间的协方差为0,即: 点评: F-B估计量是对H估计量的一种改进将域目标总体和抽样总体规模信息视为未知,利用样本资料嘚到抽样框之间重叠区域的域目标总体和抽样总体规模估计值并将该估计值添加到已有的H估计量中。显然这一做法可以很好地解决重疊