编辑: 雷昨昀 2019-09-23
统计抽样主要研究什么内容,解决什么问题?统计抽样主要有哪几种方法?如何确定样本容量? 7.

1 统计抽样基本概念 总体由研究对象的全体所组成.样本是总体中的部分元素所组成的集合.目标总体是我们要推断的总体抽样总体是实际抽取样本的总体 在抽样之前,应将总体划分为抽样单位.抽样单位既可以是一个简单的个体,也可以是一组个体. 对某一个特殊研究,抽样单位的名册称为抽样框. 7.1 统计抽样基本概念 调查方法 邮寄调查 电话调查 个人采访调查 7.2 抽样调查种类和抽样方法 调查误差 非抽样误差 抽样误差 由于没有对总体的所有单位进行调查而产生的误差 进行一次抽样调查可能出现的如测量误差、采访者误差及数据处理误差等. 7.3 调查误差 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机样本,使每一个容量为n的可能样本,都有相同的概率被抽中. 建立抽样框 根据随机数表进行抽样 抽样总体中所有个体的名册 使用随机数表,可以保证抽样总体中的每个个体都有相同的概率被抽中 7.4 简单随机抽样 总体均值总体比率样本容量的确定 7.4 简单随机抽样 如果选择大样本(n≥30),则中心极限定理可以保证 的抽样分布近似服从正态概率分布,μ的区间估计为 式中,为均值的标准差. 1-α称为置信度, 为与之对应的临界值.例如,若置信度为95%,则.7.4.1 总体均值 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机样本时,均值的标准差的估计值为此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取μ=2.因此,在使用简单随机样本时,总体均值的近似95%的置信区间的表达式为: 7.4.1 总体均值 [例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有8000个订户.根据一个484个订户的简单随机样本,得出订户的年平均收入为30500元,标准差为7040元.因此,所有订户的年平均收入的无偏估计为 元.因此,这本杂志订户的年平均收入的近似95%的置信区间为即(29880,31120). 7.4.1 总体均值 上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计.对点估计的抽样分布近似服从正态概率分布的所有情形,其近似95%的置信区间为例如,在《摄影》的抽样调查中,点估计量的标准误差的估计值为 ,允许误差为2*310元=620元. 7.4.1 总体均值 总体比率p是总体中具有某些感兴趣特征的个体的比重.[例7.2]在市场调查研究中,人们想了解喜欢某一品牌的消费者比重.样本比率 是总体比率的无偏点估计.总体比率的标准差的估计值为因此,总体比率的近似95%的置信区间的表达式如下: 7.4.2 总体比率 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的500所学校中,使用天然气作为取暖燃料的学校比率.如果在抽出的50所学校中,有35所学校使用天然气作为取暖燃料,则总体500所学校中使用天然气比率的点估计值 .比率的标准差的估计值为因此,总体比率的近似95%置信区间为即(0.5758,0.8242 ). 7.4.2 总体比率 回忆前面提到的允许误差为 点估计的标准差估计值的2倍 ,因此: 均值的标准差的估计值: 7.4.3 样本容量的确定 两步抽样 用试点调查或事先检验的结果估计s2 估计s2的方法 根据以往的资料估计s2 由第一步抽取的部分单位,得到的s2的估计值,将此值代入上式,确定出全部样本容量n;

然后对第一步确定的全部样本容量,再抽取第二步所需要的其余单位数. 7.4.3 样本容量的确定 [例7.3]某大学有5000名毕业生,我们想构造宽度在1000元之内的近似95%的置信区间.对这样规定的置信区间,B=500.在确定n之前,需要估计 .假设根据去年所做的同样研究,得知s=3000元.我们可以用这个值来估计 .根据B=

500、 s=3000 及N=5000,则样本容量为 7.4.3 样本容量的确定 在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似.我们只需要将估计总体均值的公式中 替换为 ,即 使用上式时,我们必须规定允许误差B和给出 的一个估计值.如果没有合适的估计值,我们可以使用 代替,这样将保证近似置信区间的允许误差比希望的要小的多. 7.4.3 样本容量的确定 将总体划分H组 从第h层中抽取一个容量为nh的简单随机样本 由这H个简单随机样本的联合资料,可得出诸如总体均值、总体总量及总体比率等各种总体参数的估计. 分层简单随机抽样的步骤: 也称为层 7.5 分层简单随机抽样 如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将更窄).各层的划分应依据样本设计者的判断.根据应用,总体可按部门、地区、年龄、产品类型、销售水平等分层. 7.5 分层简单随机抽样 [例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪. 7.5 分层简单随机抽样 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比重.用 表示总体均值的点估计,其定义如下:式中:H--层数;

--第h层的样本均值;

Nh--第h层的单位数;

N--总体单位数;

对分层简单随机样本,计算平均值的标准差的估计公式为 7.5.1 总体均值 某大学管理学院的180名毕业生的样本调查结果 7.5.1 总体均值 各专业(层)的样本均值分别为: 因此,总体均值的点估计为 7.5.1 总体均值 抽样调查中估计均值的标准差所需要的部分计算结果 7.5.1 总体均值 上表中因此,总体的近似95%的置信区间为即(29074,29626). 7.5.1 总体均值 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权平均数,所用权数为总体在各层的比重.总体比率的点估计定义如下:式中:H--层数;

--第h层的样本比率;

NhD第h层的单位数;

ND总体单位数;

7.5.2 总体比率 的标准差的估计值为总体比率的近似95%的置信区间的表达式为 7.5.2 总体比率 [例7.5] 在某大学的调查中,大学想了解毕业生开始工作时的年薪不低于36 000元的比率.180名毕业生的抽样调查结果显示,有20名毕业生开始工作时的年薪不低于36000元,其中会计专业4名,金融专业2名,信息系统专业7名,市场营销专业1名,经营管理专业6名. 7.5.2 总体比率 根据总体比率的近似95%的置信区间的公式,开始工作时的年薪不低于36000元的比率的点估计为: 故毕业生开始时的年薪不低于36000元的比率近似95%置信区间为(0.0575,0.1387) 7.5.2 总体比率 对分层简单随机抽样,我们可用两阶段过程来选择样本容量. 既然人们想估计各层的均值、总量及比率,这两种组合方法都经常使用. 确定总样本容量n 决定各层应分配的样本单位数 决定每层应选择的样本单位数 加总得到总样本容量 或者 7.5.3 样本容量的确定 确定总样本容量n及其分配,可对所有要研究的总体参数提供必要的精度.分配工作就是决定总样本被分配到各层的部分,这些部分将确定各层的简单随机样本的容量. 各层的单位数 各层内的方差 考虑的因素 各层选择单位的费用 7.5.3 样本容量的确定 一般地,单位数较多的层和方差较大的层应分配较多的样本数目.相反地,对于给定的费用,为了获得更多的信息,则抽样单位成本较大的层应分配较少的样本数目. 7.5.3 样本容量的确定 整群抽样需要将总体各个个体分为N组(也称作群),使总体中每个个体只属于一群. 总体 组1 组2 个体4 个体5 个体1 个体6 个体2 个体3 7.6 整群抽样 例如,我们想调查某省的登记选民.则有两种方法: 调查某省的登记选民.有两种方法: 第一种方法是建立包含该省所有登记选民的抽样框,然后根据抽样框,选择选民的一个简单随机样本. 第二种方法是整群抽样,我们选择用该省各县的清单作抽样框.在这个方法中,每个县(或群)包含一组登记选民,而该省的每个登记选民只属于一群. 7.6 整群抽样 分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上是相似的. 选择整群抽样与分层抽样的原因是不同的. 当群内的个体存在差异时,整群抽样可提供较好的结果. 理想情形是每一群是整个总体的一个缩影,这时,抽取很少的群就可以提供关于整个总体特征的信息. 整群抽样 与分层抽样 的 比较 7.6 整群抽样 [例7.6] 某省拥有12000名执业注册会计师的注册会计师协会进行了一项调查.作为调查的一部分,注册会计师协会收集与收入、性别和与注册会计师生活方式有关的因素的信息.因为用个人采访法去搜集所需要的信息,因此注册会计师协会采用整群抽样,以使总的差旅费和采访费用达到最小.抽样框中包含所有在该省登记注册的执业会计师事务所. 7.6 整群抽样 假设有1000群,即在该省登记注册的从事会计活动的会计师事务所有1000个,选择10个会计师事务所为一个简单随机样本. [例7.6](续) 7.6 整群抽样 为了介绍在整群抽样中,构造总体均值、总体总量和总体比率的近似95%置信区间需要的公式,我们使用如下的记号: N―总体的群数;

n―样本中选出的群数;

Mi―i群的单位数;

M―总体单位数;

M=M1+M2+…十MN;

―每一群的平均单位数. Xi――第i群所有观察值的总量;

ai――第i群具有某特征的观察值的数量;

7.6 整群抽样 对注册会计师协会的抽样调查,我们有如下资料: N=1000 n=10M=12000 下表7-4为每个中选群的Mi和xi的值,以及中选事务所中女注册会计师的数量(ai)的资料. [例7.6](续) 7.6 整群抽样 7.6 整群抽样 由整群抽样得到的总体均值的点估计的公式如下: (7-25) 7.6.1 总体均值 该点估计量的标准差的估计为: (7-26) 总体均值的近似95%的置信区间为: 7.6.1 总体均值 根据表7-4的资料,我们可以得到执业注册会计师平均年薪的点估计为 [例7.6](续) 7.6.1 总体均值 由于表7-4中的年薪资料是以千元计量的,因此,执业注册会计师的平均年薪的估计值为42531元. 而: 因此: [例7.6](续) 7.6.1 总体均值 因此标准差为1.730.我们得到平均年薪的近似95%置信区间: 即(39.071,45.991). [例7.6](续) 7.6.1 总体均值 整群抽样的总体比率的点估计如下: (7-30) 式中ai――第i群中具有某种感兴趣特征的个体的数量. 7.6.2 总体比率 该点估计量的标准误差的估计为: (7-31) 总体比率的近似95%的置信区间 (7-32) 7.6.2 总体比率 对注册会计师抽样调查,可以得到女性执业注册会计师的比率的估计为: [例7.6](续) 7.6.2 总体比率 并且: 因此: [例7.6](续) 7.6.2 总体比率 因此,女性执业注册会计师比率的近似95%置信区间为 即(0.2052,0.3416). [例7.6](续) 7.6.2 总体比率 先通过选择β(即允许误差)的值,规定可接受的精度水平 建立满足所需要的精度的n值的计算公式 每群平均个体的数量和群间方差是决定样本中包含群数多少的关键因素.如果各群相似,则群间方差小,因此中选群数就比较少. 如果每群平均个体数量较大,则中选群数也会比较少. 整群抽样的过程同其他抽样方法整体上是类似的 7.6.3 样本容量的确定 例如,需要从容量为5000的总体中抽取一个容量为50的样本,我们可以从总体中随机选择一个,然后在其后面的抽样框中,每隔100个个体选择一个,可得到样本中其余的个体. 7.7 系统抽样 因为第一个个体的选择是随机的,因此系统样本常常........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题