第六章 样本与抽样分布
综合能力考核表详细内容
第六章 样本与抽样分布
样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X(1000)=F(10000),求F([pic] )? (2)从平均寿命、使用时数长短差异来看其质量,即求E([pic])?、D([pic])?。 要解决二个问题 1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: 1) 对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体 中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X对应(等同)。 a. 总体中不同的数量指标的全体,即是R.V.X的全部取值。 b. R.V X的分布即是总体的分布情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时 1100小时 1200小时 20个 30个 50个 X 1000 1100 1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F([pic]),有时也用F([pic])表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y ,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体 三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样 本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用([pic]X[pic],X[pic],……X[pic]) n维随机向量表示。 X[pic]表示第i个被抽到的个体,是随机变量。(i=1,2,…n) (2)确定性: ([pic][pic],[pic][pic],……[pic][pic])表示n个实数,即是每个样品X[pic]观测值[pic] [pic](i=1,2,…n)。 2.定义6.2: 设总体为X,若X[pic],X[pic]……X[pic]相互独立且与X同分布,则称(X[pic],X[pic] …X[pic])为来自总体X的容量为n的简单随机样本(简称样本)。 3.已知总体的分布写出子样的分布 (1)已知总体X~F([pic]),则样品X[pic]~[pic]F([pic][pic]) i=1,2…n样本(X[pic],X[pic]…X[pic])的联合分布为: F([pic][pic],[pic][pic]…[pic][pic])=P(X[pic][pic][pic][pic],X[pic][pic][pic] …X[pic][pic][pic]) =[pic]P(X[pic][pic][pic]) =[pic]F([pic][pic]) 若总体X~f([pic]),样品X[pic]~f([pic][pic]) i=1,2……n 样本(X[pic],X[pic]……X[pic])的联合密度是 : f([pic][pic],[pic][pic]……[pic][pic])=[pic]f([pic][pic]) 例:总体X~N([pic],写出该总体样本(X[pic],X[pic]…X[pic])的 联合密度。 (2)若总体X是离散型随机变量,一般给出分布律: P(X=[pic]k) = pk. k=1,2…… 要写出概率函数f([pic])即f([pic])=P(X=[pic]k)=[pic] [pic]=1,2….., [pic] 例: 总体X~((()写出该总体样本(X1,X2,…Xn)的联合概率函数 例:总体X~B(1,p), 0(p(1写出其样本 (X[pic],X[pic],……X[pic])的联合概率函数。 四 经验分布函数与直方图 1.样本的经验分布函数 (1)定义:设([pic]1, [pic]2,…[pic]n)是来自总体X的一组样本值。将它们按由小到大排序为: [pic]1(([pic]2((…([pic]i((…([pic]n( 对任意的实数[pic], 定义函数: Fn( (x)=[pic][pic] [pic] 则称F[pic]([pic])为总体X的经验分布函数。 2) 格列文科定理: 设总体X的分布函数、经验分布函数分别为F([pic])、Fn(([pic]),则有: P[pic]=1 上式表明,当[pic] ,概率为1的有F[pic]均匀地趋于F([pic])。 2总体的概率密度的估计(直方图 (第一版) [p143 例6.3] 可以用SAS下的interactive data analysis 模块演示。 五 统计量与样本的数字特征 1 定义6.3: 设X1,X2,…,Xn是来自总体X的容量为n的样本,g([pic]1, [pic]2,…, [pic]n)是定义在Rn或Rn子集上的普通函数。如果g中不含有任何未知量,则称g(X1,X2, …,Xn)为统计量。 2.常用的统计量(样本的数字特征) 定义6.4:设X1,X2,…,Xn是来自总体X的样本,则称 [pic] 为样本均值[pic][pic] 为样本方差 [pic] 为样本k阶原点矩 [pic] 为样本k阶中心矩 3.重要性质 定理6.1:设总体X不论服从什么分布,只要其二阶矩存在,即E(X)=μ、D(X)=б2都存在, 则: (1) E([pic])=E(X)=μ (2) D([pic] )=[pic]D(X)=[pic] (3) E(S2)=D(X)=б2 重要恒等式:[pic] §6.2 抽样分布 统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。 一. 三个重要分布 (一)[pic]分布 1. 定义6.5:设X1,X2,…Xn相互独立,均服从N(0,1),则称随机变量[pic]服从自由度为 n的[pic]分布,记为[pic],即:[pic]。 2.定理3.8:[pic]的概率密度为 [pic] 其中[pic] 定理的说明见P146页。 3.图形. 分布函数图: data Kf; do x=0 to 30 by 0.1; y= PROBCHI(x, 8); output; end; run; proc gplot data=kf; plot y*x=1 ; symbol1 v=none i=join r=1 c=black; run; 密度函数图:n=1,5,15 data kf; do y=0 to 20 by 0.1; z0=(y**(-0.5)*exp(-y/2))/(2**0.5* GAMMA(0.5)); z1=(y**(1.5)*exp(-y/2))/(2**2.5* GAMMA(2.5)); z2=(y**(6.5)*exp(-y/2))/(2**7.5* GAMMA(7.5)); output; end; run; proc gplot data=kf; plot z0*y=1 z1*y=1 z2*y=1 /overlay ; symbol1 v=none i=join r=1 c=black; run; 求概率: 自由度为n=25, P{X45时, [pic], tα(n)=uα 。 注意:T~t(n)的密度是偶函数。 称满足[pic]正数[pic]为分布的双侧[pic]分位数。 易知: [pic]查表可得,且 [pic] 同样标准正态分布有: [pic] 。 例:n=20的t分布,求其0.1的上分位数,有 data ; q=TINV(1-0.1,5); put q=; q=TINV(1-0.1,10); put q=; q=TINV(1-0.1,20); put q=; q=TINV(1-0.1,50); put q=; q=TINV(1-0.1,100); put q=; q=TINV(1-0.1,200); put q=; qnorm=(probit(1-0.1));put qnorm=; run; q=1.4758840488 q=1.3721836411 q=1.325340707 q=1.2987136942 q=1.2900747613 q=1.285798794 qnorm=1.2815515655 对于概率:我们看一下当n很大时,t(n)和标准正态分布的近似性。 data; prob_t=PROBT(1.3, 5); put prob_t=; prob_t=PROBT(1.3, 10); put prob_t=; prob_t=PROBT(1.3, 20); put prob_t=; prob_t=PROBT(1.3, 50); put prob_t=; prob_t=PROBT(1.3, 100); put prob_t=; prob_t=PROBT(1.3, 200); put prob_t=; Prob_n=PROBNORM(1.3);put Prob_n=; Run; (3)若F~F(m ,n) 称满足P{F>Fα(m,n)}=[pic]的数Fα(m,n)为F分布的上[pic]分位数。 查表:①表中有的[pic]可直接查表P250 ②表中没有的[pic] [pic] 三.正态总体的[pic]、S2的分布 定理6.2:(费歇(Fisher)定理) 设总体X~N(μ,σ2),X1,X2,…,Xn为来自总体X的样本,其样本均值和样本方差分别记为[pic] 和S2。 则有(1)[pic]与S2相互独立。 (2)[pic] (3)[pic] 证明见书P150 推论1:[pic] 例:总体[pic],问[pic]与[pic]是否独立? 又问[pic]+[pic]服从什麽分布? 推论2:[pic] 定理6.3:设有两个总体: [pic],其样本为X1,X2,… ,Xn,样本均值[pic],样本方差[pic]总体[pic],其样本为[pic],样本均值为[pic],样本 方差为[pic],且两个样本相互独立.则有: (1) [pic] (2) [pic] (3) [pic] 特别当[pic]时, [pic] (4)当[pic]时, [pic], 其中 [pic] 例:设总体[pic],[pic]为来自总体的样本。令[pic], 试确定[pic]使[pic]服从[pic]分布,并指出其自由度。 本章习题:1~8 附加: 设总体X服从贝努里b(1,p)分布,其中p是未知参数。X=(X1,…X5)是从中抽取的一简单随 机子样。写出它的子样空间和X的概率分布;
第六章 样本与抽样分布
样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X(1000)=F(10000),求F([pic] )? (2)从平均寿命、使用时数长短差异来看其质量,即求E([pic])?、D([pic])?。 要解决二个问题 1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: 1) 对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体 中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X对应(等同)。 a. 总体中不同的数量指标的全体,即是R.V.X的全部取值。 b. R.V X的分布即是总体的分布情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时 1100小时 1200小时 20个 30个 50个 X 1000 1100 1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F([pic]),有时也用F([pic])表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y ,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体 三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样 本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用([pic]X[pic],X[pic],……X[pic]) n维随机向量表示。 X[pic]表示第i个被抽到的个体,是随机变量。(i=1,2,…n) (2)确定性: ([pic][pic],[pic][pic],……[pic][pic])表示n个实数,即是每个样品X[pic]观测值[pic] [pic](i=1,2,…n)。 2.定义6.2: 设总体为X,若X[pic],X[pic]……X[pic]相互独立且与X同分布,则称(X[pic],X[pic] …X[pic])为来自总体X的容量为n的简单随机样本(简称样本)。 3.已知总体的分布写出子样的分布 (1)已知总体X~F([pic]),则样品X[pic]~[pic]F([pic][pic]) i=1,2…n样本(X[pic],X[pic]…X[pic])的联合分布为: F([pic][pic],[pic][pic]…[pic][pic])=P(X[pic][pic][pic][pic],X[pic][pic][pic] …X[pic][pic][pic]) =[pic]P(X[pic][pic][pic]) =[pic]F([pic][pic]) 若总体X~f([pic]),样品X[pic]~f([pic][pic]) i=1,2……n 样本(X[pic],X[pic]……X[pic])的联合密度是 : f([pic][pic],[pic][pic]……[pic][pic])=[pic]f([pic][pic]) 例:总体X~N([pic],写出该总体样本(X[pic],X[pic]…X[pic])的 联合密度。 (2)若总体X是离散型随机变量,一般给出分布律: P(X=[pic]k) = pk. k=1,2…… 要写出概率函数f([pic])即f([pic])=P(X=[pic]k)=[pic] [pic]=1,2….., [pic] 例: 总体X~((()写出该总体样本(X1,X2,…Xn)的联合概率函数 例:总体X~B(1,p), 0(p(1写出其样本 (X[pic],X[pic],……X[pic])的联合概率函数。 四 经验分布函数与直方图 1.样本的经验分布函数 (1)定义:设([pic]1, [pic]2,…[pic]n)是来自总体X的一组样本值。将它们按由小到大排序为: [pic]1(([pic]2((…([pic]i((…([pic]n( 对任意的实数[pic], 定义函数: Fn( (x)=[pic][pic] [pic] 则称F[pic]([pic])为总体X的经验分布函数。 2) 格列文科定理: 设总体X的分布函数、经验分布函数分别为F([pic])、Fn(([pic]),则有: P[pic]=1 上式表明,当[pic] ,概率为1的有F[pic]均匀地趋于F([pic])。 2总体的概率密度的估计(直方图 (第一版) [p143 例6.3] 可以用SAS下的interactive data analysis 模块演示。 五 统计量与样本的数字特征 1 定义6.3: 设X1,X2,…,Xn是来自总体X的容量为n的样本,g([pic]1, [pic]2,…, [pic]n)是定义在Rn或Rn子集上的普通函数。如果g中不含有任何未知量,则称g(X1,X2, …,Xn)为统计量。 2.常用的统计量(样本的数字特征) 定义6.4:设X1,X2,…,Xn是来自总体X的样本,则称 [pic] 为样本均值[pic][pic] 为样本方差 [pic] 为样本k阶原点矩 [pic] 为样本k阶中心矩 3.重要性质 定理6.1:设总体X不论服从什么分布,只要其二阶矩存在,即E(X)=μ、D(X)=б2都存在, 则: (1) E([pic])=E(X)=μ (2) D([pic] )=[pic]D(X)=[pic] (3) E(S2)=D(X)=б2 重要恒等式:[pic] §6.2 抽样分布 统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。 一. 三个重要分布 (一)[pic]分布 1. 定义6.5:设X1,X2,…Xn相互独立,均服从N(0,1),则称随机变量[pic]服从自由度为 n的[pic]分布,记为[pic],即:[pic]。 2.定理3.8:[pic]的概率密度为 [pic] 其中[pic] 定理的说明见P146页。 3.图形. 分布函数图: data Kf; do x=0 to 30 by 0.1; y= PROBCHI(x, 8); output; end; run; proc gplot data=kf; plot y*x=1 ; symbol1 v=none i=join r=1 c=black; run; 密度函数图:n=1,5,15 data kf; do y=0 to 20 by 0.1; z0=(y**(-0.5)*exp(-y/2))/(2**0.5* GAMMA(0.5)); z1=(y**(1.5)*exp(-y/2))/(2**2.5* GAMMA(2.5)); z2=(y**(6.5)*exp(-y/2))/(2**7.5* GAMMA(7.5)); output; end; run; proc gplot data=kf; plot z0*y=1 z1*y=1 z2*y=1 /overlay ; symbol1 v=none i=join r=1 c=black; run; 求概率: 自由度为n=25, P{X45时, [pic], tα(n)=uα 。 注意:T~t(n)的密度是偶函数。 称满足[pic]正数[pic]为分布的双侧[pic]分位数。 易知: [pic]查表可得,且 [pic] 同样标准正态分布有: [pic] 。 例:n=20的t分布,求其0.1的上分位数,有 data ; q=TINV(1-0.1,5); put q=; q=TINV(1-0.1,10); put q=; q=TINV(1-0.1,20); put q=; q=TINV(1-0.1,50); put q=; q=TINV(1-0.1,100); put q=; q=TINV(1-0.1,200); put q=; qnorm=(probit(1-0.1));put qnorm=; run; q=1.4758840488 q=1.3721836411 q=1.325340707 q=1.2987136942 q=1.2900747613 q=1.285798794 qnorm=1.2815515655 对于概率:我们看一下当n很大时,t(n)和标准正态分布的近似性。 data; prob_t=PROBT(1.3, 5); put prob_t=; prob_t=PROBT(1.3, 10); put prob_t=; prob_t=PROBT(1.3, 20); put prob_t=; prob_t=PROBT(1.3, 50); put prob_t=; prob_t=PROBT(1.3, 100); put prob_t=; prob_t=PROBT(1.3, 200); put prob_t=; Prob_n=PROBNORM(1.3);put Prob_n=; Run; (3)若F~F(m ,n) 称满足P{F>Fα(m,n)}=[pic]的数Fα(m,n)为F分布的上[pic]分位数。 查表:①表中有的[pic]可直接查表P250 ②表中没有的[pic] [pic] 三.正态总体的[pic]、S2的分布 定理6.2:(费歇(Fisher)定理) 设总体X~N(μ,σ2),X1,X2,…,Xn为来自总体X的样本,其样本均值和样本方差分别记为[pic] 和S2。 则有(1)[pic]与S2相互独立。 (2)[pic] (3)[pic] 证明见书P150 推论1:[pic] 例:总体[pic],问[pic]与[pic]是否独立? 又问[pic]+[pic]服从什麽分布? 推论2:[pic] 定理6.3:设有两个总体: [pic],其样本为X1,X2,… ,Xn,样本均值[pic],样本方差[pic]总体[pic],其样本为[pic],样本均值为[pic],样本 方差为[pic],且两个样本相互独立.则有: (1) [pic] (2) [pic] (3) [pic] 特别当[pic]时, [pic] (4)当[pic]时, [pic], 其中 [pic] 例:设总体[pic],[pic]为来自总体的样本。令[pic], 试确定[pic]使[pic]服从[pic]分布,并指出其自由度。 本章习题:1~8 附加: 设总体X服从贝努里b(1,p)分布,其中p是未知参数。X=(X1,…X5)是从中抽取的一简单随 机子样。写出它的子样空间和X的概率分布;
第六章 样本与抽样分布
[下载声明]
1.本站的所有资料均为资料作者提供和网友推荐收集整理而来,仅供学习和研究交流使用。如有侵犯到您版权的,请来电指出,本站将立即改正。电话:010-82593357。
2、访问管理资源网的用户必须明白,本站对提供下载的学习资料等不拥有任何权利,版权归该下载资源的合法拥有者所有。
3、本站保证站内提供的所有可下载资源都是按“原样”提供,本站未做过任何改动;但本网站不保证本站提供的下载资源的准确性、安全性和完整性;同时本网站也不承担用户因使用这些下载资源对自己和他人造成任何形式的损失或伤害。
4、未经本网站的明确许可,任何人不得大量链接本站下载资源;不得复制或仿造本网站。本网站对其自行开发的或和他人共同开发的所有内容、技术手段和服务拥有全部知识产权,任何人不得侵害或破坏,也不得擅自使用。
我要上传资料,请点我!
管理工具分类
ISO认证课程讲义管理表格合同大全法规条例营销资料方案报告说明标准管理战略商业计划书市场分析战略经营策划方案培训讲义企业上市采购物流电子商务质量管理企业名录生产管理金融知识电子书客户管理企业文化报告论文项目管理财务资料固定资产人力资源管理制度工作分析绩效考核资料面试招聘人才测评岗位管理职业规划KPI绩效指标劳资关系薪酬激励人力资源案例人事表格考勤管理人事制度薪资表格薪资制度招聘面试表格岗位分析员工管理薪酬管理绩效管理入职指引薪酬设计绩效管理绩效管理培训绩效管理方案平衡计分卡绩效评估绩效考核表格人力资源规划安全管理制度经营管理制度组织机构管理办公总务管理财务管理制度质量管理制度会计管理制度代理连锁制度销售管理制度仓库管理制度CI管理制度广告策划制度工程管理制度采购管理制度生产管理制度进出口制度考勤管理制度人事管理制度员工福利制度咨询诊断制度信息管理制度员工培训制度办公室制度人力资源管理企业培训绩效考核其它
精品推荐
下载排行
- 1社会保障基础知识(ppt) 16695
- 2安全生产事故案例分析(ppt 16695
- 3行政专员岗位职责 16695
- 4品管部岗位职责与任职要求 16695
- 5员工守则 16695
- 6软件验收报告 16695
- 7问卷调查表(范例) 16695
- 8工资发放明细表 16695
- 9文件签收单 16695
- 10跟我学礼仪 16695