5.变异系数:Cy=1o%,常用于比较度量单位不同或均数相差较大的两组或多组观察值的变异程度。(三)正态分布的特点、面积分布规律1、①以均数μ为中心,左右对称;②有两个参数即均数μ和标准差·,μ是位置(平均水平)参数,σ一定时,μ增大则曲线沿横轴向右移动,σ是变异参数,σ越大则曲线形态越“矮胖”,表示数据分布越分散;③标准正态分布:N(μ=0,o=1)。2、正态分布的面积分布规律:越远离中心,曲线越接近X轴,曲线下面积越小。士1,68.3%;±1.96,95%:±2.58,99%。三、数值变量数据的统计推断1.抽样误差:样本均数x≠总体均数μ。不可避免2.标准误:标准误与样本含量的平方根成反比。①衡量抽样误差大小,标准误越小则样本均数与总体均数越接近,样本均数可信度越高:②估计总体均数的可信区间。3.假设检验的基本步骤:也叫显著性检验,比较总体参数之间有无差别。1)建立检验假设和设定检验水准:目的H(无效假设)H(备择假设)双侧是否μ丰2μ,=μ2μ,≠μ2单侧是否μ>μ2μ=μ2μ1>μ2是否μ<2μ,=μ2μ,<μ2a(检验水准)=0.05或a=0.012)计算统计量:u值或t值3)确定P值和判断结果。如双侧t检验,|t|≥t。2.,则若P≤a,拒绝H接受H:若P>a则不能拒绝H。通常P>0.05称差异不显著,0.01
50,正态分布。t检验(总体标准差已知)-一小样本n<50,正态分布。u/t=(X1-X2)/Sa-2。四、分类变量资料的统计描述1.率:某现象发生的频率或强度。总体率:π;样本率:P。2.构成比:某事物内部各构成部分所占的比重。百分数表示。3.相对比:描述两者对比水平。五、分类变量资料的统计推断1、总体率(π)95%可信区间:P±1.96SP;总体率(r)99%可信区间:P±2.58SP。2、u检验和X检验:X检验:推断两个及两个以上率有无差别。比较均数用u、t,>50要选u,率的检验用卡方,偏态分布也可以六、直线相关和统计图表1、直线相关:表示两事物的相关关系,多用散点图。①相关系数:r,没有单位,数值为-1≤r≤1,为正则正相关;=0为零相关:绝对值为1称完全相关;r的绝对值越接近1,相关越密切。正负取决与L。②直线回归分析:X自变量,Y因变量,Y=a+bX,其中b为回归系数即直线的斜率,表示X每增减一个单位,Y平均改变b个单位;a为直线在Y轴上的截距,a>0则直线与Y轴交点在原点上方,=0过原点。