(2)分段:确定分段间隔k,对编号进行分段;
(3)确定初始编号:在第一段用简单随机抽样确定第一个个体编号l(l≤k);
(4)抽取样本:按照一定的规则抽取样本.
3.分层抽样的步骤
(1)分层,求抽样比:确定抽样比k=;
(2)求各层抽样数:按比例确定每层抽取个体的个数ni=Ni×k;
(3)各层抽样:各层分别用简单随机抽样或系统抽样法抽取个体;
(4)组成样本:综合每层抽取的个体,组成样本.
二、总体分布的估计
1.作频率分布直方图的步骤
(1)求全距.
(2)决定组距与组数,注意样本容量越大,所分组数越多.
(3)将数据分组.
(4)计算各小组的频率,作频率分布表,各小组的频率=.
(5)画频率分布直方图.
2.茎叶图刻画数据的优缺点
(1)所有信息都可以从图中得到;
(2)便于记录和表示;
(3)数据较多时不方便.
3.用样本的频率分布估计总体的分布时的注意事项
(1)对于同一组样本数据,确定的组距不同,得到的组数及分组也不同,绘制的频率分布直方图就会有差异,但都是对总体的近似估计.
(2)应用频率分布直方图时,需明确纵轴表示的是频率/组距,进而进行相关计算.
(3)绘制茎叶图时需注意同一组数据中的相同数据要一一列出.
4.样本的数字特征
(1)样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.
(2)在用样本的数字特征估计总体的数字特征时应注意:
①任何一个样本数据的改变都会引起平均数的改变.特殊情况下,平均数可能受某几个极端值的影响,而偏离一般情况.
②标准差的平方是方差,标准差的单位与样本数据的单位一致.
③用样本的平均数和标准差估计总体的平均数和标准差时,样本的平均数和标准差只