众数和中位数是什么意思(高中数学学习——数据分析)
1,平均数:
这里的平均数就是我们说的统计学的平均数了,其算法和我们初中学过的算平均数的方法是一样的,将所有数加起来的和除以总个数。
平均数反映的是数据总体的水平,但是它的缺点是其中任何一个数发生变化,都会对平均数产生影响,数据越离群,变化就越大。
2,方差与标准差:
方差的算法也和初中学过的是一样的,每个数减去平均数的差的平方加在一起,然后除以总个数。
标准差就是方差开根。
方差和标准差反映的是数据的波动程度,方差越小,数据离群越小;方差越大,数据离群越大。
绝大部分情况下,方差越小越好,但是也有方差越大越好的情况,比如上节课我们说的抽样,方差就越大越好。
3,众数:
众数就是一组数中出现次数最多的数。
注意:如果这组数中有超过一个数出现次数最多,那这几个数都是众数。
众数体现的是这组数的最大集中点。
其缺点是只能反映样本数据很少一部分的信息,无法客观反映整体情况,所以我们比较方案时一般不使用众数进行比较。
4,中位数:
将一组数据按照大小顺序排列,处于最中间的那个数就是中位数。
如果这组数有奇数个数,那么中间一个数就是这组数的中位数。
如果这组数有偶数个数,那么中间两个数的平均数是这组数的中位数。
中位数的特点是不受极端数据的影响,但这也是它的缺点,无法反映出一组数据中的极端数据。
5,极差:
极差就是一组数中最大的数与最小的数之间的差值。
极差反映的是一组数的覆盖范围与偏移大小。
6,百分位数:
百分位数是新高考改革后新增加的考点,因为我们的小三门算赋分就是利用百分位数计算的。
百分位数具体如何计算?
我们举例说明。
例1,假设一组数据为:15,12,12,13,7,17,10,5,9,12,6,8,11,10,8,求它的30%分位数与40%分位数。
第一步,先把这组数按照从小到大的顺序排列:
5,6,7,8,8,9,10,10,11,12,12,12,13,15,17;
第二步,用数据数乘以所要求的百分数:
15*30%=4.5;
15*40%=6;
第三步,如果所得得数不是整数,则比这个数大的第一个整数位上的数就是其百分位数;
如果所得得数是整数,则这个整数位上的数和他的下一位上的数的平均数就是百分位数。
上面30%分位数得数为4.5,不是整数,因此第5个数8就是这组数的30%分位数;
上面40%分位数得数为6,是整数,因此第6位上的数9与第7位上的数10的平均数9.5就是这组数的40%分位数。
7,频率分布直方图:

频率分布直方图很像我们初中学过的条形图,但是二者之间有很大区别。
横向上,条形图横向每个格对应一个数据,但是频率分布直方图横向上每个格对应两个数据,起点和终点。
起点到终点之间的差值叫做组距。
同一个频率分布直方图的每个格的组距都是相同的。
纵向上,条形图纵向对应的频率或频数,读取出来就可以直接应用,但是频率分布直方图的纵向上对应的是频率/组距,不是我们直接应用的数据,需要乘以组距之后才能应用,因此在频率分布直方图中,我们要用的数据是每个矩形的面积。
频率分布直方图中所有矩形的面积之和一定为1。
8,频率分布直方图中的数据分析:
这是一个常考项,也有可能出现在大题里,大家一定要掌握。
(1)平均数。
频率分布直方图的平均数计算类似于概率学的平均数计算,每个格代表的数*对应频率,然后将所有的得数加起来。
注意,因为频率分布直方图每个格对应两个数,所以一定注意审题中题目要求按照前面一个数算还是按照后面一个数算、或者按照平均数算。
(2)方差与标准差。
既然平均数是概率学算法,那么方差与标准差自然也是按照概率学的算法。
(3)众数。
哪个格最高,那个格代表的数就是众数。
(4)极差。
横向可见的最大数减去横向可见的最小数。
注意,极差是不管按哪个数算的,就是可见的最大数减最小数。
(5)中位数与百分位数。
这是考试重点,也是很多同学容易搞错的。
我们举例讲解。
例2,一组数据的频率分布直方图如图所示,求它的30%分位数与中位数。

我们采取的是累积占比法。
比如30%分位数,那么我们就从小到大计算边界对应的积累频率百分比,直到找到30%两边的两个数为止。
10那道线对应的是0%;
20那道线对应的是9%;
30那道线对应的是27%;
40那道线对应的是54%。
好了,找到了,30%就在27%~54%之间,也就是30%分位数就在30~40之间。
不要直接下结论,30%分位数就是35,我们要找到它具体对应的是哪个数。
30~40的跨度是10,其整体占比是27%,也就是说,我们要把这个10分成27份。
其中,从30往后数,27%~30%占比是3份,也就是10*3/27≈1.11。
所以,30%分位数为30+1.11=31.11。
如果从40往前数,30%~54%占比是24份,也就是10*24/27≈8.89。
所以,30%分位数为40-8.89=31.11,结论是一样的。
这就是频率分布直方图中百分位数的求法。
至于中位数,其实就是50%分位数,大家按照上面说的方法自己计算一下是多少?