众数 (数学)

一組數據中出現次數最多的數據值

众数(英语:mode)指一组数据中出现次数最多的数据值。例如{8,7,7,8,6,5,5,8,8,8}中,出现最多的是8,因此众数是8,众数可能是一个数(数据值),但也可能是多个数(数据值)。若数据的数据值出现次数相同且无其他数据值时,则不存在众数。例如{5,2,8,2,5,8}中,2、5、8出现次数相同且没有其他数,因此此数据不存在众数。

离散概率分布中,众数是指概率质量函数有最大值的数据,也就是最容易取様到的数据。在连续概率分布中,众数是指概率密度函数有最大值的数据(峰值)。

在统计学上,众数和平均数中位数类似,都是总体随机变量有关集中趋势的重要信息。在高斯分布正态分布)中,众数为峰值所在的位置,和平均数中位数相同。但若分布是高度偏斜分布,众数可能会和平均数、中位数有很大的差异。

分布中的众数不一定只有一个,若概率质量函数或概率密度函数在x1, x2……等多个点都有最大值,就会有多个众数,最极端的情形是离散型均匀分布,所有的点概率都相同,所有的点都是众数。若概率密度函数有数个局部最大值,一般会将这几个极值都称为众数,此连续概率分布会称为多峰分布英语Multimodal distribution(和单峰性英语Unimodality相反)。

若是对称的单峰分布(例如正态分布),众数和平均数中位数会重合[1]。若一随机变量是由对称的总体中产生,可以用取样的平均值来估计总体的众数。

特征

 
任意概率密度函数的众数、中值和均值的几何可视化.[2]

用众数代表一组数据,适合于数据量较多时使用,且众数不受极端数据的影响[3],并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数中位数。例子:{苹果,苹果,香蕉,橙,橙,橙,桃}的众数是橙。

使用

主要用于分类数据,也可用于顺序数据数值型数据

历史

众数的英文mode最早是由卡尔·皮尔逊在1895年开始使用[4]

参见

参考文献

  1. ^ 現代統計學的發展. [2017-02-02]. (原始内容存档于2017-02-25). 
  2. ^ AP Statistics Review - Density Curves and the Normal Distributions. [16 March 2015]. (原始内容存档于2 April 2015). 
  3. ^ 魏和清; 罗良清. 实用统计学. 中国财政经济出版社. 1 July 2011: 107–. ISBN 978-7-5095-2899-0. 
  4. ^ Pearson, Karl (1895). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material", Philosophical Transactions of the Royal Society of London, Ser. A, 186, 343-414