总览
概率论与统计:总览
随机变量其实是一个从事件(概率空间的子集)到数字的映射,是一个具体事件数字化的过程。概率论和统计的一个共同的主要话题就是随机变量,可以说它们像是随机变量的一体两面。
概率论更加注重随机变量取值集合相对应事件的概率。为此,概率论需要讨论事件所有可能的试验结果、事件的运算、事件的独立性、随机变量的取值范围、随机变量的概率分布等话题。
统计中的随机变量来自于对总体的随机抽样,这个过程中,我们会得到一组样本,每个样本在被观测之前,都是服从总体分布的随机变量;观测(observation)之后,它们便有了一个具体的观测值(realization)。我们可以将观测行为类比概率论中的试验,而这种观测行为将会导致一个随机变量坍缩成为一个具体的观测值。
可以这样理解概率论与统计:概率论是根据事件总体的属性,正向推导所有事件对应概率分布的分布函数;统计是根据某个概率分布(即总体分布)采样得到的结果,反向推导该分布的属性。
概率论 | 统计 |
---|---|
概率空间(事件总体) | 样本空间(总体) |
试验 | 样本 |
随机变量的数字特征 | 样本的数字特征(统计量) |
渐进理论 | 统计推段 |
统计推断是统计的终极话题。从任务角度,统计推断主要包括参数估计和假设检验;从方法角度,统计推断分为频率学派和贝叶斯学派。由于笔者习惯采用频率学派视角,故将贝叶斯推断单独抽出,另放它处。