定义在样本空间上的实值函数称为随机变量。也就是如果随机变量本来就是数字体现,那么就是他本身,比如超市一天光顾的客人数目等。如果随机事件本身不是以数字为体现,比如产品合格不合格,我们就定义合格和不合格为1或者0。这样就通过数字将这些随机事件的结果进行了表示。这个可变的数量我们称之为随机变量。相关的概念有:样本空间,样本点等等。根据数值取值的连续和不连续性,我们把随机变量分为离散随机变量和连续随机变量。
和其他的变量不同,概率论中的随机变量是一个“随机取值的变量并伴随一个分布”。我们不仅要知道随机变量X可能取哪些值。而且还要知道它取这些值得概率各是多少。这就需要分布的概念,有没有分布是区别一般变量与随机变量的主要标志。
为了掌握X的统计规律性,我们只要掌握X取各种值的概率。这个通常是由随机变量的分布定义的。设X是一个随机变量,对于任意的实数x,称
F(x)=P(X<=x)
为随机变量X的分布函数。且称X服从F(X),记为X~F(X)。这个分布具有“累积性”。且其他随机事件都可以由这个表示出来。任何一个随机变量都有一个分布。
定理:任意分布函数F(x)都有一下三条性质:
(1)单调性 (2)有界性 (3)右连续性
需要注意的是,这个三个性质成为判别某个函数是否能成为分布函数的充要条件。
这里需要注意的是: P(X=b)=F(b)-F(b-0),分布函数是右连续而不一定是左连续的。当分布函数也是左连续的时候。我们有F(b)=F(b-0),也就是单点的概率为P(x=b)=0。
柯西分布函数是一个有名的分布函数,是由一个反正切函数构造的,在-1和1之间的概率是0.5。有兴趣的可以去查一下。