随机变量

在 Wed 24 February 2016 发布于 概率论 分类

离散型随机变量

若一个随机变量最多有可数多个可能的值,则称这个随机变量为离散型的。对一个离散型随机变量\(X\),记\(X\)的概率质量函数(probability mass function) \(p(x)\)为:

$$p(a) = P\{X = a\}$$

\(p(a)\)最多在可数的\(a\)上取正值,即如果\(X\)的可能值为\(x_{1}, x_{2},x_{3}, ....\), 那么:

$$p(x_{i}) \geq 0,i = 1, 2, 3...$$
$$p(x) = 0, 所有其他x$$

由于\(X\)必定取值于\({x_{1}, x_{2}, x_{3}...}\),所以有:

$$\sum_{i = 1}p({x_{i})} = 1$$

对于\(X\)的累计分布函数(cumulative distribution function)\(F(a)\)有:

$$F(a) = \sum_{x \leq a}p(x)$$

对于离散型随机变量\(X\)的期望值为:

$$E[X] = \sum_{x;p(x) \gt 0}xp(x)$$

即,\(X\)所有可能取值的一个加权平均,每个值的权重就是\(X\)取该值的概率。

如果\(X\)是一个离散型随机变量,其可能取值为\(x_{i}\)\(i \leq 1\), 相应的取值概率为\(p(x_{i})\), 那么,对任一实值函数\(g\), 都有:

$$E[g(X)] = \sum_{i}g(x_{i})p(x_{i})$$

\(a, b\)是常数,则:

$$E[aX + b] = aE[X] + b$$

随机变量\(X\)的期望\(E[x]\), 也称之为\(X\)的均值(mean)或者一阶矩(first moment),\(E[X^{n}](n \geq 1)\)称之为\(X\)\(n\)阶矩,即:

$$E[X^{n}] = \sum_{x; p(x) \gt 0}x^{n}p(x)$$

如果随机变量\(X\)的期望为\(\mu\),那么\(X\)的方差\(Var(X)\)为:

$$Var(X) = E[(X - \mu)^{2}] = E[X^{2}] - (E[X])^{2}$$

对于常数\(a, b\)有:

$$Var(aX + b) = a^{2}Var(X)$$
伯努利随机变量和二项式随机变量

如果随机变量\(X\)的值只有两种情况:1或者0,且其概率质量函数:

$$p(0) = P(X = 0) = 1 -p$$
$$p(1) = P(X = 1) = p$$

称随机变量\(X\)为伯努利随机变量 如果\(X\)表示\(n\)次试验中成功的次数,那么\(X\)为参数\((n ,p)\)的二项随机变量。 参数为\((n, p)\)的二项随机变量的概率质量函数为:

$$p(i) = (n\\i)p^{i}(1 - p)^{n - i}, i = 0, 1, 2, 3..., n$$

其期望和方差分别为:

$$E[X] = np$$
$$Var[X] = np(1 - p)$$

如果\(X\)是一个参数为\((n,p)\)的二项随机变量,其中\(0 \lt p \lt 1\), 那么当\(k\)\(0\)\(n\)时, \(P{X = k}\)一开始单调递增, 然后一直单调递减,当\(k = [(n + 1)p]\)时取的最大值(记号\([X]\)表示小于或者等于\(X\)的最大整数)。 \(X\)是一个参数为(n, p)的二项随机变量,其累计分布函数:

$$P{X \leq i} = \sum_{k = 0}^{i}(n\\p)p^{k}(1 - p)^{n - k}, i = 0, 1, 2,...n$$

\(P\{X = k + 1\}\) 和 P{X = k}之间的关系为:

$$P\{X = K + 1\} = \frac{p}{1-p}\frac{n - k}{K + 1}P\{X = k\}$$
泊松随机变量

如果一个取值于\(0, 1, 2, ...\)的随机变量对某一个\(\lambda \lt 0\),其概率质量函数如下:

$$p(i) = P\{X = i\} = e^{-\lambda}\frac{\lambda^{i}}{i!}$$

则称该随机变量服从参数\(\lambda\)的泊松随机变量

其期望和方差分别为:

$$E[X] = \lambda$$
$$Var[X] = \lambda$$

\(P\{X = k + 1\}\) 和 P{X = k}之间的关系为:

$$P\{X = k + 1\} = \frac{\lambda}{\lambda + 1}P\{X = i\}$$
连续型随机变量

如果一个随机变量\(X\)是不可数的,且其值满足\(x \in (-\infty, \infty)\), 且关于其值的函数\(f(x)\)为:

$$P\{X \in B\} = \int_{B}f(x)dx$$

称这个随机变量\(X\)是连续型随机变量。\(f(x)\)为概率密度函数(probability density function)

$$1 = P\{X \in (-\infty, \infty)\} = \int_{-\infty}^{\infty}f(x)dx$$
$$P\{a \leq X \geq b} = \int_{a}^{b}f(x)dx$$

$$P{X = a} = \int_{a}^{b}f(x)dx = 0

$$F(a) = P\{X \in (-\infty, a]\} = \int_{-\infty}^{a}f(x)dx$$