第 第 1 1 章随机事件 及其 概率
(1)排列组合公式 )! (!n mmPnm 从 m 个人中挑出 n 个人进行排列的可能数。
)! ( !!n m nmCnm 从 m 个人中挑出 n 个人进行组合的可能数。
(2)加法和乘法原理 加法原理(两种方法均能完成此事):
m+n
某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。
乘法原理(两个步骤分别不能完成这件事):m m ×n n
某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 m×n 种方法来完成。
(3)一些常见排列 重复排列和非重复排列(有序)
对立事件(至少有一个)
顺序问题 (4)随机试验和随机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
(5)基本事件、样本空间和事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用 来表示。
基本事件的全体,称为试验的样本空间,用 表示。
一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母 A,B,C, „表示事件,它们是 的子集。
为必然事件,?为不可能事件。
不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为 1,而概率为 1 的事件也不一定是必然事件。
(6)事件的关系与运算 ①关系:
如果事件 A 的组成部分也是事件 B 的组成部分,( A 发生必有事件B 发生):
B A
如果同时有 B A , A B ,则称事件 A 与事件 B 等价,或称 A等于 B :
A=B 。
A、B 中至少有一个发生的事件:
A B ,或者 A + B 。
属于 A 而不属于 B 的部分所构成的事件,称为 A 与 B 的差,记为A-B ,也可表示为 A-AB 或者 B A ,它表示 A 发生而 B 不发生的事件。
A、B 同时发生:
A B ,或者 AB 。A B=?,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。
-A 称为事件 A 的逆事件,或称 A 的对立事件,记为 A 。它表示A 不发生的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)CA∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C)(A∪B)∩C=(AC)∪(BC) 德摩根率: 1 1 iiii A AB A B A , B A B A
(7)概率的公理化定义 设 为样本空间, A 为事件,对每一个事件 A 都有一个实数P(A),若满足下列三个条件:
1°0≤P(A)≤1, 2°P(Ω)=1 3°对于两两互不相容的事件1 A , 2 A ,„有 常称为可列(完全)可加性。
则称 P(A)为事件 A 的概率。
(8)古典概型 1° n 2 1 , , 2°nP P Pn1) ( ) ( ) (2 1 。
设任一事件 A ,它是由m 2 1 ,组成的,则有 P(A) = ) ( ) ( ) (2 1 m = ) ( ) ( ) (2 1 mP P P
(9)几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 A, ) () () (LA LA P 。其中 L 为几何度量(长度、面积、体积)。
(10)加法公式 P(A+B)=P(A)+P(B)-P(AB) 当 P(AB)=0 时,P(A+B)=P(A)+P(B) (11)减法公式 P(A-B)=P(A)-P(AB) 当 B A 时,P(A-B)=P(A)-P(B) 当 A=Ω时,P( B )=1-P(B) (12)条件概率 定义设 A、B 是两个事件,且 P(A)>0,则称) () (A PAB P为事件 A 发生条件下,事件 B 发生的条件概率,记为 ) / ( A B P) () (A PAB P。
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如 P(Ω/B)=1 P( B /A)=1-P(B/A) (13)乘 乘法公式:
) / ( ) ( ) ( A B P A P AB P
法公式 更一般地,对事件 A 1 ,A 2 ,„A n ,若 P(A 1 A 2 „A n-1 )>0,则有 2 1 ( A A P„) n A ) | ( ) | ( ) ( 2 1 3 1 2 1 A A A P A A P A P „„2 1 | ( A A A P n„) 1 n A。
(14)独立性 ①两个事件的独立性
设事件 A 、 B 满足) ( ) ( ) ( B P A P AB P ,则称事件 A 、 B 是相互独立的。
若事件 A 、 B 相互独立,且0 ) ( A P,则有 若事件 A 、 B 相互独立,则可得到 A 与 B 、 A 与 B 、 A 与 B 也都相互独立。
必然事件 和不可能事件?与任何事件都相互独立。
?与任何事件都互斥。
②多个事件的独立性
设 ABC 是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足 P(ABC)=P(A)P(B)P(C) 那么 A、B、C 相互独立。
对于 n 个事件类似。
(15)全概公式 设事件n B B B , , , 2 1 满足 1°n B B B , , , 2 1 两两互不相容,) , , 2 , 1 ( 0 ) ( n i B P i , 2°nii B A1 , 则有 ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( 2 2 1 1 n n B A P B P B A P B P B A P B P A P 。
(16)贝叶斯公式 设事件1 B , 2 B ,„,n B及 A 满足 1°1 B , 2 B ,„,n B两两互不相容,) (Bi P>0, i1,2,„, n , 2°nii B A1 ,0 ) ( A P, 则 njj ji iiB A P B PB A P B PA B P1) / ( ) () / ( ) () / ( ,i=1,2,„n。
此公式即为贝叶斯公式。
) (iB P ,(1 i, 2 ,„, n ),通常叫先验概率。
) / ( A B Pi,(1 i,2 ,„, n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
(17)伯努利概型 我们作了 n 次试验,且满足 每次试验只有两种可能结果, A 发生或 A 不发生;
n 次试验是重复进行的,即 A 发生的概率每次均一样; 每次试验是独立的,即每次试验 A 发生与否与其他次试验 A发生与否是互不影响的。
这种试验称为伯努利概型,或称为 n 重伯努利试验。
用p表示每次试验 A 发生的概率,则 A 发生的概率为q p 1,用) (k P n表示 n 重伯努利试验中 A 出现) 0 ( n k k 次的概率, k n kknn q p k PC ) (,n k , , 2 , 1 , 0 。
第二章随机变量及其分布
(1)离散型随机变量的分布律 设离散型随机变量 X 的可能取值为 X k (k=1,2,„)且取各个值的概率,即事件(X=X k )的概率为 P(X=x k )=p k ,k=1,2,„, 则称上式为离散型随机变量 X 的概率分布或分布律。有时也用分布列的形式给出:
, , , ,, , , ,|) ( 2 12 1kkk p p px x xx X PX。
显然分布律应满足下列条件:
(1)0 k p, , 2 , 1 k,(2)11kk p。
(2)连续型随机变量的分布密度 设) (x F是随机变量 X 的分布函数,若存在非负函数) (x f,对任意实数 x ,有 xdx x f x F ) ( ) (, 则称 X 为连续型随机变量。) (x f称为 X 的概率密度函数或密度函数,简称概率密度。
密度函数具有下面 4 个性质:
1°0 ) ( x f。
2° 1 ) ( dx x f。
(3)离散与连续型随机变量的关系 积分元 dx x f ) ( 在连续型随机变量理论中所起的作用与k k p x X P ) (在离散型随机变量理论中所起的作用相类似。
(4)分布函数 设 X 为随机变量, x 是任意实数,则函数 称为随机变量 X 的分布函数,本质上是一个累积函数。
) ( ) ( ) ( a F b F b X a P 可以得到 X 落入区间 ] , ( b a 的概率。分布函数 ) (x F 表示随机变量落入区间(–∞,x]内的概率。
分布函数具有如下性质:
1° , 1 ) ( 0 x F x ; 2° ) (x F 是单调不减的函数,即 2 1 x x 时,有 ) ( 1 x F ) ( 2 x F ; 3° 0 ) ( lim ) ( x F Fx, 1 ) ( lim ) ( x F Fx; 4° ) ( ) 0 ( x F x F ,即 ) (x F 是右连续的; 5° ) 0 ( ) ( ) ( x F x F x X P 。
对于离散型随机变量,x xkkp x F ) ( ; 对于连续型随机变量, xdx x f x F ) ( ) ( 。
(5)八大分布 0-1 分布 P(X=1)=p,P(X=0)=q 二项分布 在 n 重贝努里试验中,设事件 A 发生的概率为 p 。事件 A发生的次数是随机变量,设为 X ,则 X 可能取值为n , , 2 , 1 , 0 。
k n k knn q p C k P k X P ) ( ) ( ,其中n k p p q , , 2 , 1 , 0 , 1 0 , 1 , 则称随机变量 X 服从参数为 n , p 的二项分布。记为) , ( ~ p n B X 。
当 1 n 时,k k qp k X P 1) ( , 1 . 0 k ,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。
泊松分布 设随机变量 X 的分布律为 ekk X Pk!) ( , 0 , 2 , 1 , 0 k , 则称随机变量 X 服从参数为 的泊松分布,记为) ( ~ X 或者 P( )。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布 随机变量 X 服从参数为 n,N,M 的超几何分布,记为H(n,N,M)。
几何分布 , 3 , 2 , 1 , ) (1 k p q k X Pk,其中 p≥0,q=1-p。
随机变量 X 服从参数为 p 的几何分布,记为 G(p)。
均匀分布 设随机变量 X 的值只落在[a,b]内,其密度函数) (x f在[a,b]上为常数a b 1,即 , 0,1) ( a b x f其他, 则称随机变量 X 在[a,b]上服从均匀分布,记为 X~U(a,b)。
分布函数为 ? xdx x f x F ) ( ) ( 当 a≤x 1 <x 2 ≤b 时,X 落在区间(2 1 ,xx)内的概率为 a bx xx X x P 1 22 1) ( 。
指数分布
? ?其中0 ,则称随机变量 X 服从参数为 的指数分布。
X 的分布函数为
? 记住积分公式:
0,x<a, ,a ba xa≤x≤b 1,x>b。
a≤x≤b ) (x f,xe0 x, 0,0 x, ) (x F, 1xe 0 x, , 0x<0。
正态分布 设随机变量 X 的密度函数为 222) (21) ( xe x f , x, 其中 、0 为常数,则称随机变量 X 服从参数为、 的正态分布或高斯(Gauss)分布,记为) , ( ~2 N X。
) (x f具有如下性质:
1°) (x f的图形是关于 x对称的; 2°当 x时, 21) ( f 为最大值; 若) , ( ~2 N X,则 X 的分布函数为 dt e x Fxt 222) (21) (。。
参数0 、1 时的正态分布称为标准正态分布,记为) 1 , 0 ( ~ N X,其密度函数记为 2221) (xe x, x , 分布函数为 x tdt e x2221) (。
) (x 是不可求积函数,其函数值,已编制成表可供查用。
Φ(-x)=1-Φ(x)且 Φ(0)=21。
如果 X ~ ) , (2 N ,则 X~ ) 1 , 0 ( N 。
1 22 1) (x xx X x P 。
(6)分位数 下分位表:
= ) ( X P ; 上分位表:
= ) ( X P 。
(7)函数分布 离散型 已知 X 的分布列为 ? , , , ,, , , ,) ( 2 12 1nni p p px x xx X PX, ) (X g Y 的分布列( ) (i ix g y 互不相等)如下:
, , , ,), ( , ), ( ), () (2 12 1nnip p px g x g x gy Y PY, 若有某些 ) ( i x g 相等,则应将对应的ip 相加作为 ) ( i x g 的概率。
连续型 先利用 X 的概率密度 f X (x)写出 Y 的分布函数 F Y (y)=P(g(X)≤y),再利用变上下限积分的求导公式求出f Y (y)。
第三章二维随机变量及其分布 (1)联合分布 离散型 如果二维随机向量 (X,Y)的所有可能取值为至多可列个有序对(x,y),则称 为离散型随机量。
设 =(X,Y)的所有可能取值为) , 2 , 1 , )( , ( j i y xj i,且事件{ = ) , (j iy x }的概率为 p ij, ,称 为 =(X,Y)的分布律或称为 X 和 Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:
Y X
y 1
y 2
„ y j
„ x 1
p 11
p 12
„ p 1j
„ x 2
p 21
p 22
„ p 2j
„
x i
p i1
„
„
这里 p ij 具有下面两个性质:
(1)
p ij ≥0(i,j=1,2,„); (2)
. 1 iji jp
连续型 对于二维随机向量 ) , ( Y X ,如果存在非负函数) , )( , ( y x y x f ,使对任意一个其邻边分别平行于坐标轴的矩形区域 D,即D={(X,Y)|a<x<b,c<y<d}有 则称 为连续型随机向量;并称 f(x,y)为 =(X,Y)的分布密度或称为 X 和 Y 的联合分布密度。
分布密度 f(x,y)具有下面两个性质:
(1)
f(x,y)≥0; (2)
. 1 ) , ( dxdy y x f
(2)二维随机变量的本质
(3)联合分布函数 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 称为二维随机向量(X,Y)的分布函数,或称为随机变量 X 和 Y 的联合分布函数。
分布函数是一个以全平面为其定义域,以事件} ) ( , ) ( | ) , {(2 1 2 1y Y x X 的概率为函数值的一个实值函数。分布函数 F(x,y)具有以下的基本性质:
(1)
; 1 ) , ( 0 y x F
(2)F(x,y)分别对 x 和 y 是非减的,即 当 x 2 >x 1 时,有 F(x 2 ,y)≥F(x 1 ,y);当 y 2 >y 1 时,有 F(x,y 2 )≥F(x,y 1 ); (3)F(x,y)分别对 x 和 y 是右连续的,即 (4)
. 1 ) , ( , 0 ) , ( ) , ( ) , ( F x F y F F
(5)对于 , ,2 1 2 1y y x x
0 ) ( ) ( ) ( ) (1 1 2 1 1 2 2 2 y x F y x F y x F y x F , , , , . (4)离散型与连续型的关系
(5)边缘分布 离散型 X 的边缘分布为 ) , 2 , 1 , ( ) ( j i p x X P Pijji i; Y 的边缘分布为 ) , 2 , 1 , ( ) ( j i p y Y P Pijij j。
连续型 X 的边缘分布密度为 Y 的边缘分布密度为 (6)条件分布 离散型 在已知 X=x i 的条件下,Y 取值的条件分布为 在已知 Y=y j 的条件下,X 取值的条件分布为 连续型 在已知 Y=y 的条件下,X 的条件分布密度为 ) () , () | (y fy x fy x fY ; 在已知 X=x 的条件下,Y 的条件分布密度为 (7)独立性 一般型 F(X,Y)=F X (x)F Y (y) 离散型 有零不独立 连续型 f(x,y)=f X (x)f Y (y) 直接判断,充要条件:
①可分离变量 ②正概率密度区间为矩形 二维正态分布 =0
随机变量的函数 若 X 1 ,X 2 ,„X m ,X m+1 ,„X n 相互独立,h,g 为连续函数,则:
h(X 1 ,X 2 ,„X m )和 g(X m+1 ,„X n )相互独立。
特例:若 X 与 Y 独立,则:h(X)和 g(Y)独立。
例如:若 X 与 Y 独立,则:3X+1 和 5Y-2 独立。
(8)二维均匀分布 设随机向量(X,Y)的分布密度函数为 其中 S D 为区域 D 的面积,则称(X,Y)服从 D 上的均匀分布,记为(X,Y)~U(D)。
例如图 3.1、图 3.2 和图 3.3。
y 1 D 1
O 1
x 图 3.1 y 1 O
2 x 图 3.2 y d c Oabx 图 3.3 (9)二维正态分布 设随机向量(X,Y)的分布密度函数为 其中 1 | | , 0 , 0 ,2 1 , 2 1 是 5 个参数,则称(X,Y)服从二维正态分布, 记为(X,Y)~N( ). , , ,2221 , 2 1
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即 X~N( ). ( ~ ), ,22 , 221 1 N Y
但是若 X~N( ) ( ~ ), ,22 , 221 1 N Y ,(X,Y)未必是二维正态分布。
(10)函数分布 Z=X+Y 根据定义计算:
) ( ) ( ) ( z Y X P z Z P z F Z
对于连续型,f Z (z)= dx x z x f ) , (
两个独立的正态分布的和仍为正态分布(2221 2 1, )。
n个相互独立的正态分布的线性组合,仍服从正态分布。
ii iC ,ii iC2 2 2
D 2
1 D 3
Z=max,min(X 1 ,X 2 ,„X n ) 若nX X X 2 1 ,相互独立,其分布函数分别为) ( ) ( ) (2 1x F x F x Fnx x x , ,则 Z=max,min(X 1 ,X 2 ,„X n )的分布函数为:
2 分布 设 n 个随机变量nX X X , , ,2 1 相互独立,且服从标准正态分布,可以证明它们的平方和 的分布密度为 我们称随机变量 W 服从自由度为 n 的2 分布,记为 W~) (2n ,其中 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
2 分布满足可加性:设 则 t 分布 设 X,Y 是两个相互独立的随机变量,且 可以证明函数 的概率密度为 我们称随机变量 T 服从自由度为 n 的 t 分布,记为 T~t(n)。
F 分布 设 ) ( ~ ), ( ~2212n Y n X ,且 X 与 Y 独立,可以证明21//n Yn XF 的概率密度函数为 我们称随机变量 F 服从第一个自由度为 n 1 ,第二个自由度为 n 2 的 F 分布,记为 F~f(n 1 ,n 2 ). 第四章随机变量的数字特征
(1)一维随机变量的数字特征
离散型 连续型 期望 期望就是平均值 设 X 是离散型随机变量,其分布律为 P(kx X )=p k ,k=1,2,„,n, (要求绝对收敛)
设 X 是连续型随机变量,其概率密度为 f(x), (要求绝对收敛)
函数的期望 Y=g(X) Y=g(X) 方差 D(X)=E[X-E(X)]2 , 标准差 ) ( ) ( X D X ,
矩 ①对于正整数 k,称随机变量 X 的 k 次幂的数学期望为X 的 k 阶原点矩,记为 v k ,即 νk =E(Xk )= iikip x ,k=1,2,„. ②对于正整数 k,称随机变量 X 与 E(X)差的 k 次幂的数学期望为X的k阶中心矩,记为k ,即 = iikip X E x )) ( ( ,k=1,2,„. ①对于正整数 k,称随机变量X的k次幂的数学期望为X的k 阶原点矩,记为 v k ,即 ν k =E(Xk )= , ) ( dx x f x k
k=1,2,„. ②对于正整数 k,称随机变量X 与 E(X)差的 k 次幂的数学期望为 X 的 k 阶中心矩,记为k ,即 = , ) ( )) ( ( dx x f X E xk k=1,2,„. 切比雪夫不等式 设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ2 ,则对于任意正数ε,有下列切比雪夫不等式 切比雪夫不等式给出了在未知 X 的分布的情况下,对概率 的一种估计,它在理论上有重要意义。
(2)期望的性质 (1)
E(C)=C (2)
E(CX)=CE(X) (3)
E(X+Y)=E(X)+E(Y), ninii i i iX E C X C E1 1) ( ) (
(4)
E(XY)=E(X)E(Y),充分条件:X 和 Y 独立; 充要条件:X 和 Y 不相关。
(3)方差的性质 (1)
D(C)=0;E(C)=C (2)
D(aX)=a2 D(X);E(aX)=aE(X) (3)
D(aX+b)=a2 D(X);E(aX+b)=aE(X)+b (4)
D(X)=E(X2 )-E 2 (X) (5)
D(X±Y)=D(X)+D(Y),充分条件:X 和 Y 独立; 充要条件:X 和 Y 不相关。
D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))],无条件成立。
而 E(X+Y)=E(X)+E(Y),无条件成立。
(4)常见分布的期望和方差
期望 方差 0-1 分布 ) , 1 ( p B
p
二项分布 ) , ( p n B
np
泊松分布 ) ( P
几何分布 ) (p G
超几何分布) , , ( N M n H
均匀分布 ) , ( b a U
指数分布 ) ( e
正态分布 ) , (2 N
n 2n t 分布 0 2 nn(n>2) (5)二维随机变量的数字特征 期望
函数的期望 )] , ( [ Y X G E = )] , ( [ Y X G E = 方差
协方差 对于随机变量 X 与 Y,称它们的二阶混合中心矩11 为 X 与Y 的协方差或相关矩,记为 ) , cov( Y XXY 或 ,即 与记号XY 相对应,X 与 Y 的方差 D(X)与 D(Y)也可分别记为XX 与YY 。
相关系数 对于随机变量 X 与 Y,如果 D(X)>0,D(Y)>0,则称 为 X 与 Y 的相关系数,记作XY (有时可简记为 )。
| |≤1,当| |=1 时,称 X 与 Y 完全相关:1 ) ( b aY X P
完全相关 , 时 负相关,当, 时 正相关,当) 0 ( 1) 0 ( 1aa 而当 0 时,称 X 与 Y 不相关。
以下五个命题是等价的:
① 0 XY ; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵
混合矩 对于随机变量 X 与 Y,如果有 ) (l k YX E 存在,则称之为 X与 Y 的 k+l 阶混合原点矩,记为kl ; k+l 阶混合中心矩记为:
(6)协方差的性质 (i) cov(X,Y)=cov(Y,X); (ii) cov(aX,bY)=abcov(X,Y); (iii) cov(X 1 +X 2 ,Y)=cov(X 1 ,Y)+cov(X 2 ,Y); (iv) cov(X,Y)=E(XY)-E(X)E(Y). (7)独立和不相关 (i)
若随机变量 X 与 Y 相互独立,则 0 XY ;反之不真。
(ii)
若(X,Y)~N( , , , ,2221 2 1), 则 X 与 Y 相互独立的充要条件是 X 和 Y 不相关。
第五章大数定律和中心极限定理
(1)大数定律 切比雪夫大数定律 设随机变量 X 1 ,X 2 ,„相互独立,均具有有限方差,且被同一常数 C 所界:D( X i )<C(i=1,2,„),则对于任意的正数ε,有
特殊情形:若 X 1 ,X 2 ,„具有相同的数学期望 E(X I )=μ,则上式成为 伯努利大数定律 设μ是 n 次独立试验中事件 A 发生的次数,p 是事件 A 在每次试验中发生的概率,则对于任意的正数ε,有
伯努利大数定律说明,当试验次数 n 很大时,事件A 发生的频率与概率有较大判别的可能性很小,即 这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律 设 X 1 ,X 2 ,„,X n ,„是相互独立同分布的随机变量序列,且 E(X n )=μ,则对于任意的正数ε有 (2)中心极限定理 列维-林德伯格定理 设随机变量 X 1 ,X 2 ,„相互独立,服从同一分布,且具有相同的数学期望和方差:) , 2 , 1 ( 0 ) ( , ) (2 k X D X Ek k ,则随机变量 的分布函数 F n ( x )对任意的实数 x ,有 此定理也称为 独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理 设随机变量nX 为具有参数 n,p(0<p<1)的二项分布,则对于任意实数 x,有 (3)二项定理 若当 ) , ( , 不变 时 k n pNMN ,则 超几何分布的极限分布为二项分布。
(4)泊松定理 若当 0 , np n 时 ,则 其中 k=0,1,2,„,n,„。
二项分布的极限分布为泊松分布。
第六章样本及抽样分布
(1)数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体 总体中的每一个单元称为样品(或个体)。
样本 我们把从总体中抽取的部分样品nx x x , , ,2 1 称为样本。样本中所含的样品数称为样本容量,一般用 n 表示。在一般情况下,总是把样本看成是 n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,nx x x , , ,2 1 表示 n个随机变量(样本);在具体的一次抽取之后,nx x x , , ,2 1 表示 n 个具体的数值(样本值)。我们称之为样本的两重性。
样本函数和统计量 设nx x x , , ,2 1 为总体的一个样本,称
(nx x x , , ,2 1 )
为样本函数,其中 为一个连续函数。如果 中不包含任何未知参数,则称 (nx x x , , ,2 1 )为一个统计量。
常见统计量及其性质 样本均值
.11niixnx
样本方差
niix xnS12 2. ) (11 样本标准差
. ) (1112niix xnS
样本 k 阶原点矩
样本 k 阶中心矩 ) (X E ,nX D2) ( , 2 2 )( S E ,2 21) * ( nnS E , 其中 niiX XnS12 2) (1* ,为二阶中心矩。
(2)正态总体下的四大分布 正态分布 设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 t 分布 设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 其中 t(n-1)表示自由度为 n-1 的 t 分布。
设nx x x , , ,2 1 为来自正态总体 ) , (2 N 的一个样本,则样本函数 其中 ) 1 (2 n 表示自由度为 n-1 的2 分布。
F 分布 设nx x x , , ,2 1 为来自正态总体 ) , (21 N 的一个样本,而ny y y , , ,2 1 为来自正态总体 ) , (22 N 的一个样本,则样本函数 其中 ) 1 , 1 (2 1 n n F 表示第一自由度为 11 n ,第二自由度为12 n 的 F 分布。
(3)正态总体下分布的性质 X 与2S 独立。
极大似然估计 当总体 X 为连续型随机变量时,设其分布密度为) , , , ; (21 mx f ,其中m , , ,21 为未知参数。又设nx x x , , ,21 为总体的一个样本,称 为样本的似然函数,简记为 L n .
当总体 X 为离型随机变量时,设其分布律为) , , , ; ( } {21 mx p x X P ,则称 为样本的似然函数。
若似然函数 ) , , , ; , , , (2 21 1 m nx x x L 在 m , , ,21 处取到最大值,则称 m , , ,21 分别为m , , ,21 的最大似然估计值,相应的统计量称为最大似然估计量。
若 为 的极大似然估计, ) (x g 为单调函数,则 )ˆ( g 为 ) ( g 的极大似然估计。
(2)估计量的评选标准 无偏性 设 ) , , , (2 1 nx x x 为未知参数 的估计量。若 E( )= ,则称 为 的无偏估计量。
E( X )=E(X),E(S2 )=D(X)
有效性 设 ) , , , , (2 11 1nx x x 和 ) , , , , (2 12 2nx x x 是未知参数 的两个无偏估计量。若 ) ( ) (2 1 D D ,则称 2 1 比 有效。
一致性 设 n 是 的一串估计量,如果对于任意的正数 ,都有 则称 n 为 的一致估计量(或相合估计量)。
若 为 的无偏估计,且 ), ( 0 )ˆ( n D 则 为 的一致估计。
只要总体的 E(X)和 D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区间估计 置信区间和置信度 设总体 X 含有一个待估的未知参数 。如果我们从样本nx x x , , , ,2 1 出发,找出两个统计量 ) , , , , (2 1 1 1 nx x x 与) , , , , (2 1 2 2 nx x x ) (2 1 ,使得区间 ] , [2 1 以) 1 0 ( 1 的概率包含这个待估参数 ,即 那么称区间 ] , [2 1 为 的置信区间, 1 为该区间的置信度(或置信水平)。
单正态总体的期望和方差的区间估计 设nx x x , , , ,2 1 为总体 ) , ( ~2 N X 的一个样本,在置信度为 1 下,我们来确定2 和 的置信区间 ] , [2 1 。具体步骤如下:
(i)选择样本函数; (ii)由置信度 1 ,查表找分位数; (iii)导出置信区间 ] , [2 1 。
已知方差,估计均值 (i)选择样本函数 (ii)查表找分位数 (iii)导出置信区间 未知方差,估计均值 (i)选择样本函数
(ii)查表找分位数 (iii)导出置信区间 方差的区间估计 (i)选择样本函数 (ii)查表找分位数
(iii)导出 的置信区间 第八章假设检验
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设 H 0 是否成立。我们先假定 H 0 是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定 H 0是不正确的,我们拒绝接受 H 0 ;如果由此没有导出不合理的现象,则不能拒绝接受 H 0 ,我们称 H 0 是相容的。与 H 0 相对的假设称为备择假设,用 H 1 表示。
这里所说的小概率事件就是事件 } {R K ,其概率就是检验水平α,通常我们取α=0.05,有时也取 0.01 或 0.10。
基本步骤 假设检验的基本步骤如下:
(i) 提出零假设 H 0 ; (ii) 选择统计量 K ; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值nx x x , , ,2 1 计算统计量之值 K ; 将 与K 进行比较,作出判断:当 ) ( | | K K 或 时否定 H 0 ,否则认为 H 0 相容。
两类错误 第一类错误 当 H 0 为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 H 0 。这时,我们把客观上 H 0 成立判为 H 0 为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记 为犯此类错误的概率,即 P{否定 H 0 | H 0 为真}= ; 此处的α恰好为检验水平。
第二类错误 当 H 1 为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H 0 。这时,我们把客观上 H 0 。不成立判为 H 0 成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记 为犯此类错误的概率,即 P{接受 H 0 | H 1 为真}= 。
两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量 n 一定时, 变小,则 变大;相反地, 变小,则 变大。取定 要想使 变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显着性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如 0.01,甚至 0.001。反之,则应把α取得大些。
单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域 已知2
N (0,1)
未知2
未知2