概率论与数理统计公式考试专用

发布时间:2022-07-01 14:05:04   来源:党团工作    点击:   
字号:

 第 第 1 1 章随机事件 及其 概率

 (1)排列组合公式 )! (!n mmPnm 从 m 个人中挑出 n 个人进行排列的可能数。

 )! ( !!n m nmCnm 从 m 个人中挑出 n 个人进行组合的可能数。

 (2)加法和乘法原理 加法原理(两种方法均能完成此事):

 m+n

 某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。

 乘法原理(两个步骤分别不能完成这件事):m m ×n n

 某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 m×n 种方法来完成。

 (3)一些常见排列 重复排列和非重复排列(有序)

 对立事件(至少有一个)

 顺序问题 (4)随机试验和随机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

 试验的可能结果称为随机事件。

 (5)基本事件、样本空间和事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:

 ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。

 这样一组事件中的每一个事件称为基本事件,用  来表示。

 基本事件的全体,称为试验的样本空间,用  表示。

 一个事件就是由  中的部分点(基本事件  )组成的集合。通常用大写字母 A,B,C, „表示事件,它们是  的子集。

  为必然事件,?为不可能事件。

 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为 1,而概率为 1 的事件也不一定是必然事件。

 (6)事件的关系与运算 ①关系:

 如果事件 A 的组成部分也是事件 B 的组成部分,( A 发生必有事件B 发生):

 B A 

 如果同时有 B A  , A B  ,则称事件 A 与事件 B 等价,或称 A等于 B :

 A=B 。

 A、B 中至少有一个发生的事件:

 A  B ,或者 A + B 。

 属于 A 而不属于 B 的部分所构成的事件,称为 A 与 B 的差,记为A-B ,也可表示为 A-AB 或者 B A ,它表示 A 发生而 B 不发生的事件。

 A、B 同时发生:

 A  B ,或者 AB 。A  B=?,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。

  -A 称为事件 A 的逆事件,或称 A 的对立事件,记为 A 。它表示A 不发生的事件。互斥未必对立。

 ②运算:

 结合率:A(BC)=(AB)CA∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C)(A∪B)∩C=(AC)∪(BC) 德摩根率: 1 1 iiii A AB A B A    , B A B A   

 (7)概率的公理化定义 设  为样本空间, A 为事件,对每一个事件 A 都有一个实数P(A),若满足下列三个条件:

 1°0≤P(A)≤1, 2°P(Ω)=1 3°对于两两互不相容的事件1 A , 2 A ,„有 常称为可列(完全)可加性。

 则称 P(A)为事件 A 的概率。

 (8)古典概型 1°  n   2 1 ,  , 2°nP P Pn1) ( ) ( ) (2 1       。

 设任一事件 A ,它是由m   2 1 ,组成的,则有 P(A) =   ) ( ) ( ) (2 1 m       = ) ( ) ( ) (2 1 mP P P       

 (9)几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 A, ) () () (LA LA P 。其中 L 为几何度量(长度、面积、体积)。

 (10)加法公式 P(A+B)=P(A)+P(B)-P(AB) 当 P(AB)=0 时,P(A+B)=P(A)+P(B) (11)减法公式 P(A-B)=P(A)-P(AB) 当 B  A 时,P(A-B)=P(A)-P(B) 当 A=Ω时,P( B )=1-P(B) (12)条件概率 定义设 A、B 是两个事件,且 P(A)>0,则称) () (A PAB P为事件 A 发生条件下,事件 B 发生的条件概率,记为  ) / ( A B P) () (A PAB P。

 条件概率是概率的一种,所有概率的性质都适合于条件概率。

 例如 P(Ω/B)=1  P( B /A)=1-P(B/A) (13)乘 乘法公式:

 ) / ( ) ( ) ( A B P A P AB P 

 法公式 更一般地,对事件 A 1 ,A 2 ,„A n ,若 P(A 1 A 2 „A n-1 )>0,则有 2 1 ( A A P„) n A ) | ( ) | ( ) ( 2 1 3 1 2 1 A A A P A A P A P „„2 1 | ( A A A P n„) 1  n A。

 (14)独立性 ①两个事件的独立性

 设事件 A 、 B 满足) ( ) ( ) ( B P A P AB P ,则称事件 A 、 B 是相互独立的。

 若事件 A 、 B 相互独立,且0 ) (  A P,则有 若事件 A 、 B 相互独立,则可得到 A 与 B 、 A 与 B 、 A 与 B 也都相互独立。

 必然事件  和不可能事件?与任何事件都相互独立。

 ?与任何事件都互斥。

 ②多个事件的独立性

 设 ABC 是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足 P(ABC)=P(A)P(B)P(C) 那么 A、B、C 相互独立。

 对于 n 个事件类似。

 (15)全概公式 设事件n B B B , , , 2 1 满足 1°n B B B , , , 2 1 两两互不相容,) , , 2 , 1 ( 0 ) ( n i B P i   , 2°nii B A1 , 则有 ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( 2 2 1 1 n n B A P B P B A P B P B A P B P A P     。

 (16)贝叶斯公式 设事件1 B , 2 B ,„,n B及 A 满足 1°1 B , 2 B ,„,n B两两互不相容,) (Bi P>0, i1,2,„, n , 2°nii B A1 ,0 ) (  A P, 则 njj ji iiB A P B PB A P B PA B P1) / ( ) () / ( ) () / ( ,i=1,2,„n。

 此公式即为贝叶斯公式。

 ) (iB P ,(1  i, 2 ,„, n ),通常叫先验概率。

 ) / ( A B Pi,(1  i,2 ,„, n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。

 (17)伯努利概型 我们作了 n 次试验,且满足  每次试验只有两种可能结果, A 发生或 A 不发生;

  n 次试验是重复进行的,即 A 发生的概率每次均一样;  每次试验是独立的,即每次试验 A 发生与否与其他次试验 A发生与否是互不影响的。

 这种试验称为伯努利概型,或称为 n 重伯努利试验。

 用p表示每次试验 A 发生的概率,则 A 发生的概率为q p   1,用) (k P n表示 n 重伯努利试验中 A 出现) 0 ( n k k  次的概率, k n kknn q p k PC ) (,n k , , 2 , 1 , 0  。

 第二章随机变量及其分布

 (1)离散型随机变量的分布律 设离散型随机变量 X 的可能取值为 X k (k=1,2,„)且取各个值的概率,即事件(X=X k )的概率为 P(X=x k )=p k ,k=1,2,„, 则称上式为离散型随机变量 X 的概率分布或分布律。有时也用分布列的形式给出:

   , , , ,, , , ,|) ( 2 12 1kkk p p px x xx X PX。

 显然分布律应满足下列条件:

 (1)0  k p, , 2 , 1  k,(2)11kk p。

 (2)连续型随机变量的分布密度 设) (x F是随机变量 X 的分布函数,若存在非负函数) (x f,对任意实数 x ,有  xdx x f x F ) ( ) (, 则称 X 为连续型随机变量。) (x f称为 X 的概率密度函数或密度函数,简称概率密度。

 密度函数具有下面 4 个性质:

 1°0 ) (  x f。

 2°  1 ) ( dx x f。

 (3)离散与连续型随机变量的关系 积分元 dx x f ) ( 在连续型随机变量理论中所起的作用与k k p x X P   ) (在离散型随机变量理论中所起的作用相类似。

 (4)分布函数 设 X 为随机变量, x 是任意实数,则函数 称为随机变量 X 的分布函数,本质上是一个累积函数。

 ) ( ) ( ) ( a F b F b X a P     可以得到 X 落入区间 ] , ( b a 的概率。分布函数 ) (x F 表示随机变量落入区间(–∞,x]内的概率。

 分布函数具有如下性质:

 1° , 1 ) ( 0   x F      x ; 2° ) (x F 是单调不减的函数,即 2 1 x x  时,有  ) ( 1 x F ) ( 2 x F ; 3° 0 ) ( lim ) (    x F Fx, 1 ) ( lim ) (    x F Fx; 4° ) ( ) 0 ( x F x F   ,即 ) (x F 是右连续的; 5° ) 0 ( ) ( ) (     x F x F x X P 。

 对于离散型随机变量,x xkkp x F ) ( ; 对于连续型随机变量, xdx x f x F ) ( ) ( 。

 (5)八大分布 0-1 分布 P(X=1)=p,P(X=0)=q 二项分布 在 n 重贝努里试验中,设事件 A 发生的概率为 p 。事件 A发生的次数是随机变量,设为 X ,则 X 可能取值为n , , 2 , 1 , 0  。

 k n k knn q p C k P k X P   ) ( ) ( ,其中n k p p q , , 2 , 1 , 0 , 1 0 , 1       , 则称随机变量 X 服从参数为 n , p 的二项分布。记为) , ( ~ p n B X 。

 当 1  n 时,k k qp k X P 1) ( , 1 . 0  k ,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。

 泊松分布 设随机变量 X 的分布律为   ekk X Pk!) ( , 0   ,  2 , 1 , 0  k , 则称随机变量 X 服从参数为  的泊松分布,记为) ( ~   X 或者 P(  )。

 泊松分布为二项分布的极限分布(np=λ,n→∞)。

 超几何分布 随机变量 X 服从参数为 n,N,M 的超几何分布,记为H(n,N,M)。

 几何分布  , 3 , 2 , 1 , ) (1  k p q k X Pk,其中 p≥0,q=1-p。

 随机变量 X 服从参数为 p 的几何分布,记为 G(p)。

 均匀分布 设随机变量 X 的值只落在[a,b]内,其密度函数) (x f在[a,b]上为常数a b 1,即  , 0,1) ( a b x f其他, 则称随机变量 X 在[a,b]上服从均匀分布,记为 X~U(a,b)。

 分布函数为 ?   xdx x f x F ) ( ) ( 当 a≤x 1 <x 2 ≤b 时,X 落在区间(2 1 ,xx)内的概率为 a bx xx X x P  1 22 1) ( 。

 指数分布

 ? ?其中0  ,则称随机变量 X 服从参数为  的指数分布。

 X 的分布函数为

 ? 记住积分公式:

 0,x<a, ,a ba xa≤x≤b 1,x>b。

 a≤x≤b  ) (x f,xe0  x, 0,0  x,  ) (x F, 1xe 0  x, , 0x<0。

 正态分布 设随机变量 X 的密度函数为 222) (21) ( xe x f ,     x, 其中  、0  为常数,则称随机变量 X 服从参数为、  的正态分布或高斯(Gauss)分布,记为) , ( ~2  N X。

 ) (x f具有如下性质:

 1°) (x f的图形是关于  x对称的; 2°当  x时, 21) (  f 为最大值; 若) , ( ~2  N X,则 X 的分布函数为 dt e x Fxt 222) (21) (。。

 参数0  、1  时的正态分布称为标准正态分布,记为) 1 , 0 ( ~ N X,其密度函数记为 2221) (xe x,      x , 分布函数为   x tdt e x2221) (。

 ) (x 是不可求积函数,其函数值,已编制成表可供查用。

 Φ(-x)=1-Φ(x)且 Φ(0)=21。

 如果 X ~ ) , (2  N ,则  X~ ) 1 , 0 ( N 。

        1 22 1) (x xx X x P 。

 (6)分位数 下分位表:

    = ) (  X P ; 上分位表:

    = ) (  X P 。

 (7)函数分布 离散型 已知 X 的分布列为 ?  , , , ,, , , ,) ( 2 12 1nni p p px x xx X PX, ) (X g Y  的分布列( ) (i ix g y  互不相等)如下:

   , , , ,), ( , ), ( ), () (2 12 1nnip p px g x g x gy Y PY, 若有某些 ) ( i x g 相等,则应将对应的ip 相加作为 ) ( i x g 的概率。

 连续型 先利用 X 的概率密度 f X (x)写出 Y 的分布函数 F Y (y)=P(g(X)≤y),再利用变上下限积分的求导公式求出f Y (y)。

 第三章二维随机变量及其分布 (1)联合分布 离散型 如果二维随机向量  (X,Y)的所有可能取值为至多可列个有序对(x,y),则称  为离散型随机量。

 设  =(X,Y)的所有可能取值为) , 2 , 1 , )( , (   j i y xj i,且事件{  = ) , (j iy x }的概率为 p ij, ,称 为  =(X,Y)的分布律或称为 X 和 Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:

 Y X

 y 1

 y 2

 „ y j

 „ x 1

 p 11

 p 12

 „ p 1j

 „ x 2

 p 21

 p 22

 „ p 2j

 „

  x i

 p i1

  „

 „

  这里 p ij 具有下面两个性质:

 (1)

 p ij ≥0(i,j=1,2,„); (2)

 . 1  iji jp

 连续型 对于二维随机向量 ) , ( Y X   ,如果存在非负函数) , )( , (         y x y x f ,使对任意一个其邻边分别平行于坐标轴的矩形区域 D,即D={(X,Y)|a<x<b,c<y<d}有 则称  为连续型随机向量;并称 f(x,y)为  =(X,Y)的分布密度或称为 X 和 Y 的联合分布密度。

 分布密度 f(x,y)具有下面两个性质:

 (1)

 f(x,y)≥0; (2)

     . 1 ) , ( dxdy y x f

 (2)二维随机变量的本质

 (3)联合分布函数 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 称为二维随机向量(X,Y)的分布函数,或称为随机变量 X 和 Y 的联合分布函数。

 分布函数是一个以全平面为其定义域,以事件} ) ( , ) ( | ) , {(2 1 2 1y Y x X           的概率为函数值的一个实值函数。分布函数 F(x,y)具有以下的基本性质:

 (1)

 ; 1 ) , ( 0   y x F

 (2)F(x,y)分别对 x 和 y 是非减的,即 当 x 2 >x 1 时,有 F(x 2 ,y)≥F(x 1 ,y);当 y 2 >y 1 时,有 F(x,y 2 )≥F(x,y 1 ); (3)F(x,y)分别对 x 和 y 是右连续的,即 (4)

 . 1 ) , ( , 0 ) , ( ) , ( ) , (           F x F y F F

 (5)对于 , ,2 1 2 1y y x x  

 0 ) ( ) ( ) ( ) (1 1 2 1 1 2 2 2    y x F y x F y x F y x F , , , , . (4)离散型与连续型的关系

 (5)边缘分布 离散型 X 的边缘分布为 ) , 2 , 1 , ( ) (      j i p x X P Pijji i; Y 的边缘分布为 ) , 2 , 1 , ( ) (      j i p y Y P Pijij j。

 连续型 X 的边缘分布密度为 Y 的边缘分布密度为 (6)条件分布 离散型 在已知 X=x i 的条件下,Y 取值的条件分布为 在已知 Y=y j 的条件下,X 取值的条件分布为 连续型 在已知 Y=y 的条件下,X 的条件分布密度为 ) () , () | (y fy x fy x fY ; 在已知 X=x 的条件下,Y 的条件分布密度为 (7)独立性 一般型 F(X,Y)=F X (x)F Y (y) 离散型 有零不独立 连续型 f(x,y)=f X (x)f Y (y) 直接判断,充要条件:

 ①可分离变量 ②正概率密度区间为矩形 二维正态分布  =0

 随机变量的函数 若 X 1 ,X 2 ,„X m ,X m+1 ,„X n 相互独立,h,g 为连续函数,则:

 h(X 1 ,X 2 ,„X m )和 g(X m+1 ,„X n )相互独立。

 特例:若 X 与 Y 独立,则:h(X)和 g(Y)独立。

 例如:若 X 与 Y 独立,则:3X+1 和 5Y-2 独立。

 (8)二维均匀分布 设随机向量(X,Y)的分布密度函数为 其中 S D 为区域 D 的面积,则称(X,Y)服从 D 上的均匀分布,记为(X,Y)~U(D)。

 例如图 3.1、图 3.2 和图 3.3。

 y 1 D 1

 O 1

 x 图 3.1 y 1 O

  2 x 图 3.2 y d c Oabx 图 3.3 (9)二维正态分布 设随机向量(X,Y)的分布密度函数为 其中 1 | | , 0 , 0 ,2 1 , 2 1        是 5 个参数,则称(X,Y)服从二维正态分布, 记为(X,Y)~N( ). , , ,2221 , 2 1    

 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布, 即 X~N( ). ( ~ ), ,22 , 221 1    N Y

 但是若 X~N( ) ( ~ ), ,22 , 221 1    N Y ,(X,Y)未必是二维正态分布。

 (10)函数分布 Z=X+Y 根据定义计算:

 ) ( ) ( ) ( z Y X P z Z P z F Z     

 对于连续型,f Z (z)= dx x z x f  ) , (

 两个独立的正态分布的和仍为正态分布(2221 2 1,       )。

 n个相互独立的正态分布的线性组合,仍服从正态分布。

 ii iC   ,ii iC2 2 2 

 D 2

 1 D 3

 Z=max,min(X 1 ,X 2 ,„X n ) 若nX X X 2 1 ,相互独立,其分布函数分别为) ( ) ( ) (2 1x F x F x Fnx x x , ,则 Z=max,min(X 1 ,X 2 ,„X n )的分布函数为:

 2 分布 设 n 个随机变量nX X X , , ,2 1 相互独立,且服从标准正态分布,可以证明它们的平方和 的分布密度为 我们称随机变量 W 服从自由度为 n 的2 分布,记为 W~) (2n  ,其中 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。

 2 分布满足可加性:设 则 t 分布 设 X,Y 是两个相互独立的随机变量,且 可以证明函数 的概率密度为 我们称随机变量 T 服从自由度为 n 的 t 分布,记为 T~t(n)。

 F 分布 设 ) ( ~ ), ( ~2212n Y n X   ,且 X 与 Y 独立,可以证明21//n Yn XF  的概率密度函数为 我们称随机变量 F 服从第一个自由度为 n 1 ,第二个自由度为 n 2 的 F 分布,记为 F~f(n 1 ,n 2 ). 第四章随机变量的数字特征

 (1)一维随机变量的数字特征

 离散型 连续型 期望 期望就是平均值 设 X 是离散型随机变量,其分布律为 P(kx X  )=p k ,k=1,2,„,n, (要求绝对收敛)

 设 X 是连续型随机变量,其概率密度为 f(x), (要求绝对收敛)

 函数的期望 Y=g(X) Y=g(X) 方差 D(X)=E[X-E(X)]2 , 标准差 ) ( ) ( X D X   ,

 矩 ①对于正整数 k,称随机变量 X 的 k 次幂的数学期望为X 的 k 阶原点矩,记为 v k ,即 νk =E(Xk )= iikip x ,k=1,2,„. ②对于正整数 k,称随机变量 X 与 E(X)差的 k 次幂的数学期望为X的k阶中心矩,记为k ,即 =  iikip X E x )) ( ( ,k=1,2,„. ①对于正整数 k,称随机变量X的k次幂的数学期望为X的k 阶原点矩,记为 v k ,即 ν k =E(Xk )= , ) ( dx x f x k

 k=1,2,„. ②对于正整数 k,称随机变量X 与 E(X)差的 k 次幂的数学期望为 X 的 k 阶中心矩,记为k ,即 =   , ) ( )) ( ( dx x f X E xk k=1,2,„. 切比雪夫不等式 设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ2 ,则对于任意正数ε,有下列切比雪夫不等式 切比雪夫不等式给出了在未知 X 的分布的情况下,对概率 的一种估计,它在理论上有重要意义。

 (2)期望的性质 (1)

 E(C)=C (2)

 E(CX)=CE(X) (3)

 E(X+Y)=E(X)+E(Y),  ninii i i iX E C X C E1 1) ( ) (

 (4)

 E(XY)=E(X)E(Y),充分条件:X 和 Y 独立; 充要条件:X 和 Y 不相关。

 (3)方差的性质 (1)

 D(C)=0;E(C)=C (2)

 D(aX)=a2 D(X);E(aX)=aE(X) (3)

 D(aX+b)=a2 D(X);E(aX+b)=aE(X)+b (4)

 D(X)=E(X2 )-E 2 (X) (5)

 D(X±Y)=D(X)+D(Y),充分条件:X 和 Y 独立; 充要条件:X 和 Y 不相关。

 D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))],无条件成立。

 而 E(X+Y)=E(X)+E(Y),无条件成立。

 (4)常见分布的期望和方差

 期望 方差 0-1 分布 ) , 1 ( p B

 p

 二项分布 ) , ( p n B

 np

 泊松分布 ) (  P

 几何分布 ) (p G

 超几何分布) , , ( N M n H

 均匀分布 ) , ( b a U

 指数分布 ) (  e

 正态分布 ) , (2  N

  n 2n t 分布 0 2  nn(n>2) (5)二维随机变量的数字特征 期望

  函数的期望 )] , ( [ Y X G E = )] , ( [ Y X G E = 方差

  协方差 对于随机变量 X 与 Y,称它们的二阶混合中心矩11 为 X 与Y 的协方差或相关矩,记为 ) , cov( Y XXY 或 ,即 与记号XY 相对应,X 与 Y 的方差 D(X)与 D(Y)也可分别记为XX 与YY 。

 相关系数 对于随机变量 X 与 Y,如果 D(X)>0,D(Y)>0,则称 为 X 与 Y 的相关系数,记作XY (有时可简记为  )。

 |  |≤1,当|  |=1 时,称 X 与 Y 完全相关:1 ) (    b aY X P

 完全相关   , 时 负相关,当, 时 正相关,当) 0 ( 1) 0 ( 1aa 而当 0   时,称 X 与 Y 不相关。

 以下五个命题是等价的:

 ① 0 XY ; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵

 混合矩 对于随机变量 X 与 Y,如果有 ) (l k YX E 存在,则称之为 X与 Y 的 k+l 阶混合原点矩,记为kl ; k+l 阶混合中心矩记为:

 (6)协方差的性质 (i) cov(X,Y)=cov(Y,X); (ii) cov(aX,bY)=abcov(X,Y); (iii) cov(X 1 +X 2 ,Y)=cov(X 1 ,Y)+cov(X 2 ,Y); (iv) cov(X,Y)=E(XY)-E(X)E(Y). (7)独立和不相关 (i)

 若随机变量 X 与 Y 相互独立,则 0 XY ;反之不真。

 (ii)

 若(X,Y)~N(      , , , ,2221 2 1), 则 X 与 Y 相互独立的充要条件是 X 和 Y 不相关。

 第五章大数定律和中心极限定理

 (1)大数定律 切比雪夫大数定律 设随机变量 X 1 ,X 2 ,„相互独立,均具有有限方差,且被同一常数 C 所界:D( X i )<C(i=1,2,„),则对于任意的正数ε,有

 特殊情形:若 X 1 ,X 2 ,„具有相同的数学期望 E(X I )=μ,则上式成为 伯努利大数定律 设μ是 n 次独立试验中事件 A 发生的次数,p 是事件 A 在每次试验中发生的概率,则对于任意的正数ε,有

 伯努利大数定律说明,当试验次数 n 很大时,事件A 发生的频率与概率有较大判别的可能性很小,即 这就以严格的数学形式描述了频率的稳定性。

 辛钦大数定律 设 X 1 ,X 2 ,„,X n ,„是相互独立同分布的随机变量序列,且 E(X n )=μ,则对于任意的正数ε有 (2)中心极限定理 列维-林德伯格定理 设随机变量 X 1 ,X 2 ,„相互独立,服从同一分布,且具有相同的数学期望和方差:) , 2 , 1 ( 0 ) ( , ) (2     k X D X Ek k  ,则随机变量 的分布函数 F n ( x )对任意的实数 x ,有 此定理也称为 独立同分布的中心极限定理。

 棣莫弗-拉普拉斯定理 设随机变量nX 为具有参数 n,p(0<p<1)的二项分布,则对于任意实数 x,有 (3)二项定理 若当 ) , ( , 不变 时 k n pNMN    ,则 超几何分布的极限分布为二项分布。

 (4)泊松定理 若当 0 ,      np n 时 ,则 其中 k=0,1,2,„,n,„。

 二项分布的极限分布为泊松分布。

 第六章样本及抽样分布

 (1)数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。

 个体 总体中的每一个单元称为样品(或个体)。

 样本 我们把从总体中抽取的部分样品nx x x , , ,2 1 称为样本。样本中所含的样品数称为样本容量,一般用 n 表示。在一般情况下,总是把样本看成是 n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,nx x x , , ,2 1 表示 n个随机变量(样本);在具体的一次抽取之后,nx x x , , ,2 1 表示 n 个具体的数值(样本值)。我们称之为样本的两重性。

 样本函数和统计量 设nx x x , , ,2 1 为总体的一个样本,称   

 (nx x x , , ,2 1 )

 为样本函数,其中  为一个连续函数。如果  中不包含任何未知参数,则称  (nx x x , , ,2 1 )为一个统计量。

 常见统计量及其性质 样本均值

 .11niixnx

 样本方差

 niix xnS12 2. ) (11 样本标准差

  . ) (1112niix xnS

 样本 k 阶原点矩

 样本 k 阶中心矩   ) (X E ,nX D2) ( , 2 2 )(   S E ,2 21) * ( nnS E , 其中 niiX XnS12 2) (1* ,为二阶中心矩。

 (2)正态总体下的四大分布 正态分布 设nx x x , , ,2 1 为来自正态总体 ) , (2  N 的一个样本,则样本函数 t 分布 设nx x x , , ,2 1 为来自正态总体 ) , (2  N 的一个样本,则样本函数 其中 t(n-1)表示自由度为 n-1 的 t 分布。

 设nx x x , , ,2 1 为来自正态总体 ) , (2  N 的一个样本,则样本函数 其中 ) 1 (2 n  表示自由度为 n-1 的2 分布。

 F 分布 设nx x x , , ,2 1 为来自正态总体 ) , (21  N 的一个样本,而ny y y , , ,2 1 为来自正态总体 ) , (22  N 的一个样本,则样本函数 其中 ) 1 , 1 (2 1  n n F 表示第一自由度为 11 n ,第二自由度为12 n 的 F 分布。

 (3)正态总体下分布的性质 X 与2S 独立。

  极大似然估计 当总体 X 为连续型随机变量时,设其分布密度为) , , , ; (21 mx f     ,其中m   , , ,21 为未知参数。又设nx x x , , ,21 为总体的一个样本,称 为样本的似然函数,简记为 L n .

  当总体 X 为离型随机变量时,设其分布律为) , , , ; ( } {21 mx p x X P       ,则称 为样本的似然函数。

 若似然函数 ) , , , ; , , , (2 21 1 m nx x x L      在 m     , , ,21  处取到最大值,则称 m     , , ,21  分别为m   , , ,21 的最大似然估计值,相应的统计量称为最大似然估计量。

 若 为  的极大似然估计, ) (x g 为单调函数,则 )ˆ(  g 为 ) (  g 的极大似然估计。

 (2)估计量的评选标准 无偏性 设 ) , , , (2 1 nx x x     为未知参数  的估计量。若 E( )=  ,则称 为  的无偏估计量。

 E( X )=E(X),E(S2 )=D(X)

 有效性 设 ) , , , , (2 11 1nx x x     和 ) , , , , (2 12 2nx x x     是未知参数 的两个无偏估计量。若 ) ( ) (2 1    D D ,则称 2 1   比 有效。

 一致性 设 n 是  的一串估计量,如果对于任意的正数  ,都有 则称 n 为  的一致估计量(或相合估计量)。

 若 为  的无偏估计,且 ), ( 0 )ˆ(    n D  则 为  的一致估计。

 只要总体的 E(X)和 D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。

 (3)区间估计 置信区间和置信度 设总体 X 含有一个待估的未知参数  。如果我们从样本nx x x , , , ,2 1 出发,找出两个统计量 ) , , , , (2 1 1 1 nx x x     与) , , , , (2 1 2 2 nx x x     ) (2 1   ,使得区间 ] , [2 1  以) 1 0 ( 1      的概率包含这个待估参数  ,即 那么称区间 ] , [2 1  为  的置信区间,   1 为该区间的置信度(或置信水平)。

 单正态总体的期望和方差的区间估计 设nx x x , , , ,2 1 为总体 ) , ( ~2  N X 的一个样本,在置信度为  1 下,我们来确定2  和 的置信区间 ] , [2 1  。具体步骤如下:

 (i)选择样本函数; (ii)由置信度   1 ,查表找分位数; (iii)导出置信区间 ] , [2 1  。

 已知方差,估计均值 (i)选择样本函数 (ii)查表找分位数 (iii)导出置信区间 未知方差,估计均值 (i)选择样本函数

 (ii)查表找分位数 (iii)导出置信区间 方差的区间估计 (i)选择样本函数 (ii)查表找分位数

 (iii)导出  的置信区间 第八章假设检验

 基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。

 为了检验一个假设 H 0 是否成立。我们先假定 H 0 是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定 H 0是不正确的,我们拒绝接受 H 0 ;如果由此没有导出不合理的现象,则不能拒绝接受 H 0 ,我们称 H 0 是相容的。与 H 0 相对的假设称为备择假设,用 H 1 表示。

 这里所说的小概率事件就是事件 } {R K ,其概率就是检验水平α,通常我们取α=0.05,有时也取 0.01 或 0.10。

 基本步骤 假设检验的基本步骤如下:

 (i) 提出零假设 H 0 ; (ii) 选择统计量 K ; (iii) 对于检验水平α查表找分位数λ; (iv) 由样本值nx x x , , ,2 1 计算统计量之值 K ; 将  与K 进行比较,作出判断:当 ) ( | |     K K 或 时否定 H 0 ,否则认为 H 0 相容。

 两类错误 第一类错误 当 H 0 为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 H 0 。这时,我们把客观上 H 0 成立判为 H 0 为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记  为犯此类错误的概率,即 P{否定 H 0 | H 0 为真}=  ; 此处的α恰好为检验水平。

 第二类错误 当 H 1 为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H 0 。这时,我们把客观上 H 0 。不成立判为 H 0 成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记  为犯此类错误的概率,即 P{接受 H 0 | H 1 为真}=  。

 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量 n 一定时,  变小,则  变大;相反地, 变小,则  变大。取定  要想使  变小,则必须增加样本容量。

 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显着性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如 0.01,甚至 0.001。反之,则应把α取得大些。

 单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域 已知2

 N (0,1)

 未知2

 未知2