type
status
date
slug
summary
tags
category
icon
password
概率论与数理统计知识点汇总
本文分五个部分(概率论的基本概念、随机变量及其分布、多维随机变量及其分布、随机变量的数字特征、样本及其抽样分布)知识点进行总结,考研版本后续更新…
由于临近期末,自身也要复习这门课程,在网上的文章质量参差不齐,有些甚至是远古版本转载,都糊成马赛克了(难绷,我整理了如下知识点,可以按顺序学习。
一、概率论的基本概念
1.随机试验
随机试验很好理解,有可重复性,可辨性,随机性这三点就是一个随机试验,
可重复性:可以重复的进行一项试验(必须是相同条件,如果不同条件下随机试验就没有意义了)
可辨性:知道结果有几种,事先知道一共有多少种可能
随机性:试验之前不知道会发生什么结果
以上看看就好了,也不会用到.
2.样本空间和随机事件
(1)样本空间
随机试验的可辨性我们知道,我们事先知道所有的试验结果,那么我们把这所有的结果(同一个试验)称为样本空间,相当于是一个圆形,把所有的试验结果都圈在里面,这就是样本空间,简单吧~
(2)随机事件
我们上面讲到样本空间类似一个大圆,那么假如我们扔骰子,样本空间的值是不是就有6个?所有的结果当然就是1,2,3,4,5,6。那么我如果想要求每次投骰子≤3的概率是多少,那么该怎么算呢,我们这里引入一个样本空间的子集,子集就相当于样本空间中的一个范围,那么在这个子集中现在是不是就是1,2,3了?如果我们投了一次是2,那么我们称这一事件发生。
事件设A和B,如果
如果是题目是或者,我们就用
如果表示的意思是两个都要发生就用
以上内容理解就好,也不太重要我觉得,不过第三节公式得记记(很简单的)
3.频率和概率
频率很简单,假如投硬币投了5次,正面出现了3次,这个3就是正面发生的频数,3/5就是事件正面的频率
概率就是事件发生的可能性,它具有非负性,规范性,可列可加性,这三个也很好理解,非负(概率也就是我们说的可能性不可能为负嘛),规范性(当事件扩大到整个样本空间时,是不是就必然发生了,因为不管是哪种结果都在样本空间中),所以是1,表示必然事件,可列可加性先不说了,后续第五节讲
都是一些前备知识,可以加深加深印象,数学不需要死记硬背,我们学习的是逻辑,是思维
4.等可能事件(古典概型
第一节说到的样本空间有限个元素,且每个事件的发生的概率相等,我们把这种试验称为等可能概型,早期研究概率论时用的他作为对象,所以也称为古典概型,公式如下
其中A设为包含k个基本事件,S设为样本空间,这就是计算A事件概率的计算公式
5.条件概率以及独立性
条件概率相对来说比较重要,后续很多知识会涉及到条件概率的计算公式
这表示的就是一个条件概率,事件B在事件A发生的条件下,概率为
直接记公式就好
这就是计算条件概率的公式,要计算条件概率,必须知道其他两个量,就是AB()的概率和A的概率,这个其实很好记,分子就是两个接起来,分母就是条件,可以尝试这么记,A的概率下AB同时发生的概率,那么就是了。
以上对你来说肯定So easy了~
全概率公式:
我们先设置下先要的情况
假设:有一个试验E,样本空间是S,A是E的事件,为一个S的划分,也可以理解为情况,相当于A一旦发生,会分为很多种情况,这些情况就相当于S的划分,那么此时我们如何求A单独发生的概率呢?就相当于没有任何情况,只要A发生就行,我们可以这样:
如何理解?就相当于,一共有n个工厂,当他们全都生产零件混在一起,次品的概率就是P(A),题目会给出,相当于是一个比例(常见的是生产的占比)第i个工厂生产出来的次品率就是(表示的就是当i工厂生产的条件下次品的概率)了,那么我们只需要把这些量全部相乘求和即可
贝叶斯公式:
公式如下:
解释:还是上面工厂那个例子,这里求的是字面理解,也就是在发生次品的条件下,是i工厂生产的概率,是不是有点儿懂了,这个巧妙的关系,都是生活中的表示,字面意思就可以理解。
第一章完结,例题可以前往文末;
二、随机变量及其分布
随机变量
没什么用,就是一个符号,表示类似于下面的,平时我们不用P(A)这样直接说,而是用一个符号来表示,假设X是代表样本空间的一个使者,他来划分区域让我们算,下方的式子就相当于算当X=A时概率是多少。A题目中会给出,不过X需要你自己去根据题意去设,有些题也会给出,这里有两个,前者是离散型随机变量之时,后者是连续性
离散随机变量及其分布
什么是离散型随机变量?离散型随机变量就是有一些事件,他的结果是可列的,有限个或者无限个,都叫做离散型随机变量,比如说有一段数轴,0到10,一个人会给你一个数在0-10之间,让你算落在某一点的概率,连续性就是让你算某一段的概率比如说让你求,这个数<5的概率,就是这样
离散型随机变量有一个叫做分布律的东西
离散型随机变量有三个重要分布
- 0-1分布
- 二项分布
- 泊松分布
在讲之前,还得科普一个小知识,伯努利试验(贝努利试验)是指以前有个人,对抛硬币做了巨量的试验,每一次试验的可能性正面为p,反面为1-p,做了非常多次的试验,每一次试验都相互独立,我们把这叫做伯努利试验
那么0-1分布和伯努利试验有什么关系呢?
0-1分布其实就是伯努利试验,这句话怎么理解,就是把现实中抽象为数学,我们来看看0-1分布的分布律(规律)吧(分布函数就是算概率的表达式,其中p是已知概率)
0-1分布的意思就是X也就是k只可能取两个值,也就是例如对新生婴儿的性别进行登记,要么为男要么为女,p就可以为男,1-p就可以看作女的概率.你看这里是不是X=k,因为我们在这里讨论的是离散型随机变量。
二项分布
二项分布就可以理解为n重伯努利试验,也就是这项试验做了n次然后求X发生了k次的概率,给出他的分布律如下
其实也很好理解,就相当于做了n次试验,从n次当中取k次,然后事件X有k次发生就是p的k次方(为什么次方,因为每一次试验独立,要求他们同时发生k次,就要p*p*p*p(也就是求交集,交集符号可以省略可以看作✖️)),其余1-p就是其他发生就再1-p的n-k次方。
泊松分布
当二项分布的n也就是总试验次数很高,p(每一次的概率都比较小)这时候其实用二项分布是很难很难算的,不过泊松分布解决了这一点,可以使用他来近似,看下方分布律
其中>0是常数,一般会给出,k就是试验次数,当我们使用泊松分布去近似二项分布时,我们把二项分布的np=即可
分布函数
我们前面讲了离散型随机变量以及分布,那么对于非离散也就是连续型随机变量的时候,我们是求某一段区间内的概率,我们无法单独的取一点,那我们该如何做呢,下图表示是事件X的分布函数。
F(x)就是连续型随机变量专有的格式了,它代表分布函数,代表x及其往左区间的所有概率,这里不必困惑大写X和小写x,大写X代表一个随机变量,小写x是一个常数,一般题会给出,大X就相当于一个记号。不必深究,前面说到离散型可以单独列出一个点,可列性质,所以是P{X=x或者k};
连续型随机变量及其分布
我们上一节说到,连续型随机变量有他们的分布函数,而离散型只有分布律,那么分布函数终究是一个函数,当需要求某一段区域,某一个区间之间的概率(面积)那么该如何求呢,至此我们需要讨论连续型随机变量,如下:
和离散型随机变量的区别:离散型随机变量求的是落在某一点的概率,我们都知道求平面直角坐标系上某一段区间用定积分来表示,同样,在概率问题上,同样是利用定积分来进行求解某一段区间的概率,我们可以这样理解 概率=面积,那么在平面直角坐标系中求连续型随机变量是求这个点一直到最左边的面积,所以下界为负无穷,对他的分布函数求积分。仅此而已。
1.均匀分布
2.指数分布
3.正态分布
4.标准正态分布
1.均匀分布
分布函数:
意思就是想象一个数轴,给出f(1,3)的函数,告知你服从均匀分布,那么b-a=3-1就=2,所以这个分布函数很简单就计算出来了,就可以算概率了.
2.指数分布
分布函数如下
或者
为什么是两个呢,其实这个得分教材,如果是那系数就是他的倒数,如果是那就是直接作为系数。
- 正态分布
分布函数如下
不会积分的可以参考这里:
三、多维随机变量及其分布
见B站
四、数字特征
期望: 记作期望,又叫做均值。
这里我们仍然分离散和连续型进行分别讨论
离散型随机变量的数学期望
连续型随机变量
要记住的几个公式:
方差
表示和均值偏离的程度,要记住
如何求得方差:
记住以上公式即可,那么我们如果不知道E(X)那么如何求得方差呢
协方差
协方差: Covariance
以下公式:
而通过协方差我们可以得到相关系数的概念
‣
切比雪夫不等式
公式:
变式
通过这个式子,使人们在随机变量X的分布未知的情况下,对事件概率作出估计,还是很有效的
六、抽样分布
几个重要分布:记忆口诀
正态方和卡方出,卡方相除得F,若要求得t分布,一正根卡再相除
F分布的性质:
题目集锦:
- 作者:LxAnC
- 链接:http://lxanc.top/learning/pam
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。