V2EX 10月21日 10:44
概率论与数理统计学习笔记
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

这是一份关于概率论与数理统计的学习笔记,作者分享了在学习过程中遇到的困难和整理的关键概念。笔记涵盖了统计学的基本分类(描述统计与推断统计),数据的类型与收集方法(调查与实验),以及数据预处理和展示(频数分布、图表等)。同时,笔记详细列举了描述集中趋势和离散程度的统计量,分布特征的度量(偏度、峰度),以及随机事件、随机变量、概率分布(二项分布、泊松分布、正态分布等)的核心概念。作者还提到了抽样分布、参数估计(点估计与区间估计)以及学习过程中对记忆和理解的困惑,并引用了AI的建议,强调了证明中心极限定理的重要性。

📊 **数据分类与收集:** 统计学区分描述统计和推断统计,侧重于从数据中得出结论。数据类型多样,包括分类数据、数值数据、观测数据、实验数据、截面数据和时间序列数据,每种类型需要不同的分析方法。数据的获取途径分为直接来源(调查、实验)和间接来源(二手数据),其中一手数据的获取涉及概率抽样和非概率抽样,以及多种搜集方法,需要综合考虑抽样框、总体特征和调查内容。数据在分析前需经过审核、筛选、排序等预处理,并可利用频数分布表、图表(如直方图、饼图、散点图)进行整理展示。

📈 **统计量度量:** 集中趋势的描述包括平均数(简单/加权/几何)、分位数(中位数、四分位数)和众数,需注意其在非对称分布时受极端值的影响。离散程度的度量则有全距、四分位距、平均绝对离差、方差、标准差及离散系数。分布特征方面,偏度系数描述不对称性,峰度系数描述分布的尖峭程度。随机变量的期望值和方差是描述其统计特性的重要指标。

🧮 **概率分布与推断:** 笔记详细列举了多种重要的概率分布,如二项分布、超几何分布(批量大时可近似)、泊松分布,以及连续型随机变量的概率密度函数和分布函数,特别是正态分布及其标准正态分布。这些分布是进行统计推断的基础。学习的难点在于区分和记忆这些分布的适用场景及公式,以及理解它们之间的近似关系(如二项分布近似泊松分布)。

🧠 **统计推断与记忆挑战:** 笔记提及了抽样分布、中心极限定理(被AI认为是概率论证明的重点)以及参数估计(点估计和区间估计)。作者对大量概念的记忆和理解感到困惑,尤其是在面对网课冗长内容时,寻求AI总结和快速过关的方法。作者也对是否需要记忆所有分布(如泊松分布)表示疑问,并以火柴盒问题为例,体现了在具体问题上应用统计学知识的思考过程。

极端情况下是从头看到尾,另一个极端是完全不看书考前看提纲……会做题通关完事。

在看《概率论与数理统计》

高数卡了我很久,内容越多越复杂越不想看…重修的补考这学期初没过,50 多分(补考不算平时分)。

概率论好多……这是统计学的一部分不是笔记的笔记——只是为了简略一点,能够容易记住。

统计学分为描述统计和推断统计,其实就是从数据中得到结论。另外统计也不能解释问题之间具体是什么矛盾,而是说需要结合具体问题分析。统计数据有很多种分类方法——分类数据(含顺序数据)和数值数据(含离散/连续)、观测数据和实验数据、截面数据和时间序列数据,不同类型的数据需要采用不同的方法来进行分析。统计学中用两对概念来描述对象的度量和它们的特征:总体(参数)、样本(统计量)。_变量…待续_数据是怎么来的?数据的间接来源和直接来源有着重要的区别,二手数据容易收集但是时效性不够,针对性不强,这时我们可以用两种方法来获得一手数据——调查和实验。调查的_抽样方法有概率抽样()和非概率抽样()搜集数据的方法有自填、面访、电话等,需要根据抽样框的信息、目标-总体特征、调查内容_等要素进行选择_。,对照组和实验组、复杂化_的若干问题_、实验中的统计…凡是调查数据就会有误差,也会有相对的误差控制方法,待续。数据在分析之前要预处理(数据的审核、筛选、排序)、整理展示。审核需要审核 5 个性质;**频数和频数分布表**、累积频数、交叉表、单一变量模型的条形图饼图环形图箱线图茎叶图_……多变量模型的散点图气泡图雷达图……。合理使用图表…直方图和条形图的区别。数据的统计量具备现实意义。

    (简单/加权/几何)平均数、分位数(中位数和四分位数)、众数,以及它们在非对称分布时受极端值的影响情况可以用来描述集中的趋势;而离散程度的度量就有全距和四分位距,基于离差的平均(绝对离)差、方差、标准差离散系数 CV、对称分布下标准分数离群点数量的估计(3$\sigma$法则)(_这里和箱子线条图外面的离群点的定义是否相同?_)、_切比雪夫不等式_( Chebyshev's inequality )描述分布不对称程度的偏度系数 SK 和???峰度系数 K随机事件必然事件不可能事件、基本事件概率和古典概型、主观概率;(离散/连续型)随机变量、01 分布、期望值和方差、方差的简化公式、标准差、离散系数n 次独立重复实验的概率公式、超几何分布(批量很大的时候的有放回近似)、泊松分布(出现某个次数的概率公式)、二项分布近似泊松分布、概率密度和分布函数正态 normal 分布以及标准正态分布的密度函数和分布函数等,以及如何化成标准正态分布统计量相关。样本均值(一阶矩)、样本方差(二阶中心矩)、变异系数、样本偏度峰度、精确的抽样分布,统计三大分布从抽样分布的统计量、估计总体参数开始的方差会处以 n 或 n-1…自由度…中心极限定理、…ai 认为的学习重点。参数估计、估计量…、点估计和区间估计。

有点怀疑,这么多东西,真的能记住吗…比如说泊松分布我要记吗(我还没看概率论),正态分布肯定要记,三大分布和中心极限定理……问 ai 说,概率论和统计学是同一个东西的两面,概率论重点是证明中心极限定理…

虽说是理解,但是有时候能够理解,下一次看又像新的一样……更别说学校配套的优学院的网课视频很长…每一个小点有 20 分钟(大部分时间快进+ai 总结+同时耳朵听一次)

比如说概率论在讲古典概型的抽取问题,古典概型知道,抽取问题知道,是不是就可以直接跳过了?

口袋里有两盒火柴,每盒 n 只,每次随机拿出其中一盒用火柴 x1…有一天一盒火柴空了,另一盒火柴有 m 只火柴的概率是?

或许是钻牛角尖了吧()

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

概率论 数理统计 学习笔记 数据分析 统计学 Probability Theory Mathematical Statistics Study Notes Data Analysis Statistics
相关文章