V2EX 10月21日 07:11
概率论与数理统计学习笔记
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

这是一份关于《概率论与数理统计》的学习笔记,作者在学习过程中遇到了挑战,特别是高等数学的复杂性带来的畏难情绪。笔记详细梳理了统计学的基本概念,包括描述统计与推断统计、数据分类方法、总体与样本等。同时,笔记还深入探讨了数据的来源(直接与间接)、数据预处理(审核、筛选、整理展示)以及各类统计图表(频数分布表、直方图、散点图等)的应用。在统计量方面,笔记列举了描述集中趋势(平均数、分位数、众数)和离散程度(全距、四分位距、方差、标准差等)的多种方法,并提及了偏度和峰度系数。概率部分则涵盖了随机事件、随机变量(离散/连续)、概率分布(二项、泊松、正态等)及其相关计算,并初步触及了抽样分布、参数估计等核心统计推断概念。笔记中穿插了作者的学习困惑和对学习方法的思考。

📊 **统计学基础概念与数据分类**: 笔记清晰界定了统计学的两大分支——描述统计和推断统计,强调其核心在于从数据中得出结论。同时,详细阐述了数据的多种分类方式,包括分类数据(及其有序性)、数值数据(离散与连续)、观测数据与实验数据、截面数据与时间序列数据,并指出不同类型的数据需要运用不同的分析方法。此外,笔记还引入了度量对象及其特征的两个关键概念:总体(参数)和样本(统计量),为后续统计分析奠定了基础。

📈 **数据获取、预处理与可视化**: 笔记系统性地介绍了数据的来源,区分了时效性不足的二手数据和需要通过调查、实验获得的一手数据。在调查方法方面,提及了概率抽样与非概率抽样,以及自填、面访等搜集方式。数据分析前的预处理环节至关重要,笔记强调了数据的审核(五种性质)、筛选和整理展示。在可视化方面,笔记列举了用于展示数据的多种图表,如频数分布表、直方图、条形图、饼图、箱线图、散点图等,并特别指出了直方图与条形图的区别,强调了合理使用图表的重要性。

🧮 **统计量与概率分布**: 笔记深入探讨了描述数据集中趋势的统计量,包括平均数(简单/加权/几何)、分位数(中位数/四分位数)、众数,以及它们在非对称分布下的敏感性。同时,详细介绍了衡量离散程度的指标,如全距、四分位距、平均绝对离差、方差、标准差、离散系数,并提及了3σ法则和切比雪夫不等式。在概率论部分,笔记涵盖了随机事件、随机变量(离散/连续)、期望与方差,以及多种重要的概率分布,如二项分布、超几何分布、泊松分布、正态分布及其标准形式,并提到了概率论证明中心极限定理是其重点。

🧐 **学习困惑与反思**: 作者在笔记中坦诚地表达了对海量知识的记忆担忧,以及在面对复杂内容时的畏难情绪。例如,对于是否需要记忆所有概率分布(如泊松分布)的疑问,以及如何高效学习网课视频(快进、AI总结、多感官结合)的策略。笔记还通过一个经典的“火柴盒问题”示例,展现了作者在理解和应用统计学概念时遇到的具体困难,反映了其对学习方法和知识掌握深度的思考。

极端情况下是从头看到尾,另一个极端是完全不看书考前看提纲……会做题通关完事。

在看《概率论与数理统计》

高数卡了我很久,内容越多越复杂越不想看…重修的补考这学期初没过,50 多分(补考不算平时分)。

概率论好多……这是统计学的一部分不是笔记的笔记——只是为了简略一点,能够容易记住。

统计学分为描述统计和推断统计,其实就是从数据中得到结论。另外统计也不能解释问题之间具体是什么矛盾,而是说需要结合具体问题分析。统计数据有很多种分类方法——分类数据(含顺序数据)和数值数据(含离散/连续)、观测数据和实验数据、截面数据和时间序列数据,不同类型的数据需要采用不同的方法来进行分析。统计学中用两对概念来描述对象的度量和它们的特征:总体(参数)、样本(统计量)。_变量…待续_数据是怎么来的?数据的间接来源和直接来源有着重要的区别,二手数据容易收集但是时效性不够,针对性不强,这时我们可以用两种方法来获得一手数据——调查和实验。调查的_抽样方法有概率抽样()和非概率抽样()搜集数据的方法有自填、面访、电话等,需要根据抽样框的信息、目标-总体特征、调查内容_等要素进行选择_。,对照组和实验组、复杂化_的若干问题_、实验中的统计…凡是调查数据就会有误差,也会有相对的误差控制方法,待续。数据在分析之前要预处理(数据的审核、筛选、排序)、整理展示。审核需要审核 5 个性质;**频数和频数分布表**、累积频数、交叉表、单一变量模型的条形图饼图环形图箱线图茎叶图_……多变量模型的散点图气泡图雷达图……。合理使用图表…直方图和条形图的区别。数据的统计量具备现实意义。

    (简单/加权/几何)平均数、分位数(中位数和四分位数)、众数,以及它们在非对称分布时受极端值的影响情况可以用来描述集中的趋势;而离散程度的度量就有全距和四分位距,基于离差的平均(绝对离)差、方差、标准差离散系数 CV、对称分布下标准分数离群点数量的估计(3$\sigma$法则)(_这里和箱子线条图外面的离群点的定义是否相同?_)、_切比雪夫不等式_( Chebyshev's inequality )描述分布不对称程度的偏度系数 SK 和???峰度系数 K随机事件必然事件不可能事件、基本事件概率和古典概型、主观概率;(离散/连续型)随机变量、01 分布、期望值和方差、方差的简化公式、标准差、离散系数n 次独立重复实验的概率公式、超几何分布(批量很大的时候的有放回近似)、泊松分布(出现某个次数的概率公式)、二项分布近似泊松分布、概率密度和分布函数正态 normal 分布以及标准正态分布的密度函数和分布函数等,以及如何化成标准正态分布统计量相关。样本均值(一阶矩)、样本方差(二阶中心矩)、变异系数、样本偏度峰度、精确的抽样分布,统计三大分布从抽样分布的统计量、估计总体参数开始的方差会处以 n 或 n-1…自由度…中心极限定理、…ai 认为的学习重点。参数估计、估计量…、点估计和区间估计。

有点怀疑,这么多东西,真的能记住吗…比如说泊松分布我要记吗(我还没看概率论),正态分布肯定要记,三大分布和中心极限定理……问 ai 说,概率论和统计学是同一个东西的两面,概率论重点是证明中心极限定理…

虽说是理解,但是有时候能够理解,下一次看又像新的一样……更别说学校配套的优学院的网课视频很长…每一个小点有 20 分钟(大部分时间快进+ai 总结+同时耳朵听一次)

比如说概率论在讲古典概型的抽取问题,古典概型知道,抽取问题知道,是不是就可以直接跳过了?

口袋里有两盒火柴,每盒 n 只,每次随机拿出其中一盒用火柴 x1…有一天一盒火柴空了,另一盒火柴有 m 只火柴的概率是?

或许是钻牛角尖了吧()

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

概率论 数理统计 学习笔记 数据分析 统计学 Probability Theory Mathematical Statistics Study Notes Data Analysis Statistics
相关文章