V2EX 10月21日 04:23
学习概率论与数理统计的笔记与思考
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文记录了作者学习《概率论与数理统计》过程中的笔记和困惑。作者提到高数学习的困难,并尝试将统计学简化为从数据中得出结论的过程。文章详细梳理了统计学中数据的分类、度量(总体与样本)、数据来源(调查与实验)、数据预处理与展示(频数分布、图表等),以及描述集中趋势和离散程度的各种统计量。此外,还涉及随机事件、随机变量、常见概率分布(二项分布、泊松分布、正态分布等)及其性质,并对学习重点(如中心极限定理)和记忆方式进行了思考,同时穿插了学习过程中的一些具象化问题和对网课学习效率的探讨。

📊 **数据统计基础**:统计学旨在从数据中得出结论,涉及数据的多种分类(分类、数值、观测、实验、截面、时间序列)以及度量对象(总体与样本)。数据的获取途径包括直接(调查、实验)和间接(二手数据),并需注意调查中的抽样方法和数据收集方式。

📈 **数据预处理与可视化**:分析前需对数据进行预处理(审核、筛选、排序)和整理展示。常用的统计量包括描述集中趋势(平均数、中位数、众数)和离散程度(全距、四分位距、方差、标准差)的度量,以及描述分布特征(偏度、峰度)。图表如频数分布表、直方图、条形图等是展示数据的重要工具。

🎲 **概率论核心概念**:概率论涉及随机事件(必然、随机、不可能)及其概率计算(古典概型、主观概率),以及随机变量(离散/连续型)的期望与方差。文章重点提及了二项分布、泊松分布、正态分布等常见概率分布,并强调了中心极限定理在统计学中的重要性。

🤔 **学习过程中的挑战与思考**:作者在学习过程中面临记忆量大、理解深度不足以及网课效率等问题。对于如何有效记忆和区分不同概率分布的应用场景,以及如何平衡理论证明与实际应用,作者进行了深入的思考和提问。

极端情况下是从头看到尾,另一个极端是完全不看书考前看提纲……会做题通关完事。

在看《概率论与数理统计》

高数卡了我很久,内容越多越复杂越不想看…重修的补考这学期初没过,50 多分(补考不算平时分)。

概率论好多……这是统计学的一部分不是笔记的笔记——只是为了简略一点,能够容易记住。

统计学分为描述统计和推断统计,其实就是从数据中得到结论。另外统计也不能解释问题之间具体是什么矛盾,而是说需要结合具体问题分析。统计数据有很多种分类方法——分类数据(含顺序数据)和数值数据(含离散/连续)、观测数据和实验数据、截面数据和时间序列数据,不同类型的数据需要采用不同的方法来进行分析。统计学中用两对概念来描述对象的度量和它们的特征:总体(参数)、样本(统计量)。_变量…待续_数据是怎么来的?数据的间接来源和直接来源有着重要的区别,二手数据容易收集但是时效性不够,针对性不强,这时我们可以用两种方法来获得一手数据——调查和实验。调查的_抽样方法有概率抽样()和非概率抽样()搜集数据的方法有自填、面访、电话等,需要根据抽样框的信息、目标-总体特征、调查内容_等要素进行选择_。,对照组和实验组、复杂化_的若干问题_、实验中的统计…凡是调查数据就会有误差,也会有相对的误差控制方法,待续。数据在分析之前要预处理(数据的审核、筛选、排序)、整理展示。审核需要审核 5 个性质;**频数和频数分布表**、累积频数、交叉表、单一变量模型的条形图饼图环形图箱线图茎叶图_……多变量模型的散点图气泡图雷达图……。合理使用图表…直方图和条形图的区别。数据的统计量具备现实意义。

    (简单/加权/几何)平均数、分位数(中位数和四分位数)、众数,以及它们在非对称分布时受极端值的影响情况可以用来描述集中的趋势;而离散程度的度量就有全距和四分位距,基于离差的平均(绝对离)差、方差、标准差离散系数 CV、对称分布下标准分数离群点数量的估计(3$\sigma$法则)(_这里和箱子线条图外面的离群点的定义是否相同?_)、_切比雪夫不等式_( Chebyshev's inequality )描述分布不对称程度的偏度系数 SK 和???峰度系数 K随机事件必然事件不可能事件、基本事件概率和古典概型、主观概率;(离散/连续型)随机变量、01 分布、期望值和方差、方差的简化公式、标准差、离散系数n 次独立重复实验的概率公式、超几何分布(批量很大的时候的有放回近似)、泊松分布(出现某个次数的概率公式)、二项分布近似泊松分布、概率密度和分布函数正态 normal 分布以及标准正态分布的密度函数和分布函数等,以及如何化成标准正态分布统计量相关。样本均值(一阶矩)、样本方差(二阶中心矩)、变异系数、样本偏度峰度、精确的抽样分布,统计三大分布从抽样分布的统计量、估计总体参数开始的方差会处以 n 或 n-1…自由度…中心极限定理、…ai 认为的学习重点。参数估计、估计量…、点估计和区间估计。

有点怀疑,这么多东西,真的能记住吗…比如说泊松分布我要记吗(我还没看概率论),正态分布肯定要记,三大分布和中心极限定理……问 ai 说,概率论和统计学是同一个东西的两面,概率论重点是证明中心极限定理…

虽说是理解,但是有时候能够理解,下一次看又像新的一样……更别说学校配套的优学院的网课视频很长…每一个小点有 20 分钟(大部分时间快进+ai 总结+同时耳朵听一次)

比如说概率论在讲古典概型的抽取问题,古典概型知道,抽取问题知道,是不是就可以直接跳过了?

口袋里有两盒火柴,每盒 n 只,每次随机拿出其中一盒用火柴 x1…有一天一盒火柴空了,另一盒火柴有 m 只火柴的概率是?

或许是钻牛角尖了吧()

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

概率论 数理统计 学习笔记 数据分析 机器学习基础 Probability Theory Mathematical Statistics Study Notes Data Analysis Machine Learning Fundamentals
相关文章