V2EX 10月21日 09:05
概率论与数理统计学习笔记:核心概念梳理
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本篇笔记梳理了学习《概率论与数理统计》过程中的核心概念和方法。内容涵盖了统计学的基本分类,如描述统计与推断统计,以及不同类型数据的分析方法。笔记详细介绍了数据的来源(直接/间接)、获取方式(调查/实验)及其抽样方法和误差控制。此外,还重点阐述了数据预处理、整理展示的步骤,包括频数分布、图表(直方图、饼图等)的运用。统计量方面,笔记总结了集中趋势(平均数、中位数、众数)和离散程度(全距、四分位数距、方差、标准差)的度量方法,并提及了偏度和峰度。概率部分则涉及随机事件、随机变量(离散/连续)、期望与方差,以及重要的概率分布(二项、泊松、正态分布等)及其应用,并强调了中心极限定理的重要性。

📊 **统计学基础与数据类型**:统计学被划分为描述统计和推断统计,旨在从数据中得出结论。理解不同类型的数据(分类、数值、观测、实验、截面、时间序列)至关重要,因为它们决定了适用的分析方法。统计学中用“总体”和“样本”来分别描述研究对象的整体特征及其抽样部分的特征,即参数与统计量。

📈 **数据获取与预处理**:数据的来源分为直接(调查、实验)和间接(二手数据)。一手数据的获取需要考虑抽样方法(概率抽样、非概率抽样)和搜集方式(自填、面访等)。所有调查数据都可能存在误差,需要进行误差控制。在分析前,数据需经过预处理,包括审核(如审核5个性质)、筛选、排序,并进行整理展示,如制作频数分布表和运用各种图表(条形图、饼图、直方图、散点图等)来直观呈现数据特征。

🔢 **统计量与分布特征**:描述数据集中趋势的统计量包括平均数、中位数、众数,它们在非对称分布下受极端值影响不同。离散程度的度量则有全距、四分位距、方差、标准差等。偏度系数和峰度系数用于描述分布的不对称性和尖锐程度。此外,还涉及随机事件、随机变量(离散/连续)、期望值、方差,以及重要的概率分布如二项分布、泊松分布和正态分布,特别是标准正态分布的性质和应用。

💡 **概率分布与核心定理**:概率论的核心在于理解各种概率分布及其适用场景,例如二项分布用于独立重复试验,泊松分布用于计算稀有事件发生的次数。正态分布及其标准正态分布因其广泛的统计学意义而被重点强调。中心极限定理是概率论中的一个关键定理,它说明了大量独立同分布随机变量的均值分布趋近于正态分布,这是统计推断的基础。

🎯 **参数估计与统计推断**:统计推断的核心目标是从样本统计量估计总体参数。这包括点估计(直接给出参数的估计值)和区间估计(给出参数可能落入的范围)。理解估计量的性质和抽样分布(如样本均值、样本方差的分布)是进行有效估计和推断的关键,其中自由度的概念尤为重要。

极端情况下是从头看到尾,另一个极端是完全不看书考前看提纲……会做题通关完事。

在看《概率论与数理统计》

高数卡了我很久,内容越多越复杂越不想看…重修的补考这学期初没过,50 多分(补考不算平时分)。

概率论好多……这是统计学的一部分不是笔记的笔记——只是为了简略一点,能够容易记住。

统计学分为描述统计和推断统计,其实就是从数据中得到结论。另外统计也不能解释问题之间具体是什么矛盾,而是说需要结合具体问题分析。统计数据有很多种分类方法——分类数据(含顺序数据)和数值数据(含离散/连续)、观测数据和实验数据、截面数据和时间序列数据,不同类型的数据需要采用不同的方法来进行分析。统计学中用两对概念来描述对象的度量和它们的特征:总体(参数)、样本(统计量)。_变量…待续_数据是怎么来的?数据的间接来源和直接来源有着重要的区别,二手数据容易收集但是时效性不够,针对性不强,这时我们可以用两种方法来获得一手数据——调查和实验。调查的_抽样方法有概率抽样()和非概率抽样()搜集数据的方法有自填、面访、电话等,需要根据抽样框的信息、目标-总体特征、调查内容_等要素进行选择_。,对照组和实验组、复杂化_的若干问题_、实验中的统计…凡是调查数据就会有误差,也会有相对的误差控制方法,待续。数据在分析之前要预处理(数据的审核、筛选、排序)、整理展示。审核需要审核 5 个性质;**频数和频数分布表**、累积频数、交叉表、单一变量模型的条形图饼图环形图箱线图茎叶图_……多变量模型的散点图气泡图雷达图……。合理使用图表…直方图和条形图的区别。数据的统计量具备现实意义。

    (简单/加权/几何)平均数、分位数(中位数和四分位数)、众数,以及它们在非对称分布时受极端值的影响情况可以用来描述集中的趋势;而离散程度的度量就有全距和四分位距,基于离差的平均(绝对离)差、方差、标准差离散系数 CV、对称分布下标准分数离群点数量的估计(3$\sigma$法则)(_这里和箱子线条图外面的离群点的定义是否相同?_)、_切比雪夫不等式_( Chebyshev's inequality )描述分布不对称程度的偏度系数 SK 和???峰度系数 K随机事件必然事件不可能事件、基本事件概率和古典概型、主观概率;(离散/连续型)随机变量、01 分布、期望值和方差、方差的简化公式、标准差、离散系数n 次独立重复实验的概率公式、超几何分布(批量很大的时候的有放回近似)、泊松分布(出现某个次数的概率公式)、二项分布近似泊松分布、概率密度和分布函数正态 normal 分布以及标准正态分布的密度函数和分布函数等,以及如何化成标准正态分布统计量相关。样本均值(一阶矩)、样本方差(二阶中心矩)、变异系数、样本偏度峰度、精确的抽样分布,统计三大分布从抽样分布的统计量、估计总体参数开始的方差会处以 n 或 n-1…自由度…中心极限定理、…ai 认为的学习重点。参数估计、估计量…、点估计和区间估计。

有点怀疑,这么多东西,真的能记住吗…比如说泊松分布我要记吗(我还没看概率论),正态分布肯定要记,三大分布和中心极限定理……问 ai 说,概率论和统计学是同一个东西的两面,概率论重点是证明中心极限定理…

虽说是理解,但是有时候能够理解,下一次看又像新的一样……更别说学校配套的优学院的网课视频很长…每一个小点有 20 分钟(大部分时间快进+ai 总结+同时耳朵听一次)

比如说概率论在讲古典概型的抽取问题,古典概型知道,抽取问题知道,是不是就可以直接跳过了?

口袋里有两盒火柴,每盒 n 只,每次随机拿出其中一盒用火柴 x1…有一天一盒火柴空了,另一盒火柴有 m 只火柴的概率是?

或许是钻牛角尖了吧()

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

概率论 数理统计 学习笔记 核心概念 数据分析 统计量 概率分布 中心极限定理 参数估计 Probability Theory Mathematical Statistics Study Notes Core Concepts Data Analysis Statistical Measures Probability Distributions Central Limit Theorem Parameter Estimation
相关文章