《深入浅出统计学》读书笔记

1、《深入浅出统计学》读书笔记第一章 信息化图形:第一印象为什么不直接观察数据,而使用图形?纯粹的数据往往纷繁复杂,不够直观。将数据转换为图形来观察,可以更加清晰地把握数据的特征和趋势。为什么同样的数据,同样是折线图,会给人不同的直观印象?这是因为坐标轴的尺度不同。

2、《深入浅出统计学》读书笔记:几何分布、二项分布、泊松分布 几何分布: 定义:几何分布描绘的是在一系列独立的伯努利试验中,首次成功的尝试次数。 特点:众数为1,即成功的概率最大在第一次试验;期望为1/p;方差为1/p2。

3、《深入浅出统计学》(第九章)读书笔记第八章:正态分布(高斯分布)连续数据的概率分布 正态分布是连续数据的理想型模型,通过概率密度函数f(x)来描述。该函数可以求出一个数据范围内的某个连续变量的概率,且其总面积必须为1。正态分布呈现出钟形分布的特点,即中间大,两边小。

请解释以下概念,总体,样本,频数,频数密度,比例相对指标,动态相对指标...

1、频数密度就是组距中测量值的数目的多少 是反映频数的整体集中度的。

2、相对指标(质量指标):两个有联系的指标对比所得。结构相对指标:部分/总体(占比)。比例相对指标:A部分/B部分(对比)。动态相对指标:某时期总量/另一时期总量。反映现象在时间上的变化。强度相对指标:某总量/另一总量。反映现象的密度、普遍程度。 唯一有单位的相对指标 。

3、相对指标又称“相对数”,是用两个有联系的指标进行对比的比值来反映社会经济现象数量特征和数量关系的综合指标。相对指标也称作相对数,其数值有两种表现形式:无名数和复名数。无名数是一种抽象化的数值,多以系数、倍数、成数、百分数或千分数表示。

4、强度型指标例子:发病率及死亡率。相对比型指标定义为两个有关联指标的比例,通常以倍数或百分数表示。相对比例子:男女性别比、动态数列指标、相对危险度RR、优势比OR。计算相对数时应注意样本量过小的问题,样本量少会使相对数波动较大,可能影响临床试验和流行病学试验结果的稳定性。

5、相对指标也称作相对数,其数值有两种表现形式:无名数和复名数。无名数是一种抽象化的数值,多以系数、倍数、成数、百分数或千分数表示。复名数主要用来表示强度的相对指标,以表明事物的密度、强度和普遍程度等。例如,人均粮食产量用“千克/人”表示,人口密度用“人/平方公里”表示等。

各组次数除以本组组距,称为

各组次数除以本组组距,称为次数密度。次数密度亦称频数密度。组距数列中单位组距内分布的次数。次数密度可消除组距因素对异距数列次数分布的影响,在异距数列中,只有计算次数密度才能准确地反映实际的次数分布情况。在等距数列中,由于组距相同,各组次数的分布同次数密度的分布相一致。

频率除以组距在统计学中被称为“频率密度”,在绘制频率分布直方图时,它对应于纵轴(高)的值。频率密度的定义 在统计学中,当我们处理一组样本数据时,为了更直观地了解数据的分布情况,通常会将其分为若干个组,并计算每个组内的频数和频率。

次数密度是指次数除以组距,一般用在异距分组中反映各组的分布的密集程度.组距,是指每组的最高数值与最低数值之间的距离。在分组整理统计量数时,组的大小可因系列内量数的全距及所要划分的组数的不同而有所不同。每一组的最小限度叫做下限,最大限度叫做上限。下限和上限之间的距离,即为组距。

频率除以组距等于纵轴。在统计图表的制作过程中,我们通常会按照以下步骤进行计算:确定组距:首先,根据样本数据的最小值和最大值,以及希望分成的组数m,来确定每一组的组距。组距是相邻两组数据上限与下限的差。计算频率:统计每个组内数据的个数,即该组的频率。

次数密度 次数密度是指次数除以组距,一般用在异距分组中反映各组的分布的密集程度。

可能感兴趣的

回顶部