统计学基本概念入门
近来在做数据相关系统,整理好思路,开始做原型图,发现越做越纠结,很多统计项不知道定义和区别,因此找统计学原理学习下,果然受益匪浅。基本概念总结如下,以备不时之需。 以公司网站会员、订单统计为例。
基本概念:
标志:说明总体单位(组成总体的个体)特征的名称。由标志名称+标志值组成。通俗点讲,就是个体的特征(属性)。
例如:单个会员A的 用户名 性别 年龄 注册时间 邮箱 电话 省份等。
指标:是说明总体 数量 特征的概念。由指标名称+指标值组成。
两者关联。组成总体的所有个体都有特征(标志),由这些特征对总体所包含的全部个体进行分类、求和、平均等操作得到分类数量、总值、平均值即为指标。指标反映的是总体的特征。标志是总体指标的来源和基础,指标则是标志的综合。
例如:全站会员数 男会员数 北京会员数 平均年龄
数据的计量尺度:
1、定类尺度(nominal scale):按照客观现象的某种属性对其进行分类或分组,各类各组之间的关系是并列、平等而且互相排斥的。比如 会员性别 会员地区 为定类尺度。只能测度个体之间的类别差,其他差别无法得知。
2、 定序尺度(ordinal scale):又称顺序尺度,区分事物之间等级或顺序差别,是对事物之间等级差别和顺序差别的一种测度,可以反映各类的优劣、量的大小或顺序。只能分级别,不能体现精确差值。比如 普通会员 VIP会员 金卡会员。该尺度分类要求穷尽(按所有标志分类)、互斥(同1)。
3、定距尺度(interval scale):是对事物类别或次序之间间距的计量,它通常使用自然或度量衡单位作为计量尺度。能分类、排序、比较大小,计量差距。定距数据可以进行加、减运算,不能进行乘、除运算。
4、定比尺度(ratio scale):定比尺度是在定距尺度的基础上,确定可以作为比较的基数,将两种相关的数加以对比,而形成新的相对数,用以反映现象的构成、比重、速度、密度等数量关系。定比尺度的主要数学特征是“÷”或“×”。