欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

统计学

科普小知识2022-02-07 10:48:31
...

统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。

中文名:统计学

英文名:Statistics

学科门类:一级学科

学科特点:应用广泛

主要分支:描述统计学、推断统计学

1、简介


统计学

概述

数理统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及*的情报决策之上。

统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

定义

是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学是收集、分析、表述和解释数据的科学。

2、历史

历史学派

一、18-19世纪——统计学的创立和发展

德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

(1)统计学的创立时期

统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

1、国势学派

国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。

2、政治算术学派

政治算术学派产生于19世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人。”

政治算术学派的另一个代表人物是约翰·格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

(2)统计学的发展时期

18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。

1、数理统计学派

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

2、社会统计学派

社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821-1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。


统计学

二、20世纪——迅速发展的统计学

20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。

1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。西方国家所指的科学统计方法,主要就是指推断统计来说的。

2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。

3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。

4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。

5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。

6.统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。

统计学发展史说明:先有社会统计学后有数理统计学,先有变量后有随机变量;社会统计学以变量为基础,数理统计学以随机变量为基础。变量与随机变量是在一定条件下可以相互转化的数学概念。社会统计学在描述变量时使用,数理统计学在描述随机变量时使用,我们知道变量与随机变量是即有联系又有区别的。当变量的取值的概率不是1时,变量就变成了随机变量;当随机变量取值得概率为1时,随机变量就变成了变量。

变量与随机变量的关系搞清楚了,社会统计学与数理统计学的关系就搞清楚了。以后在描述变量时,大胆的使用社会统计学;在描述随机变量时,就用数理统计学。如果在描述变量时非用数理统计学,那就是杀鸡用了宰牛刀。

3、发展

发展历程

统计学的英文statistics最早是源于现代拉丁文statisticumcollegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由GottfriedAchenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由JohnSinclair引进到英语世界。

统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。

发展阶段

第一阶段称之为“城邦政情”(Mattersofstate)阶段

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。

第二阶段称之为“政治算数”(Politcalarthmetic)阶段

与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

“政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。

1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志。

威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;

(2)通过运用数字的理论性推理来进行推算的方法;

(3)以平均数为基础进行推算的方法”;

第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学”(Scienceofstatisticalanalysis)阶段

在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。

“统计分析科学”课程的出现是现代统计发展阶段的开端.1908年,“学生”氏(WilliamSleeyGosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(AdolpheQuelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.。

现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

4、现状


统计学

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在中国,*市场经济*的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国*市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。

第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。

第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。

第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。

统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。

5、其他信息

观念

为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料蒐集所组成的母体我们称它叫时间序列。

为了实际的理由,选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所蒐集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。

描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及资料采矿。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。

如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表整个母体。统计学提供了许多方法来估计和修正样本和蒐集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。

要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

学科分支

一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。

统计学的分支学科有:

统计学史、理论统计学、统计调查分析理论、统计核算理论、统计监督理论、统计预测理论、统计逻辑学、统计法学、描述统计学、推断统计学、经济统计学、宏观经济统计学、微观经济统计学、管理统计学、科学技术统计学、农村经济调查、社会统计学、教育统计学、文化与体育统计学、卫生统计学、司法统计学、社会福利与社会保障统计学、生活质量统计学、人口统计学、环境与生态统计学、自然资源统计学、环境统计学、生态平衡统计学、国际统计学、国际标准分类统计学、国际核算体系与方法论体系、国际比较统计学、生物统计学、商务统计学、工程统计学、心理统计学、化学统计学、档案统计学、社会经济统计学、水文统计学、数理统计学、统计语言学、统计物理学、化学统计学、延伸学科

有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:

农业科学、生物统计、商用统计、资料采矿(应用统计学以及图形从资料中获取知识)、经济统计学、电机统计、统计物理学、人口统计、心理统计学、教育统计学、社会统计(包括所有的社会科学﹚、文献统计分析、化学与程序分析(所有有关化学的资料分析与化工科学)、运动统计学,特别是棒球以及曲棍球

统计对于商业以及工业是一个基本的关键。他被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。在这些领域统计扮演了一个重要的角色。

分类

因作用不同而分为两类。

一是应用统计学,它是与研究对象的特征密切结合的各科专门统计,属经济学的范畴。如:人口统计学、医药统计学、经济统计学、工业统计、体育统计学、生物统计学等。这些统计学都是以本学科范畴的现象的数量形式为基础,对它们的规律性进行数量上的分析研究。它们是各相应学科的有机组成部分。教育统计学亦属应用统计学的范畴。

二是数理统计学,它是为各门应用统计学提供数理方法论基础的一门学科,其内容主要是运用概率的知识来解释统计数据数量关系的模式,属数学的一大分支。

统计学在实践中形成了更完整的体系和更高的学科地位,其学科分类将从经济学中独立出来,由原来的二级学科升为一级学科,分为十二大类,即基础统计学(包括统计学原理、统计调查理论、整理理论、分析理论等),理论数理统计(包括数理方法、概率论、估计与假设检验理论),经济统计学(包括宏观经济统计学、微观经济统计学、农业、工业、城建统计学),科学技术统计学(包括统计管理、活动、成果转化统计学),社会统计学(包括教育、文化、体育、卫生、司法、社会福利与保障等统计学),人口统计学,资源生态统计学,应用数理统计学(生物、遗传、工程;统计模拟,预测等),国际统计学(包括国际标准分类、比较统计学,国际统计组织等),统计史统计思想史和统计学其它学科。

特性

统计学的特性主要概率性、二元性和归纳性。

数理统计学是应用统计学的理论基础,而数理统计学又是运用概率论来解释统计数量关系的,统计学具有概率性的特征,这一点在推断统计中尤为突出。统计学除了有它的理论渊源以外,还有一套源自实践的资料,也就是说统计学并不是一门纯粹的数学,使其具有了“二元”的特性。统计学的主要功能是从现实的某些资料中归纳出一般的原理或规律,并把归纳出来的这些原理或规律应用于更大的范围之内。因而具有归纳的特性。

法则

在统计工作和统计分析中遵循着一套统计的法则,即统计的常态法则、小数永存法则和大量惰性原则。

在统计研究中,需采用抽样的方法进行研究。抽样是指从总体中抽出一部分个体作为研究对象的方法(或过程)。根据统计学家所研究的结果证明,从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计的常态法则。

在实验研究中,有时需要两个或多个相同的样本,这些相同样本所得出的结果,彼此之间是差不多的。因为根据统计的常态法则,从总体中随机抽取的第一个样本既然能够代表总体,从总体中随机抽取的其它几个样本自然也会跟第一个样本一样,都能代表总体。亦即第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。在此“小数”是指小数量的意思。

从总体中随机抽取的样本,常常保持着它的恒性,而且总体本身如果不受特殊原因的影响时,也常有它的惰性。例如,进行全国儿童身高、体重等身体素质统计时,如果儿童不受环境的意外影响(如营养、锻炼等),那么在一段时期内,常常会测得相似的统计结果,这就是说某一事物的某一性质或状态,在反复观察或试验中是保持不变的,这就是大量惰性原则。

上一篇:口红经济学

下一篇:工业品出厂价格