文科生の量化闯关记 : 数理篇- 国王的学问
  我是宽客 4天前 177 0

一、引言

想成为王者,必须懂统计

image.png

此前已经写过几个关于量化分析 “代码篇” 的分享,接下来要进入的,既是量化领域的核心内容,也是我们很多文科生觉得难度最大的 “数理”部分,而我们 “数理”的第一站,就是 “统计学”。

image.png

在量化分析的数理基础里,线性代数、微积分、概率统计、计量经济等缺一不可,但其中统计检验直接关系到数据结论的可靠性 —— 正因如此,统计学在量化中占据着核心地位,是数据分析的 “工具箱”,更是科学决策的 “方法论基础”。所以接下来的分享,我会先从统计学切入,带大家逐步理解量化分析所需的统计逻辑与实用方法,为后续攻克更复杂的数理内容打下基础。
不过,在正式入门这门高难度学科之前,我们不妨先聊聊它背后的人文学知识。因此,接下来我想分享一些自己对统计学相关背景与价值的理解。

二、统计

国王的学问

小时候读历史书时,我曾幻想过自己有朝一日能成为像汉武帝、亚历山大大帝那样的君主。然而,要成为一国之君,绝非易事——历代的王侯将相,往往从小便接受系统而严格的教育,学习如何治理国家、驾驭权力。在这些教育内容中,有一门至今仍具现实意义的学问,叫做“治国之道”。令人意想不到的是,这门学科并非我们通常所理解的政治学,而是一门看似与政治相距甚远的学问——统计学

我们或许会疑惑:“统计学”怎么会与“治国”联系在一起?其实,英语中的“statistics”一词,其词源与“state”(国家)密切相关。仔细观察,你会发现“statistics”以“stat-”开头,与“state”发音和词根都极为相似。这个词最早可追溯至中世纪的意大利。当时的意大利由众多城邦组成,一些掌握新兴治理技术的人才,会游走于各国宫廷,向君主推销自己的治国方略。这种现象,与我们中国春秋战国时期孔子等人周游列国、宣扬治国理念的情形,颇有几分相似。

image.png

提到意大利的治国思想家,会想到一位极具争议却又影响深远的人物——尼科洛·马基雅维利(Niccolò Machiavelli)。他虽以《君主论》闻名,但其思想背后,正体现了早期“治国者”对权力、制度与国家运行规律的深刻洞察。而在当时,那些擅长治理国家、通晓“state”事务的人,在意大利语中被称为“statista”——类似于擅长小提琴的人为“violinista”(小提琴家)。正如“violinista”精于琴艺,“statista”则精于国家事务。由此,这门研究国家事务、以数据为基础的学问,逐渐被命名为 “statistics”——也就是我们今天所说的统计学

统计是国家治理的核心

在中国古代,当一个王朝被推翻、国家灭亡时,末代君主或大臣常常会携带一些重要的官方册籍逃离都城。这些册籍,就是人们常说的“籍”,其中最常被联想到的,就是类似“户籍”的国家基础档案。

这些册籍详细记录人口数量、土地等级、粮食产量、赋税额度、徭役征发等关键信息,是统治者了解国情、调配资源、维系运转的根本依据。

image.png

简单来说,这些册籍就像是古代国家治理的“基础数据库”,记录了一个国家最关键的信息:有多少人口、土地有多大面积、粮食产量多少、能收多少税、谁该服兵役或劳役等等。

因此,当亡国之君带着这些册籍出逃时,也就带走了国家的治理命脉和核心信息。即便新王朝的军队占领了都城和皇宫,如果拿不到这些资料,就如同拿到了一座空城,对国家的人口、土地、经济状况等一无所知。新政权如果没有这些数据,就很难有效统治:不知道向谁收税、不知道哪里能征兵、不知道百姓住在哪里。他们占领的,往往只是一座空荡荡的宫殿,而不是一个真正可以治理的国家。

由此可见,一个国家真正的治理权,不仅在于谁控制了土地和城池,更在于谁掌握了那些记录国家基础信息的官方册籍——也就是治理与统计的核心资料。

量化思维塑造近现代国家治理

到了17世纪,随着重商主义思潮的兴起,贸易收支统计逐渐成为国家治理中的关键环节。 在这一时期,国家致富的核心逻辑是通过出口赚取金银、限制进口以减少财富外流,从而积累财富、增强国力。因此,准确统计一个国家的总出口和总进口金额,成为当时重要的政治与经济议题。

image.png

事实上到了18世纪,随着欧洲人向世界扩张,抢占了大量殖民地,一个人口少小的国家要统治人口多、版图大的国家,最基础的工具就是统计。因此在谈到18、19世纪时,人们常说:在一个国家被欧洲帝国主义入侵之前,通常会有携带各种测量工具的人先来探查——比如钟表、测量仪器、温度计或气压计等。

image.png

当欧洲殖民者对某地的地理、资源和人口情况掌握得比当地政府更详细时,往往在无形中削弱了对方的治理权威。在这一过程中,英国凭借对统计与信息的高度重视,成为殖民扩张中的佼佼者;而德国作为后起的统一国家,也在19世纪后期大力加强统计与测量工作,以此提升国家治理与经济竞争力。

进入 20 世纪后,GDP(国内生产总值) 无疑成为了国家统计中最重要、也最具象征意义的指标之一。我自己是 20 世纪出生的人,还记得小时候新闻里经常播报:“进入小康社会及人均GPD目标”——那几乎是那个年代的全民话题。在相当长的一段时间里,人们普遍认为,一个国家是否富强,主要就看它的人均 GDP 有多高。

image.png

但实际上,GDP 之所以成为衡量国家发展的核心指标,与 20 世纪的“时代精神”密不可分。20 世纪的历史,很大程度上是两次世界大战与战后重建的历史。而这两场大战与以往的冲突有一个根本不同:它们不再是少数职业军人的战争,而是 “总体战”(Total War)——即整个国家的工业能力、社会资源,乃至全体民众,都被动员进了战争机器。

在这样的背景下,一个国家能生产多少汽车,往往也意味着它能制造多少坦克;能开采多少铁矿,就意味着能为军队提供多少燃料和原料。人们逐渐形成了一种强烈的认知:一个国家的 GDP 越高,它的战争潜力与综合国力也就越强。 于是,“GDP 即国力”的观念逐步深入人心。

image.png

然而,到了 1960 年代,随着二战结束、经济复苏,人们开始反思:用 GDP 来衡量一个国家的进步与民众的生活质量,真的合理吗?

这种质疑,与当时西方社会兴起的反思消费主义与物质主义的文化思潮密切相关,其中包括影响深远的“嬉皮士(Hippie)运动”。

1968 年,美国参议员 罗伯特·肯尼迪(Robert F. Kennedy) 在一次著名演讲中深刻指出:

image.png

这番话引发了广泛共鸣与深刻反思。自此,世界各国逐渐认识到:仅靠 GDP,并不能全面反映一个国家的发展质量与民众福祉。

于是,从 1970 年代起,各国开始探索使用更加多元的指标来衡量社会进步与人民生活。今天,只要打开任何一个国家的统计局网站,你都能看到大量统计指标——从文盲率、婴儿死亡率、预期寿命,到 教育水平、医疗保障、环境质量等。这些指标共同构成了对“国家是否真正富足”的更全面评估。

值得一提的是,自 20 世纪 80 年代以来,随着这些社会指标被系统性地追踪与改善,全球范围内的 婴儿死亡率、文盲率、传染病发病率等都出现了显著下降。几乎所有相关趋势曲线,都呈现出持续向好的态势。

image.png

image.png

在摆脱了工业革命时期“生产越多就越富”的单一价值观之后,人类开始追求一种更平衡、更可持续、更以人为本的生活方式。而要实现这种平衡,首先就要让发展的各个方面变得“可度量”、“可统计”。

正因如此,今天我们在媒体和研究中看到的那些过去很少听说的指标——比如 “人类发展指数(HDI)”、“幸福指数”、“生活质量指数” 等——其实都是在尝试用更复杂的模型与统计方法,去量化评估一个最根本的问题:“人类,是不是真的过得好?”

只有当我们能够通过系统化的数据,全面衡量教育、医疗、住房、环境、社区关系等各方面的真实状况时,社会的整体进步与人民的幸福感,才有可能实现真正的提升。

可以量化一切事物吗?

在乔纳森·斯威夫特(Jonathan Swift)的经典讽刺小说 《格列佛游记》(Gulliver’s Travels) 中,尤其是 飞岛国(Laputa) 的章节,描述了一群沉迷于“抽象理论”的科学家:他们试图用数学公式计算“道德值”,用统计表格规划“思想生产”,甚至用几何仪器衡量诗歌的美学价值。

image.png

这些荒诞的情节,是斯威夫特以辛辣讽刺的笔法,批判了那种凡事都依赖数字与量化管理的思维方式。这种讽刺,某种程度上也映射了 17–18 世纪欧洲统计与科学热潮背后,部分知识分子过度追求形式化、脱离现实的问题。

当然,尽管“滥用数字”或陷入“唯量化论”的思维可能带来负面影响,但 追求对事物与事件进行清晰描述、努力实现可度量、可分析的目标,仍然是理性思考与科学精神的重要体现。这一点,尤其值得量化投资者借鉴:在复杂与不确定的现实世界中,“可度量”是通往有效决策的第一步,但也要警惕“为了量化而量化”的陷阱。

统计在量化中的应用

我中学时曾沉迷于《红色警戒》、《星际争霸》等这类策略游戏。这些游戏有着高度简化的规则与清晰的数字逻辑:建造造船厂需要 1000 金币,只要资源足够,它就会准时完工;经济产出提升 10%,系统便会精准地显示增长。

image.png

在那个虚拟世界里,一切都是明确的、可计算的、即时反馈的。玩家扮演着“统治者”的角色,需要规划资源、建造设施、指挥作战,这种体验看似与“治国理政”有着某种表面的相似性。

然而,现实世界却截然不同。现实中的治理与决策,面临的是复杂性、模糊性与不确定性交织的巨大挑战。这些特性使得现实远不如游戏那般直观与可控。所以,即便一个中学生能在游戏里游刃有余地“管理国家”,若真让他去治理一个真实国家或指挥一场现实战争,显然也是不现实的。

同样的逻辑,也适用于我们今天在量化投资等高度依赖数据的领域中所面临的挑战。在现实中,数据往往并非完美:它们可能受到采集方式、样本偏差、人为干预、信息滞后等多种因素的影响,导致统计结果并不总是精确可靠。

因此,我们引入统计思维,通过规范的数据收集、整理、分析与解释流程,从海量、复杂、甚至嘈杂的数据中,提炼出潜在规律,预测市场趋势,进而为量化策略设计、风险管理、投资决策等关键环节提供科学支撑。换句话说,统计思维的作用,正是将复杂的现实问题转化为可度量、可分析、可决策的对象。

正因如此,一个量化投资统计体系的质量——包括它的准确性、及时性、全面性与科学性——往往直接决定了量化投资能力的深度与成效。

三、总结

通过上述对统计学历史渊源、国家治理价值与现实挑战的梳理,我们深刻认识到:统计能帮我们应对复杂的现实问题,还能为科学决策提供有力支持。从国家治理到量化投资,“懂统计,才真正懂得如何治理”,同样,“懂统计,才具备了构建可靠量化策略的能力”

下次开始,我们正式迈入统计学量化实战篇,搞懂统计逻辑的实际用法。

最后一次编辑于 4天前 1

暂无评论