统计中的第一步到第十步
推荐: 【统计】【统计概览】(https://jb243.github.io/pages/1641)
Kim, S.K., Park, J.B. (2022) FESTBOOK 媒体。 979-11-92302-44-7 95410(第二版)
♣ ︎ 消息一 ♣
-
AlphaGo通过2016年一场历史性的围棋比赛出现在这个世界上。AlphaGo存在的意义在于,一是我们可以用黑匣子了解世界,二是我们可以用深度学习算法“缩写”我们周围的海量信息。
-
关于第一个含义: AlphaGo 之前的科学采取了基于卡尔波普尔反驳主义的基于假设的方法。然而,有了AlphaGo之后,你可以根据数据生成假设,根据数据验证假设,甚至不需要数据假设。例如,生物学以前被认为是一种以人类为中心的目的论研究,但由于生物信息学的出现,人们正在尝试将生物学解释为数据本身。
-
关于第二个含义: 当前信息生成的速度令人惊叹。经济学家发现,在不到 50 年的时间里,知识的积累速度将超过理解知识的速度。在这种情况下,远远超出人类感知的人工智能可能会围绕着一堆数据而诞生。需要一种“压缩”大量信息的算法来防止这种奇点,我们期望深度学习算法能够发挥作用。
-
AlphaGo 毕竟是海量的数据。在这种情况下,你需要学习统计学,这是一门处理数据的研究,为了帮助你,我总结了到目前为止的统计情况。
♣ ︎ 消息二 ♣
-
最后,似乎统计学中的一切都回到了贝叶斯定理。贝叶斯定理是一种计算给定观察结果的原因的概率或概率分布的方法。在这个世界上,一切事物都有因有果,我们的感知也遵循这个自然的方向。因此,根据观察到的结果来分析原因并不直观。然而,通过使用贝叶斯定理——利用原因的统计特性和从原因到结果的因果关系的概率性质——我们可以解决这个不直观的问题。世界似乎充满了结果,而原因往往仍然是猜测。例如,我们试图从人们的行为中推断出他们的心理状态,或者我们用过去来预测现在和未来。在更复杂的领域,我们从基因表达数据估计染色体异常,或从粒子物理实验推断亚原子粒子的存在。然而,了解原因对于做出更好的决策和发现更多因果关系至关重要——这就是为什么我们总是对原因感到好奇。因此,我相信对贝叶斯定理的深刻理解对于在这个复杂且不可预测的世界中生存是必不可少的。* 贝叶斯定理尽管很重要,但其数学形式却出人意料地简单。一旦理解了统计学的基本概念,掌握贝叶斯定理就不会太困难。然而,当你思考得越多,它就越能揭示出更深层次的意义。例如,某个原因的统计特性或概率分布到底意味着什么?这本身并不总是清楚的。有些人称之为物体的本质——就像一枚公平的硬币正面朝上或反面朝上的概率是 1/2 一样。这是频率派的观点。但实际上,我们几乎从未观察到如此完美平衡的概率。事实上,考虑到硬币的物理不规则性或不对称性,可以肯定地说概率“不”是 1/2。尽管如此,我们“相信”确实如此。这种信念驱动的概率解释是贝叶斯学派的立场。那么谁是对的呢?根据量子力学,观察行为本身就会影响实验结果,这意味着我们可能永远不会真正知道。即使这样一个简单的概念仍然只有部分被理解。
-
此外,如果你看一下这个公式,从因到果和从结果到因的方向之间似乎存在一种对称性。统计本身并不区分两者。但我们生活的现实世界清楚地区分了原因和结果——而且我们往往对原因更加好奇。就像时间根据熵定律从过去流向现在一样,尽管物理定律是时间对称的,我们世界中的事件也是从原因流向结果,即使贝叶斯定理表明存在数学对称性。贝叶斯定理中这种未解决的张力继续让研究因果推理的统计学家着迷。
-
除了这些哲学含义之外,贝叶斯定理在实践中也很重要。当我们缺乏对原因概率的先验知识或信念时,我们被迫仅依赖从原因到结果的统计特性,以便从结果推断原因。在这种情况下,我们假设原因存在均匀先验分布,这称为最大似然估计 (MLE)。另一方面,当我们确实有足够的关于原因的先验信息时,我们可以通过将结果与从原因到结果的统计属性进行同等权衡来从结果中推断出原因。这称为最大后验估计 (MAP)。在我们甚至不知道结果分布的情况下,我们使用称为“变分分布”的替代方法来尽可能接近真实分布。在这种情况下,贝叶斯定理使用 证据下界 (ELBO) 和 Kullback-Leibler (KL) 散度 来表达。这些概念是信息论和机器学习的核心。例子还包括统计测试中p值均匀分布的假设,或者基于逻辑推理的下一代人工智能系统如何使用分类先验而不是统计先验——这些都是贝叶斯定理在高级统计理论中的代表性应用。
-
本书涉及统计学的基本概念。但由于这些思想的组织如此连贯,读者将能够清楚地看到贝叶斯定理(尽管其公式很简单)如何出现在统计学的各种背景下。作者希望这能帮助读者更进一步了解我们所生活的世界的深层奥秘。
--- _输入:2022.09.12 23:13_ _编辑:2023.11.03 20:48_ 小时>小时>