人工智能生成假设，想法的开始

推荐文章：【哲学】【AI哲学索引】(https://jb243.github.io/pages/482)

a. 【数理逻辑题】(https://jb243.github.io/pages/2205)

“探索就像通过问路来找到路一样；它包括提出问题、回答问题、发现下一个问题，然后回答这个问题，这是一个连为一体的过程。” ——马克斯·佩鲁茨

最近，我在苏黎世联邦理工学院进行了最后一次面试。从现在来看，最终的录取率似乎在50%左右。超越空间换位的时空换位技术就在我眼前，他们问我怎么做解释这个数据。那时，“假设生成人工智能”这个关键词出现在我的脑海中。这个话题引起了强烈的反响，但我认为这对他们来说可能是深奥的，甚至对我来说也是难以承受的。

事实上，通过数据生成假设是我从我工作了两年多的公司获得的见解。药物研发有时是一场长达10年以上的马拉松，很多药物在最后阶段遇到意想不到的临床试验结果而失败。因此，该公司尝试了智能药物开发策略，根据临床试验结果反向生成假设来构建故事。因此，从数据中创建假设的方法对我来说并不陌生，我认为在ChatGPT时代，人工智能也可以产生假设。

当我思考“假设生成人工智能”的想法从何而来时，似乎是从论文“超越 RG：从参数流到度量流”（Strandkvist, C. et al）开始。这是一个具有挑战性但非常有趣的从高维参数生成理论的数学理论。

图 1. 基本术语

图 2. 感兴趣问题的数学表示

仔细思考这篇论文，随着数据维度的增加和可解释性的降低，我创建假设生成人工智能的计划似乎不仅仅是一个幻想的故事，而是一个真正可行的未来。因此，我实际上开发了一种机器学习算法，尝试建立假设并测试各个方面，以找到真正有效且合适的假设。

我目前关注的具体问题如下：

“有六颗珠子，大小形状都一样，其中三颗重，三颗轻。不过，三颗重珠的重量相同，三颗轻珠的重量也相同。现在，用两盘天平秤三次，将珠子分成重珠和轻珠。”

有以下考虑：

○ 机器学习代码分为生成策略和验证策略的部分。> ○ 使用天平秤的比较方法总是以3对3、2对2、1对1为一组进行。这是因为在其他情况下很难获得有效信息。关于如何定义通过与天平秤比较所获得的“信息”，人们进行了很多思考。事实上，可以用概率或代数的方式来定义这样的“信息”。 (ref) 然而，目前受限于我的能力，我决定积极利用通过与天平尺度比较而捕捉到的“缩小可能性”的充要条件，优先考虑组合思维。

○ 给定策略和平衡规模比较结果的可能大重量组的组合被定义为潜在大重量组。这里，不仅有 1 个潜在重集的情况，而且有 0 个潜在重集的情况也被认为是有效的，因为有必要避免由于完全不相关的信息而拒绝真正有效的策略。

现在，让我们通过多次试验和错误来完成创建和验证策略的代码。

⑴ 3 vs 3 给定信息如 (1, 2, 3) ＞ (4, 5, 6), (1, 2, 4) ＞ (3, 5, 6), (1, 2, 5) ＞ (3, 4, 6)，输出潜力重集

受保护_0

⑵ 3 vs 3 (1, 2, 3) vs (4, 5, 6)，(1, 2, 4) vs (3, 5, 6)，(1, 2, 5) vs (3, 4, 6)的策略，输出每个潜在的重组

受保护_1

⑶ 3 vs 3 (1,2,3)vs(4,5,6),(1,2,4)vs(3,5,6),(1,2,5)vs(3,4,6)的策略，检查是否总是输出0-1个潜在重组

受保护_2

⑷ 3 vs 3 结论1. 比较3 vs 3 3次时，检查是否存在适用于所有情况的有效策略：无

受保护_3

⑸ 2 vs 2 给定信息如 (1, 2) ＞ (4, 5), (1, 2) ＞ (3, 5), (1, 2) ＞ (3, 4)，输出潜力重集

受保护_4

⑹ 2 vs 2 (1, 2) vs (4, 5)、(1, 2) vs (3, 5)、(1, 2) vs (3, 4)的策略，输出每个潜在的重组

受保护_5

⑺ 2 vs 2 (1, 2) ＞ (4, 5), (1, 2) ＞ (3, 5), (1, 2) ＞ (3, 4) 的策略，检查是否始终输出 0-1 个潜在重集

受保护_6

⑻ 2 vs 2 结论2. 当比较2 vs 2 3次时，检查是否存在适用于所有情况的有效策略：无

受保护_7

⑼ (1, 2, 3) vs (1, 2, 3) 结论3. 验证在进行3次任意平衡尺度比较时是否存在针对所有情况的有效策略：无

受保护_8

我找不到答案，于是查阅了各种案例，获得了重要的见解。事实上，解决方案不应该构建为同时游戏但作为顺序游戏。比如答案如下，我之所以没有进一步开发代码纯粹是因为_我的一时兴起_。

回答

⑴ 将编号 1 至 6 分配给给定的 6 个球。

⑵ 步骤1. 将(1, 2) 与(3, 4) 进行比较。

⑶ 情况 1. (1, 2) > (3, 4)

① 重球组合

○ (1, 2, 3)

○ (1, 2, 4)

○ (1, 2, 5)

○ (1, 2, 6)

○ (1, 5, 6)

○ (2, 5, 6)

② 步骤 2. 将球 3 与球 6 进行比较

③ 步骤3. 根据步骤2的结果，使用以下不同的策略。

○ 3 > 6：不采取进一步行动，决定 (1, 2, 3)

○ 3 = 6：比较球 4 和球 5，在 (1, 2, 4 ), (1, 2, 5 ) 之间唯一做出决定»> ○ 3 < 6：比较球 1 和球 2，在 ( 1 , 2 , 6), ( 1 , 5, 6), (2 , 5, 6) 之间做出唯一决定

⑷ 情况 2. (1, 2) = (3, 4)

① 重球组合

○ (1, 3, 5)

○ (1, 3, 6)

○ (1, 4, 5)

○ (1, 4, 6)

○ (2, 3, 5)

○ (2, 3, 6)

○ (2, 4, 5)

○ (2, 4, 6)

② 步骤 2. 将 (1, 3) 与 (2, 5) 进行比较。

③ 步骤3. 根据步骤2的结果，使用以下不同的策略。

○ (1, 3) > (2, 5)：比较球 4 和球 5，以在 (1, 3, 5 ), (1, 3, 6), (1, 4, 6) 中唯一决定

○ (1, 3) = (2, 5)：比较球 1 和球 2，在 ( 1 , 4, 5), ( 2 , 3, 6) 之间唯一决定

○ (1, 3) < (2, 5)：比较球 3 和球 6，在 (2, 3 , 5), (2, 4, 5), (2, 4, 6 ) 中唯一确定

错误答案。 从 3 vs 3 开始：步骤 1 将可能性减少到 10，并在 步骤 2 中，分为 3、3、 4，但在步骤3中，无法确定4部分

⑴ ** 将编号 1 至 6 分配给给定的 6 个球。

⑵ 步骤 1. 将 (1, 2, 3) 与 (4, 5, 6) 进行比较。根据对称性，我们可以假设 (1, 2, 3) < (4, 5, 6)。重球的组合如下。

① (1,4,5)

② (1,4,6)

③ (1,5,6)

④ (2,4,5)

⑤ (2,4,6)

⑥ (2,5,6)

⑦ (3, 4, 5)

⑧ (3,4,6)

⑨ (3, 5, 6)

⑩ (4, 5, 6)

⑶ 步骤 2. 将 (1, 4) 与 (2, 5) 进行比较。

⑷ 步骤3. 根据步骤2的结果，使用以下不同的策略。

① 如果情况 (1, 4) > (2, 5)：重球的组合只有 (1, 4, 5 ), (1, 4, 6), ( 3 , 4, 6)，所以将球 3 与球 5 进行比较。

○ 3 > 5: (3, 4, 6) 是重集

○ 3 = 5: (1, 4, 6) 是重集

○ 3 < 5: (1, 4, 5) 是重集

② 如果 (1, 4) < (2, 5)：重球的组合只有 (2, 4 , 5), (2, 5, 6), ( 3 , 5, 6)，所以将球 3 与球 4 进行比较。

○ 3 > 4: (3, 5, 6) 是重集

○ 3 = 4: (2, 5, 6) 是重集

○ 3 < 4: (2, 4, 5) 是重集

③ 当(1, 4) = (2, 5)时：重球的组合为(2, 4, 6)，(3, 4, 5)，(1, 5, 6)，(4, 5, 6)，因此不可能通过鸽巢原理通过一次比较唯一确定它们。（失败）

这些代码是在ChatGPT 4.0上完成的，从简单的案例开始到泛化（参见低维→高维）。即使只向 ChatGPT 提供这样的历史记录，也期望可以执行类似的试错来为类似类型的问题建立最终的问题解决策略。就好像几个像 ChatGPT 这样的 LLM 组合成一个级联控制电路可以成为一个生成假设（策略）的 AI。

作为七大数学问题之一，P vs NP 问题意味着“推广数学问题的解决”也可以是一个数学问题。随着ChatGPT的压倒性性能和即时工程的出现，如果能够建立解决数学问题的通用方法(即合适的开/闭串/并行控制电路)，假设生成AI、策略生成AI的实现可能就不远了。为了建立这样一个通用的方法论，有必要了解我们的集体智慧是如何组织的，这与我想要追求的道路是一致的。然而，上述解决方案的缺点是它过于覆盖所有可能的情况。 AlphaGo 克服了围棋这种具有绝大多数可能性的游戏中下棋的模式，AlphaFold2 和 RFDiffusion 能够基于生物物理学背景知识显着降低模型复杂性，从而创建高性能人工智能。为了更明智地提出假设，似乎有必要提出一些方法，不要从早期阶段就痴迷于所有可能的情况。

就在写完这篇文章两个月后，即 12 月 14 日，谷歌 DeepMind 的一篇论文发表在《自然》杂志上。该论文认为，通过巧妙地集成大型语言模型（LLM），可以创造新的知识，而不仅仅是将模式与现有知识进行匹配。

FunSearch：DeepMind 用于创造新知识的模型

概述： 引入 FunSearch，一个用于创建新知识的功能（即在功能空间中搜索）。
原理： 进化学习
组成： 法学硕士用作提出创意想法的组成部分。包括评估器以防止幻觉（错误知识的产生）。
性能： 为复杂的数学问题（例如数论中的上限集问题）和搜索算法问题（例如在线装箱问题）提供最先进的解决方案。

2024 年 8 月，一款名为 The AI Scientist 的人工智能问世，它通过生成假设来撰写端到端论文。不久之后，ADAS 也在类似的背景下推出。

输入：2023.10.07 02:18

7379

人工智能生成假设，想法的开始

results matching ""

No results matching ""