瑞见——瑞鹏行研

最后的半子

瑞鹏资产戴胜蓝

（一）

机器学习先驱者Rich Sutton在2019年发表了《苦涩的教训》，Rich Sutton认为，从长远来看，对AI的训练使用通用计算方法往往比直接灌输人类经验知识的特定方法更加有效。

它揭示了过去人工智能研究中的一个关键误区：过度依赖人类设计的特定领域知识和规则，而忽视了通用计算和大规模学习的长远深度和力量。

后来，《苦涩的教训》被OpenAI的工程师们奉为“圣经”。

结合AI的发展历史，从早期的专家系统，到SVM及其核方法，再到深度神经网络，以及现在的大语言模型，工程师们已逐步认知到这个教训，走出误区。

（二）

1934年10月，由于王明、博古等同志“左”倾冒险主义的错误领导，加之外部敌强我弱，中央革命根据地第五次反“围剿”遭到失败，红军第一方面军(中央红军)主力开始长征。

但在出发之前，没有人明确知道该往哪儿走、走多远、走到何时休。只是基本确定向西与红二、六军团会合。

年轻的教员同志因受到排挤，差点没有被允许加入长征队伍。

在一路反复的战术错误之后，中央红军付出了极其惨重的代价，从长征出发时的8.6万人锐减到3万余人。

1935年1月，中央政治局在遵义召开了扩大会议，将教员同志增选为中央政治局常委，并以其杰出的远见和正确的主张被认可为新的领导人。

但更严峻的问题又来了。

敌人40万重兵已在长江沿线布下，势要将中央红军围困，彻底一锅端。

（三）

《苦涩的教训》强调，从长远来看，依靠大规模计算和通用学习方法的AI系统将更具优势。这使系统不受限于特定领域的规则和知识，能够通过海量数据和自我优化，不断提升自我性能。

早期的AlphaGo结合了人类棋谱数据和深度学习、蒙特卡罗树搜索算法——它是依赖人类专家经验和策略知识进行训练的典型成功案例。2016年，AlphaGo击败了世界围棋冠军李世石，展示了人类知识结合机器学习的强大能力。

DeepMind的二代产品AlphaZero，完全不依赖任何人类玩家的数据或先验知识，只利用深度神经网络来预测每个游戏状态的价值和最优行动，然后通过自我对弈的方式进行训练，利用强化学习算法不断优化策略。

在比AlphaGo更短的训练时间内，AlphaZero在包含围棋在内的各种棋类游戏中都取得了超过AlphaGo在围棋领域的成绩。

并且AlphaZero所使用的训练数据量远小于AlphaGo。

语音识别技术最早起源于20世纪50年代的美国贝尔实验室，过去的语音识别训练依赖于手工设计的特征提取和规则，结合隐马尔可夫模型等统计方法。

这类训练需要工程师们预先对语音特征和语言模型的深入理解和设计，效率非常低下。

现代语音识别系统采用深度学习，通过大规模数据训练、卷积神经网络和循环神经网络，完全脱离工程师对语言模型的手工特征设计。当前的语音识别系统可以在上百个语言和环境下流畅运行，且显著提升了识别准确率和适应性。训练效率指数增长。

急功近利的自动驾驶厂商将自动驾驶的训练依赖于人工设计的规则和特征，如路径规划、雷达和传感器数据处理等。这类自动驾驶技术在简单和受控环境中非常有效，但在复杂和动态环境中可能造成未知后果。

长期主义的自动驾驶厂商通过深度学习模型进行端到端训练，从大量驾驶数据中自动学习驾驶行为和环境理解。长期来看，这类训练将有望推动自动驾驶系统在处理几乎所有道路环境中交出完美答卷。

……

未来，是通用大模型的天下。

人类积累数百万年的知识，可能抵不过大模型毫秒级的运算决策。

AI的发展也越来越不需要人类。

（四）

如果通用大模型可以通吃一切，那么站在时间延长线上看人类当下的文明史，依靠人类经验和知识快速成长的垂直AI，是否会成为伪命题？

短期内，垂直细分领域的AI应用通过整合人类的知识和经验，能够迅速取得显著成果。在特定领域，这类AI系统可以在有限的任务范围内表现得非常出色，如医学影像分析、工业自动化、量化交易等。

由此可见，垂直细分领域的AI仍然具有价值，因为它们可以快速解决实际问题，带来直接收益。有收益才能吸引更多的人才进入，才能反哺通用大模型的训练。

但从长期来看，依靠通用大模型的AI系统的确会表现出更强的适应性和效率，这与《苦涩的教训》观点一致。

随着技术、算力和清洁能源的发展，通用模型的优势将越来越明显。

AI研究和应用需要在短期收益与长期潜力之间找到平衡，才能推动技术和应用的更优结合与迭代。

伟大的马克思主义哲学早就解释了这一段AI发展史：“量变与质变、辩证与统一”。

（五）

我不知道AI怎么看世界，但从数理上说，世界一定程度上是一个随机性和波动性的组合，宇宙也是。

在量子物理中，基本粒子的行为表现出本质的随机性。

这意味着，即便我们知道所有的初始条件，也无法精确预测一个量子系统的未来状态。

从更大尺度去看，现代宇宙学模型一直在试图研究宇宙中暗物质和暗能量的作用，以及宇宙的加速膨胀现象，其底层逻辑都是想要解释宇宙在大尺度上的动态变化和不确定性。

人类处于这样一个狭小的三维空间中，几乎没有任何对抗宏观尺度随机性和波动性的能力，只能在相对平整的安全时间周期中生存、繁衍。

依靠碳基生物自身的条件和有限的生命时长，想要去搞清楚微观粒子或宇宙尺度的随机性和波动性，我看不到任何可能。

世界本身的随机性就是对人类文明进步甚至生存的最大干扰。

但是超级通用人工智能可以处理和过滤大量的干扰和波动，找出隐藏在背后的模式和规律，或许将大幅度提升人类处理复杂问题的能力，帮助人类更好地理解和应对复杂系统中的不确定性和波动性。

长远来看，这是否必将强化我们面对未知事件的脆弱，增强文明长久生存的概率？

坦白说，我对此并没有信心。

因为超级通用人工智能的出现，本身就是一件巨大的随机性和波动性事件。

当人类面对一个毫秒级运算就能碾压你所有知识的强大存在，还有何胜算？

（六）

尽管迄今为止无人知晓造物主的动机和设计机制，但好在这位伟大的神并未像设计其他抽象物体一样设计人类。

遵义会议之后，中央红军只有16个团、3.5万人。而敌军调集了中央军薛岳兵团和黔军全部，滇军主力和川、湘、桂军各一部，总兵力达到150个团、40万人。

川黔地区地形复杂，山高水深，对于机械化几乎为零的中央红军来说，交通条件险恶万分。

此外，中央红军面临粮食、药品和武器弹药等物资的极度短缺，无从补给。

遵义会议后，如何团结内部力量、制定正确战略、巩固领导地位、重塑革命信念，更是摆在教员同志面前无比棘手的难题。

绝境之下，教员同志展现出了超凡的军事才能和智慧。通过巧妙的战略布局和灵活机动，不断变换作战方向，充分利用地形和敌情，隐藏真实意图，迷惑、牵制敌军，打乱其部署，选择有利于己方的战场进行战斗，夺取战略主动。

最后，教员同志打出了震古烁今的“四渡赤水”战术，一举将红军带离绝境，前往陕北甘南地区建立新的革命根据地，至此展开了中国革命运动波澜壮阔的新画卷。

新中国成立后，面对越过三八线的美军，面对国内一片畏战之声，面对中美两国实力的巨大差距，教员同志高瞻远瞩，力排众议，人民志愿军义无反顾奔赴前线，迎击来犯之敌。

1950年，美国GDP约为3000亿美元，中国250亿美元。

美国钢产量8700万吨，石油5.4亿桶，中国钢产量60万吨，石油3万桶。

美国参战3000辆坦克，1500架飞机，外加11艘航母、大量驱逐舰和巡洋舰。中国仅有100辆坦克，200架飞机。

美国有强大的后勤保障、先进的补给和医疗体系、快捷且强大的海空运输、投送能力。中国只有少量卡车和纯人力。

在当时，没有任何国家看好人民志愿军取得胜利。

我相信，再强大的通用大模型，面对这样的战前数据对比，也不会做出“出兵”的决策，更不会预测人民志愿军将取得最后的胜利。

同样，再“毫秒级”的人工智能也打不出“四渡赤水”战术。

（七）

人类似乎有一个特别的法宝，能在绝境中爆发不可思议的力量。我找不到合适的词语概括，暂且就叫它“Humanity（人性）”吧。

凭借坚韧的意志和不灭的希望，“人性”总能在绝境中熠熠生辉，唤醒深度隐藏的勇气、魄力、胆识、信念与力量，如破晓的晨曦，如凛冬的暖阳，如旱地的甘霖，如黎明的曙光，指引个体走向新生。

古今中外，这样的案例其实有很多。

人性，可能是人类文明最底层、最深邃的奇迹。

通过复杂的情感学习算法，人工智能未来一定可以模拟和表达类似人类的情感反应：快乐、悲伤、愤怒等，甚至可以与人类进行复杂的互动，表现出同理心、幽默感和“社交情商”。

但真正的人性不仅仅是行为的表现，还涉及底层的复杂意识、信念和情感。

即使超级人工智能最终完全“复制”了你，但这种“复制”依旧是基于统计和概率，而不是基于真正的情感、意识、信念、伦理。更甚，超级人工智能同样可以做出某些“道德”决策，但这些决策依旧是基于预设的规则和参数，而不是基于真正的道德观念或情感判断。

“人性”的赋予，是造物主的恩赐。

凭借“人性”的超强傍身，人类依旧有希望在某些时刻的对弈上胜机器半子。

（八）

克里斯托弗·诺兰的《星际穿越》，其实就是一部人性与万物对弈，并最终胜出的电影。

面对人类生死存亡之抉择，老迈的Brand博士选择隐藏自己的人性，宁背一世之骂名，也要给绝境中的人类强行刷出一个PLAN B选项，哪怕潜在的代价是放弃地球上现有的所有人类，包括他自己。

同时，老头儿不断地告诉世人：

Do not go gentle into that good night（不要温和地进入那个良夜）,

Old age should burn and rave at close of day（暮年也应在黄昏时燃烧咆哮），

Rage, rage against the dying of the light（怒斥吧，怒斥光明的消逝）。

文绉绉的太绕口，白话翻译：

纵临逆境，莫失人性。

当Doctor Mann降落在一个冰冷、不宜居、表面常年覆盖着冻雪和液氨、环境极其恶劣的星球上时，为了逃离，Mann伪造数据，损毁机器，持续冬眠35年，终于等到重返地球的机会。

当Mann与空间站对接失败，引发爆炸，Cooper毫不犹豫启动引擎，加速追赶。机器人Tars立即劝阻，Cooper一个字母都听不进去，立刻命令Tars分析永恒号的旋转状态，接下来二者展开了本片中最为精彩震撼的对话：

Tars: Cooper, there is no point using fuel to chase…

Cooper: Analyze the Endurance’s spin（分析永恒号的旋转状态）.

Cooper: Get ready to match our spin with the retro thrusters（利用反向推进器让我们跟永恒号实现同步）.

Tars: It’s not possible.

Cooper: No…it’s necessary.

Tars可以瞬间分析出永恒号的旋转状态，可以瞬间拟合出一条追击路线，可以瞬间跟踪每一块碎片的飞行路径以作最优躲避策略，也可以完成高速旋转引起的离心力状态下的完美对接，但它始终无法理解——

为什么要去追那个空间站？

机器只会做出当下最优的选择，它无法理解“人性”被激发出强大意志力和信念后“不可理喻”的操作。

Cooper与Tars共同完成的这次向死而生的Docking，才有了人类最终的生存机会。

在绝境时刻，只有最硬核的情感、信念、意志、对家人不弃的爱，才敢于勇闯绝境。

或许，在看到Cooper带着女儿Murph误入NASA的那一刻，Brand博士心里就已经有了最优的宇航员人选——

他一定可以带领我们完成任务。

（九）

Brand为团队凑齐了星际穿越之旅的最后拼图：人性。

我穿越引力，跨越光年，追逐了几个星系，只为回到你的身边。

（十）

机器不会了解，“半子”不是一个可以模仿的程序或行为。

而是一种精神，一种信仰。

瑞见——投资人说

2024年07月08日

瑞见——动态

2024年07月08日

瑞见——动态

2024年07月08日

瑞见——投资人说

2024年07月08日

瑞见——动态

2024年07月08日

瑞见——投资人说

2024年07月08日

浏览次数：1086

发布时间：2024-07-08