DEV Community Grade 7 10d ago

Cognizant AI Labs 副总裁 Risto Miikkulainen谈神经演化（Neuroevolution）与进化AI（Evolutionary AI）

在这期 Eye on AI 的播客中，主持人 Craig Smith 采访了德克萨斯大学奥斯汀分校教授、Cognizant AI Labs 副总裁 Risto Miikkulainen 。访谈围绕神经演化（Neuroevolution）与进化AI（Evolutionary AI）展开，深入探讨了其核心原理、优势、应用场景以及为何它是AI未来的重要方向。以下是访谈内容的详细总结：一、什么是进化AI与神经演化？与传统AI（梯度下降）的区别 [ 03:55 ] ：传统AI ：如当前主流的大模型和深度学习，通常基于梯度下降（Gradient Descent）。它依赖一个单一的智能体，通过计算梯度，一步步、平滑地朝着已知目标进行优化。即使在强化学习中，探索也是为了寻找梯度的方向。进化AI ：是一种基于群体（Population-based）的方法 [ 04:27 ]。它不是只有一个智能体，而是同时派出30个、100个甚至上千个智能体，尽可能广泛地散布在解决方案的空间中。变异与重组（Recombination）[ 04:54 ] ：进化AI不只是做微小的梯度调整，它会把两个在不同空间、具备不同能力的优秀智能体进行“重组/交叉”，从而在解决方案空间中实现跨越式的“大跳跃” 。这种机制让搜索范围更广，具备极强的探索性。核心特质：创造力与惊喜 [ 02:32 ] ：Risto 指出，进化AI最迷人的地方在于它能带来“惊喜”。它能发现人类完全没有输入进去的、意料之外的聪明解决方案。在进化计算会议上，经常能看到进化AI取得超越人类设计者的成果 [ 05:41 ]。二、演化算法的分类与规模化（Scale）突破访谈中提到了进化计算的几种不同流派和架构： NEAT 算法 [ 01:15 ] ：这是 Risto 早期与学生 Ken Stanley 开发的经典算法。它的特点是非常鲁棒、易于运行，不仅能优化权重，还能自动演化出神经网络的拓扑结构/架构 [ 07:21 ]。但它通常适用于几千到几万个参数的相对小型网络。神经架构搜索（NAS）[ 07:43 ] ：将演化与深度学习结合。用进化算法来寻找最顶层的架构（如 Transformer、卷积网络的层数、激活函数、损失函数等），而底层的权重依然靠梯度下降来训练。数十亿参数的突破：进化策略（Evolution Strategy, ES）[ 10:21 ] ：传统上，人们认为演化算法无法处理当今大模型数以亿计的参数，因为随机变异太难凑巧对上了。但 Cognizant AI Labs、牛津大学和 NVIDIA 等机构近期取得突破：利用进化策略（ES）可以直接在参数空间（而不是行动空间）中进行优化 [ 10:36 ]。它的工作原理 [ 11:52 ] ：它不进行“重组/交叉”，而是围绕当前最优解建立一个局部的智能体“云/群体”，评估其表现，然后朝着表现最好的方向（或平均好方向）整体移动。Risto 团队已经成功利用这一方法对开源大模型（如 Qwen、Llama）进行了微调（Fine-tuning） [ 12:42 ]，甚至目前正在探索完全“从头开始”用演化进行预训练 [ 13:24 ]。三、为什么它在股票交易中表现优异？（以 AlphaArena 为例）多样性与独特性 [ 20:43 ] ：主持人提到在金融交易的 AlphaArena 竞赛中，一个神秘模型（被猜测使用了神经演化技术）击败了所有人。Risto 解释说，在股票市场中，如果你和大家用同样的数据、做同样的梯度优化，学到的策略就是一样的，很难赚到钱。寻找“垫脚石” [ 21:54 ] ：进化算法通过“新颖性搜索”（Novelty Search）和 “质量多样性”（Quality Diversity）机制，会去刻意奖励那些“与众不同”的方案。它能发现人类无法预料的、独特的交易策略。四、神经演化的未来：结合神经科学攻克行业难题 Risto 认为，当下的 LLM 架构在一些根本问题上遇到了瓶颈，需要通过演化AI并借鉴神经科学来解决：持续学习（Continual Learning）与元认知（Metacognition）[ 25:22 ] ：当前的 AI 容易产生“灾难性遗忘”，且“不知道自己不知道”（胡言乱语）。以“海马体”为起点的实验设计 [ 29:51 ] ：Risto 建议不要一开始就让 AI 去啃人类最高级的“语言”功能，而是应该从神经科学研究最透彻的海马体（Hippocampus）和记忆/空间导航系统开始。设计一个简单的动物导航和物品记忆环境，用演化算法去寻找能够实现“记忆从海马体转移到大脑皮层”[ 30:28 ]、具备持续学习和内省能力的复杂神经回路。语言的演化 [ 32:44 ] ：在更长远的未来，随着算力的提升，可以在复杂的虚拟世界中放进大量智能体，让他们通过演化自发地产生沟通、语法和语言。五、现实世界中的决策应用：从疫情到商业演化AI不仅能演化权重和架构，还能演化代码（遗传编程）和商业决策策略 [ 20:16 ]。新冠疫情决策系统 [ 51:04 ] ：Risto 的团队曾开发过一个用于“非药物干预”的决策系统（如是否关闭学校、戴口罩、追踪接触者）。他们利用全球不同政府的多元化数据进行训练。成功案例：该系统在冰岛得到了应用，他们通过学术联系人将模型预测和场景模拟提交给了冰岛卫生部甚至总理，并被采纳 [ 52:32 ]。 CEO 决策副驾驶（Copilot）[ 54:59 ] ： Cognizant AI Labs 目前正在大力推进多智能体系统（Multi-Agent Systems） [ 43:57 ]。他们正在构建供企业使用的决策原型。当 AI 给出营销预算分配、物流规划或临床试验设计等建议时，它能立即预测出该决策带来的后果（如经济成本与收益）。决策者（如 CEO）还可以手动修改 AI 的决定，并实时看到变化，从而通过直观的对比建立对 AI 最佳方案的信任 [ 56:19 ]。六、行业观察与新书推介学术界与工业界的协同 [ 46:17 ] ：Risto 认为现在的 AI 发展得益于工业界和学术界的开放交融。工业界有强力的资金和算力资源，能把系统做出来；而 academia（学术界）即使缺乏工程师，也能更自由、更具创造性地去探索一些目前技术上还不可行、但面向未来的前沿架构 [ 47:08 ]。新书与社区建设 [ 37:31 ] ：Risto 与来自 Sakana AI 等机构的行业同仁共同撰写了一本关于神经演化的权威教科书（类似于强化学习领域的 Sutton & Barto 经典教材）。除了历史概述和前沿进展（如神经演化与 LLM、生成式AI、生物学的结合），他们还同步推出了 GitHub 社区、数字资源和代码 Demo，旨在为该领域建立一个共同的基础并吸引更多人才。

在这期 Eye on AI 的播客中，主持人 Craig Smith 采访了德克萨斯大学奥斯汀分校教授、Cognizant AI Labs 副总裁 Risto Miikkulainen。访谈围绕神经演化（Neuroevolution）与进化AI（Evolutionary AI）展开，深入探讨了其核心原理、优势、应用场景以及为何它是AI未来的重要方向。以下是访谈内容的详细总结：一、什么是进化AI与神经演化？ - 与传统AI（梯度下降）的区别 [03:55]： - 传统AI：如当前主流的大模型和深度学习，通常基于梯度下降（Gradient Descent）。它依赖一个单一的智能体，通过计算梯度，一步步、平滑地朝着已知目标进行优化。即使在强化学习中，探索也是为了寻找梯度的方向。进化AI：是一种基于群体（Population-based）的方法 [04:27]。它不是只有一个智能体，而是同时派出30个、100个甚至上千个智能体，尽可能广泛地散布在解决方案的空间中。变异与重组（Recombination）[04:54]：进化AI不只是做微小的梯度调整，它会把两个在不同空间、具备不同能力的优秀智能体进行“重组/交叉”，从而在解决方案空间中实现跨越式的“大跳跃”。这种机制让搜索范围更广，具备极强的探索性。核心特质：创造力与惊喜 [02:32]：Risto 指出，进化AI最迷人的地方在于它能带来“惊喜”。它能发现人类完全没有输入进去的、意料之外的聪明解决方案。在进化计算会议上，经常能看到进化AI取得超越人类设计者的成果 [05:41]。二、演化算法的分类与规模化（Scale）突破访谈中提到了进化计算的几种不同流派和架构： - NEAT 算法 [01:15]：这是 Risto 早期与学生 Ken Stanley 开发的经典算法。它的特点是非常鲁棒、易于运行，不仅能优化权重，还能自动演化出神经网络的拓扑结构/架构 [07:21]。但它通常适用于几千到几万个参数的相对小型网络。 - 神经架构搜索（NAS）[07:43]：将演化与深度学习结合。用进化算法来寻找最顶层的架构（如 Transformer、卷积网络的层数、激活函数、损失函数等），而底层的权重依然靠梯度下降来训练。 - 数十亿参数的突破：进化策略（Evolution Strategy, ES）[10:21]： - 传统上，人们认为演化算法无法处理当今大模型数以亿计的参数，因为随机变异太难凑巧对上了。 - 但 Cognizant AI Labs、牛津大学和 NVIDIA 等机构近期取得突破：利用进化策略（ES）可以直接在参数空间（而不是行动空间）中进行优化 [10:36]。 - 它的工作原理 [11:52]：它不进行“重组/交叉”，而是围绕当前最优解建立一个局部的智能体“云/群体”，评估其表现，然后朝着表现最好的方向（或平均好方向）整体移动。Risto 团队已经成功利用这一方法对开源大模型（如 Qwen、Llama）进行了微调（Fine-tuning） [12:42]，甚至目前正在探索完全“从头开始”用演化进行预训练 [13:24]。三、为什么它在股票交易中表现优异？（以 AlphaArena 为例） - 多样性与独特性 [20:43]：主持人提到在金融交易的 AlphaArena 竞赛中，一个神秘模型（被猜测使用了神经演化技术）击败了所有人。Risto 解释说，在股票市场中，如果你和大家用同样的数据、做同样的梯度优化，学到的策略就是一样的，很难赚到钱。 - 寻找“垫脚石” [21:54]：进化算法通过“新颖性搜索”（Novelty Search）和“质量多样性”（Quality Diversity）机制，会去刻意奖励那些“与众不同”的方案。它能发现人类无法预料的、独特的交易策略。四、神经演化的未来：结合神经科学攻克行业难题 Risto 认为，当下的 LLM 架构在一些根本问题上遇到了瓶颈，需要通过演化AI并借鉴神经科学来解决： - 持续学习（Continual Learning）与元认知（Metacognition）[25:22]：当前的 AI 容易产生“灾难性遗忘”，且“不知道自己不知道”（胡言乱语）。 - 以“海马体”为起点的实验设计 [29:51]：Risto 建议不要一开始就让 AI 去啃人类最高级的“语言”功能，而是应该从神经科学研究最透彻的海马体（Hippocampus）和记忆/空间导航系统开始。设计一个简单的动物导航和物品记忆环境，用演化算法去寻找能够实现“记忆从海马体转移到大脑皮层”[30:28]、具备持续学习和内省能力的复杂神经回路。语言的演化 [32:44]：在更长远的未来，随着算力的提升，可以在复杂的虚拟世界中放进大量智能体，让他们通过演化自发地产生沟通、语法和语言。五、现实世界中的决策应用：从疫情到商业演化AI不仅能演化权重和架构，还能演化代码（遗传编程）和商业决策策略 [20:16]。 - 新冠疫情决策系统 [51:04]：Risto 的团队曾开发过一个用于“非药物干预”的决策系统（如是否关闭学校、戴口罩、追踪接触者）。他们利用全球不同政府的多元化数据进行训练。成功案例：该系统在冰岛得到了应用，他们通过学术联系人将模型预测和场景模拟提交给了冰岛卫生部甚至总理，并被采纳 [52:32]。 CEO 决策副驾驶（Copilot）[54:59]： Cognizant AI Labs 目前正在大力推进多智能体系统（Multi-Agent Systems） [43:57]。他们正在构建供企业使用的决策原型。当 AI 给出营销预算分配、物流规划或临床试验设计等建议时，它能立即预测出该决策带来的后果（如经济成本与收益）。决策者（如 CEO）还可以手动修改 AI 的决定，并实时看到变化，从而通过直观的对比建立对 AI 最佳方案的信任 [56:19]。六、行业观察与新书推介 - 学术界与工业界的协同 [46:17]：Risto 认为现在的 AI 发展得益于工业界和学术界的开放交融。工业界有强力的资金和算力资源，能把系统做出来；而 academia（学术界）即使缺乏工程师，也能更自由、更具创造性地去探索一些目前技术上还不可行、但面向未来的前沿架构 [47:08]。 - 新书与社区建设 [37:31]：Risto 与来自 Sakana AI 等机构的行业同仁共同撰写了一本关于神经演化的权威教科书（类似于强化学习领域的 Sutton & Barto 经典教材）。除了历史概述和前沿进展（如神经演化与 LLM、生成式AI、生物学的结合），他们还同步推出了 GitHub 社区、数字资源和代码 Demo，旨在为该领域建立一个共同的基础并吸引更多人才。 Top comments (0)

Read on DEV Community ↗ ← Back to News

Cognizant AI Labs 副总裁 Risto Miikkulainen谈神经演化（Neuroevolution）与进化AI（Evolutionary AI）

Comments