AI协助探索AI新构型的自动化创新概念

news/2025/1/31 12:30:43 标签: 人工智能

训练AI自生成输出模块化代码,生成元代码级别的AI功能单元代码,然后再由AI组织为另一个AI,实现AI开发AI的能力;用AI协助探索迭代新构型AI将会出现,并成为一种新的技术路线潮流。

有限结点,无限的连接形式,也是实现一种复杂性的方式。扩展结点、增加参数,是另一种外延式的实现复杂性的方式,这种方式,也可以看作是有限结点、动态连接形式,是等效的,当连接权重置值0,就相当于连接消除,连接构型中相当于没有这个连接。两者概念的区别是:后者这种形式的动态连接形式,是区域限定的,是在有限域上的动态,“有限域”的概念是,连接形式是在搭建模型时,初始连接形式作为一个域,是框架限定的,权重置0的连接,是在这个“有限域”的初始模型连接形式范围内的消除剪枝。进一步思考,当模型训练到一定程度后,能否引入一个迭代机制,重新跳到第一步,把模型的初始连接构型按某种规则,在训练到一定程度的模型基础上,扩展重置初始构型,这样设想的目的,把“有限域”扩展为模型自己探索的“动态域”,简单地说,预训练到一定程度的模型,按某种尝试、奖励机制,自动探索扩展初始连接构型,重新开始一轮新的训练。模型自己按某种尝试、奖励机制,自动化探索扩展初始连接构型,中间肯定会产生很多垃圾构型,那就自动淘汰,模型自动化探索扩展的初始连接构型,训练后的识别效果或收敛效率参照其前一个状态,如果退步则淘汰,如果更优则覆盖,也可以理解为AI模型自己探索设计AI模型,升级方向总是以自身效果为参照,如果AI自己会自动化升级,那是一种智能形式。AI自动化升级的一种形式是,在训练过程中调整参数的权重;现在思考,探索和扩展AI自动化升级的方式,AI自动化升级的另一种形式,除了调整参数,是否让模型可以自己探索新构型。

生物神经系统的进化,从最简单到人类复杂的大脑,这个进化是连接构型扩展的过程;而对一个既定的个体,则是连接构型框架定了以后,参数权重升级的过程。生物神经系统,就明显有两个升级模式,从最简单到人类复杂的大脑,既有结点的扩展,也有链接构型的扩展。比较大象、海豚、鲸鱼的大脑和人类大脑,神经元数量在一个量级,这里面的差别,主要是构型的差别,结点规模效应的差别不是主要,可以认为是一样的。

知识蒸馏的概念不同于模型蒸馏的概念,模型蒸馏是对模型进行压缩,而知识蒸馏是对训练数据资源进行压缩。知识蒸馏的预训练模型例子说明,知识A:人是会死的。知识B:苏格拉底是人。知识C:苏格拉底会死。三个知识,知识A、知识B、知识C可以压缩,进行知识压缩,即所谓知识蒸馏,压缩为知识A、知识B就包含了前面ABC的完整信息。互联网上的海量数据,进行知识蒸馏压缩,可以得到最核心的原子级知识,这个信息池也许不大,所以训练的计算量不需要很大,然后从这些元级数据可以形式化为无穷无尽的知识。设计一个压缩验证模型,就是给它一大堆的数据,让他输出尽可能小的数据集,这个小数据集可以包含输入的全部信息数据。比如,给它输入,知识A:人是会死的。知识B:苏格拉底是人。知识C:苏格拉底会死。三个知识,它会推出这里面内含的知识冗余,然后自动化的剪切掉冗余数据。


http://www.niftyadmin.cn/n/5838663.html

相关文章

玩转大语言模型——使用langchain和Ollama本地部署大语言模型

系列文章目录 玩转大语言模型——使用langchain和Ollama本地部署大语言模型 玩转大语言模型——ollama导入huggingface下载的模型 玩转大语言模型——langchain调用ollama视觉多模态语言模型 玩转大语言模型——使用GraphRAGOllama构建知识图谱 玩转大语言模型——完美解决Gra…

AI DeepSeek-R1 Windos 10 环境搭建

1、安装: 下载 Python |Python.org CUDA Drivers for MAC Archive | NVIDIA pip 和virtualenv Download Ollama on Windows 如下图 2、下载模型 deepseek-r1 ollama run deepseek-r1 或者可以ollama run deepseek-r1:8b 或 3、安装一个可视化对话Chatbox 下载 …

代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III

老师讲这是树形dp的入门题目解题思路是以二叉树的遍历(递归三部曲)再结合动规五部曲dp数组如何定义:只需要定义一个二个元素的数组,dp[0]与dp[1] dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节…

SpringBoot AOP 和 事务

SpringBoot 整合 AOP 动态代理技术 JDK 动态代理 JDK 动态代理是 Java 自带的一种代理方式。它要求目标类必须有接口,基于这个接口,JDK 在运行时会动态生成一个代理对象。这个代理对象和目标对象就像 “拜把子” 的兄弟,因为它们都实现了相同…

arm-linux-gnueabihf安装

Linaro Releases windows下打开wsl2中的ubuntu,资源管理器中输入: \\wsl$gcc-linaro-4.9.4-2017.01-x86_64_arm-linux-gnueabihf.tar.xz 复制到/home/ark01/tool 在 Ubuntu 中创建目录: /usr/local/arm,命令如下: …

如何构建树状的思维棱镜认知框架

在思维与知识管理中,“树状思维棱镜”通常指一种层级式、可多维度展开和不断深入(下钻)的认知框架。它不仅仅是普通的树状结构(如传统思维导图),更强调“棱镜”所体现的多视角、多维度切换与综合分析的能力…

简易计算器(c++ 实现)

前言 本文将用 c 实现一个终端计算器: 能进行加减乘除、取余乘方运算读取命令行输入,输出计算结果当输入表达式存在语法错误时,报告错误,但程序应能继续运行当输出 ‘q’ 时,退出计算器 【简单演示】 【源码位置】…

宇宙大爆炸是什么意思

根据宇宙大爆炸学说,宇宙间的一切都在彼此远离,而且距离越远,远离的速度越快。我们只能在地球上观察这种现象,而我们观察到的速度符合如下公式,其中 为哈勃常数, 为距离, 为速度(…