题图由我厂AI生成
deepseek、智能涌现与无尽阵
一、大“赌”大赢
你要发财,有的时候,就是要敢“赌”,就是敢冒风险。
比如deepseek是不是风口,敢不敢“赌”?
比如现在买房子,将来会不会涨,敢不敢“赌”?
如果你要赢,那你就要有判断力,那么就要多学习,提升自己的认知,看得比别人要远。
当大部分人觉得这个东西成功概率只有30%的时候,你通过学习,掌握了远比别人多的信息和专业知识,你就可以把这个概率拉升到70%。
30%是大众看到的,40%是你自己通过努力学习,提升认知获得的。
那么你就能在大部分人觉得这个事情是低概率事件的时候,就做出判断,赢得先机。
在别人看来,你是在“赌”,但是在你看来,那是把握了“高概率事件”。
这个跟人工智能的算法是类似的,你要把握“高概率事件”,才能赢。
Deepseek的出现,扯掉了很多人的最后一块遮羞布。
有些人居然以为chatgpt 3.5是开源的,deepseek是在这个基础上改的。
你可以不懂人工智能,拜托你能不能百度一下?
你不会认为openAI里面带个open两个字,chatgpt3.5就是开源的吧?
就算你不想百度,你看看新闻,你也会知道马斯克经常怼openai,说它们是closeAI。
Chatgpt 3.5不开源,而且连发论文,都藏着掖着,不透露一点关键信息。
再不济,你可以看看我前面写的两篇文章,讲的已经很清楚了。
这些工作都不做,就是懒,就是不认真,完全是一个糊弄的态度,都谈不上说能力这回事了。
这种态度和认知,怎么指望你能赢?
难怪还多人输得连裤子都没有了。
你很努力,你敢赌,但是你判断力差,就是最后一把输光。
很多人研究人工智能,其实他并不是想从事人工智能这个行业。
他是想研究思维方式,从而提升他的认知,改造他的学习,这样他可以在其它的领域能获得洞见,获得比较大的成功。
人工智能的原理和人脑的原理并不一样。
人工智能是以算力作为基础的,本质是把电力变成算力,然后把算力变成智力的工程。
如果你觉得人脑和人工智能的原理一样,那么请1秒钟计算3.14159265的开方。
人脑并不善于计算,但是计算机可以很快算出来。
这个就好像一个是油车,一个是电车,都能跑,表面效果一样。
但是油车是烧的油,是化石能源,驱动靠的是热力学原理。
而电车,靠的是电池,驱动靠的是电学原理。
但是人工智能里面的很多原理,其实我们是可以借鉴的。
就像油车和电车的很多能量转换,有类似效果一样。
今天我们就讲一个神奇的概念:涌现。
二、智能涌现
涌现,并不是大模型出现之后才有的概念。
在凯文.凯利的《失控》一书中,就介绍了涌现的概念。
这可是1994年的书,已经是30年前的书了,但是思想非常前瞻,现在依然值得一看。
对于涌现,最粗略的概念,就是亚里士多德说的,整体大于部分。
比如说,有一个东西,由两部分组成的,这两部分都是1,你怎么加,都是2。
但是涌现不是这样的,是1+1>2,会多出来一个部分。
多出来的,是原来每个部分都没有的特性,这就说明涌现出现了。
怎么会这样呢?
涌现,实际上是自然界固有的现象,并非在智能领域才出现。
比如说,我们讲黑火药,配比是一硫二硝三木炭。
你只要按照这个配比,它就爆炸力惊人,这是硫磺、硝石、木炭都没有的特性。
典型的1+1>2了。
再说青铜,就是铜锡合金。
实际上,纯铜是紫红色,很软的一种金属,锡也是很软的一种金属。
但是,青铜,就很硬,可以做鼎,也可以做刀剑。
《周礼·考工记》记载:
六分其金而锡居一,谓之钟鼎之齐。
五分其金而锡居一,谓之斧斤之齐。
这里面的“金”指的是“铜”,就是说,铜和锡,6:1,可以做钟鼎,5:1,可以做斧钺。
这就是涌现出了铜和锡都没有的特性。
再说“钢”,其实指的是是含碳量百分比介于0.02%至2.11%之间的铁碳合金的统称。
如果是纯铁的话,其实比较软,也不锋利。
铁里面,含有一定碳,那么做出来的武器,就会特别坚固且锋利。
在古代,“削铁如泥”这件事情是存在的。
古人不知道这个原理,而且含碳量十分难把握,那么铸造的大量的刀剑,含碳量没把握好,就很脆。
但是,个别的刀剑,因为运气好,含碳量刚刚好,就可以对那些没做好的刀剑“削铁如泥”。
著名的大马士革钢,原产地其实在印度。
就是因为那个铁矿好,制作工艺刚好可以制作出钢来,那是当时的“核心机密”。
钢,体现了铁和碳都没有的特性,也是一种“涌现”的体现。
有一种涌现,是要数量非常非常多的时候,才会涌现出某种特性。
很多人喜欢用“量变引起质变”来做解释,其实这样讲太粗略了,像万金油一样。
数量多,也是要讲配比的,配比实际就是“结构”。
你配比不对,数量再多也没法涌现,就像钢的含碳量一样。
比如说你搞几万斤铜,再搞几万斤锡,你堆在一起,能变成青铜吗?
当然不行。
那么对于训练大模型来说,语料的配比,实际上是核心机密。
同样的语料,你配比不对,就没有什么效果。
那么智能的涌现呢?
这个就上面讲的整体大于部分,要稍微复杂一些。
比如说蜜蜂,每只蜜蜂都没有特别高的智能,但是蜜蜂是怎么躲过大灭绝时代,存活到现在的呢?
虽然每只蜜蜂没有太高的智能,但是蜂群则体现出很高的智能。
每只蜜蜂,它们只是按照几条简单的规则行事,但是在蜂群角度,就涌现出了复杂的行为和智能,就是凯文凯利说的“蜂群智能”。
同样,在市场经济中,就是买、卖、价格。
最简单的几个规则,则可以形成巨大复杂的市场,养活比原来多得多的人,超市里面商品琳琅满目。
这也是一种涌现。
openai就是发现了大模型的这种特性。
比如chatgpt 4o,它在回答的时候,并不是说openai给它喂了多少问题,它就回答多少问题,死记硬背,而是从来没有给它喂的问题,它也能回答。
这就是智能的涌现。
最典型的例子是,就是它会胡编乱造,这就是涌现的体现,只不过对人类来说是负面的。
当然,chatgpt4o这种预训练模型,涌现体现在直觉上,简单的说就是一步思考,也叫快思考。
deepseek r1这种推理模型,是多步思考中体现出了智能涌现。
就是著名的顿悟时刻,aha moment。
那么继续发展下去,谁也不知道会涌现出一个什么东西。
三、智能涌现的几个等级
智能的涌现,分为几个阶段:语言级,常识级,知识级,直觉级,推理级。
首先说语言级,就是大模型要学会说话,也可以做翻译。
这个看起来很简单,其实超级难,是世界级难题。
用传统计算机的方法死活搞不定。(比如符号主义的思路)
一句话,你按照主谓宾定状补这样的规则来框,是不够的。
语言的规律,太混杂了,千变万化。
比如说,小明今天买了个苹果,到底是水果还是苹果手机,还要结合上下文来看。
这个方面,大模型学的是最快的。
因为每个语料里面,都有各种语法、语义的规则,信息密度高,大模型很快就学会了。
Openai 的Gpt1大概就属于这个级别,开源的。
第二个,就是常识级。
花是红的,草是绿的,掉到河里是要淹死的。
比如说,小红和小明两人今天晚上去看了电影《哪吒2》,她觉得电影很好看。
那么,请问,这里的“她”指的是谁?
是小红。
其实完全有可能小红是男生,小明是女生,那么这里的“她”指的应该是小明。
或者两个都是女生,那么这里的“她”就有二义性了,可能是小红,可能是小明。
为什么是小红?
因为在常识里面,小红指的是女生,小明指的是男生。
这一切,源于你写小学作文的经历,常识。
这个就是常识,这种大模型学的是第二快的。
因为这种常识在语料中非常多。
多说一句,很多人其实就是缺乏常识。
Openai 的Gpt2大概就属于这个这个级别,开源的。
这个东西,看起来很神奇,但似乎用处不大。
第三个,知识级
就是各种学科的知识,比如物理化学数学历史代码等等。
这个就是知识级。
知识,是要建立来常识的基础上的。
很多知识,是默认你懂得常识的。
比如有的题目,里面有汽车和火车,但是题目有个隐含前提,就是火车比汽车跑得快。
你不懂这个,这题目就做错了。
有些偏远地区的小朋友,从来没坐过火车,就可能答错。
这不是他不够聪明,而是他没经历过。
《让我们荡起双桨》里面:
海面倒映着美丽的白塔,四周环绕着绿树红墙。
什么叫海面倒映着美丽的白塔,啥叫绿树红墙?
这其实是指北京的北海公园,你没去过,你完全搞不懂是啥。
以前小学生作文还写什么少年宫,很多人完全不知道,啥叫少年宫啊,没见过啊。
这都是小事,还有职场升迁的经验。
没人告诉你,你一开始就是错的,因为你们家没一个人在社会上做到一定位置。
偏远地区的小朋友和穷人的孩子,真的要额外付出太多的努力了。
大概到这个级别,就有些用处了,openai也不开源了。
第四个,就是直觉级,就是一步思考,也叫快思考。
比如一瓶20度的水和另外一瓶20度的水混合,是多少度?
这个里面就包含常识、知识和一步思考。
第五,就是推理级,这个就是多步思考,也叫慢思考。
就是把多步思考串联起来,就是deepseek目前做到的。
本质就是“思维片段”的空当接龙。
最后,我们说一下财富的涌现。
比如说,你有100套房,如果你采用一定的方法和资产配比的话,它体现出来的并不是100套房的价值,而是远高于这100套房的价值,而且会有自动增值的一些神奇特性。
房产无尽阵的最后一关,就是涌现。
一些大公司,为什么可以活那么久?
他们一直都有各种项目。
其实有些项目,他们是有规划的。
但是很多项目,他们在规划的时候,根本不知道,都是后面在做的过程中突然冒出来的。
就像我也不知道deepseek会突然这么火,你只要走在正确的方向上,各种奇迹会突然涌现出来。
四、结语
Deepseek的出现,就是一种涌现的体现。
Deepseek只是结果,不是原因。
这里面,肯定是有某种创新的机制在发生作用。
因为不只是deepseek做到了,还有阿里qwen,kimi 1.5,豆包也做到了。
你只要走在正确的方向上,你可能不知道一个东西什么时候会出现,甚至不知道会出现什么东西。
但是你知道,一定会出现。
------------------
牛厂长是真正的AI实战派,去年也确实带一些朋友赚到钱了。
那个时候deepseek还没火,现在看来,我们确实押赛道很准的。
目前社群已经有1000多人,往2000人冲刺了。
人越多,有人会技术,有人会销售,有人会设计,那么涌现的项目就会越来越多。
目前牛厂长是微博互联网总榜排名68名,快进前50了。
牛厂长的AI课,目前是399元,不贵,一顿饭钱。
其实已经涨价3次了,从100多涨到200百多,现在是399,后面还会涨价。
不要以为有课就是嘎韭菜,你要看讲课人的水平,是不是真的干事的人。
就像你要学降龙十八掌,请洪七公吃个烧鸡,别人还未必教你。
报名二维码在此,后面还会继续涨价:
我们会员是免费的,你也可以认为是买个会员,课是白送的一样。
加会员,报名后一定要加小助理的微信号进群:nymeria0。
进群的朋友,赠送的新手福利包,现在全部都是送算力,额度为2000算力,可以画2000张画和相应的对话。
如果对你有启发,请点个关注或者“在看”吧。
老读者建议“星标”,没有任何互动,系统可能不会在第一时间推送给你。