题图由我司AI生成
一、时代的浪花
回首我囤第一批显卡的时候,还是2022年底,我记得那是一个暖冬,疫情还没有结束。
那个时候,chatGPT在国外已经开始火起来,逐步蔓延到国内。
作为在计算机、互联网领域奋斗了20多年的人来说,我当然是比普通人更早就关注这些消息了。
其实在chatGPT爆火之前,AI绘画已经有一些落地的东西,掀起了一点时代的小浪花。
大多数人不知道的是,其实人工智能是大学计算机本科的一门选修课。
开头就是教一些最简单的搜索算法,决策树,剪枝之类的,本质就是一个优化的穷举。
最早的人工智能,大部分人是觉得有点用,但是用处不大。
基本上处在整个计算机科学鄙视链的底端,毕竟计算机都是强应用的。
别人要听到你是搞人工智能的,他们会互相对视一笑,然后一言不发。
所以,人工智能这个学科,到现在都有一个不成文的规定,就是你搞出来的东西,必须能演示,不能演示,一律视为无效。
现代的人工智能,早就经过了至少三个阶段的飞跃,早就不是什么穷举法了,而且现在的人工智能中大量的数据,也不是前几年说的大数据。
说什么穷举法的,那是看的80年代的教材,用的是50年代的思想。
其实也不能怪这些人,因为国内的计算机教育实在是太落后了。
但是即使在现代的人工智能学派中,chatGPT也是一个绝对的异类。
Openai走的并不是谷歌那条路,也不是Meta那条路,和所有的都不同。
简单的说,就是大力出奇迹,把算力、数据、算法堆上去,智能居然就出现了。
在openAI内部,他们是早就知道这个结论,而且验证过了。
只是如何推向市场,用什么样的商业化方案,内部还是有分歧的。
就算你的产品做得再好,但是没有人知道,那也是不行的。
OpenAI当时其实选择了4个方案,有做机械手的,有用来打游戏的。
ChatGPT即使是在OpenAI内部,也是被强烈不看好的一个方案。
但是就是这个chatGPT爆火,让全世界都了解到了人工智能的巨大进展,开启了智能时代。
不看好的方向,不看好的项目,最终的结果却是爆火。
只能说,这一切,都是风云际会的结果,而不是被计划出来的。
即使到今天,很多人都不相信这个事实。
这样就可以了吗?这样就把自然语言处理解决了?
匪夷所思。
但是对于我来说,我还要等一件事情。
二、生产资料最低门槛
chatGPT后面,本质就是大语言模型。
但是你要训练一个大语言模型,少则几千万,多则几个亿。
如果是这样的话,只能说,确实是一个大风口,但是是一个和你没什么关系的大风口。
因为门槛太高,你没有那么多资源,没有那么多资金,也没那么多技术人员。
这个时代,风口是常常有的,但是大多数和你没什么关系。
当年,智能手机是一个风口,但是和你其实没多大关系。
你要做智能手机,开始就要一个亿的启动资金,就连罗永浩去啃,都没啃下来,自己还倒欠6个亿。
现在的电动汽车也是一个风口,但是依然和你没有什么关系。
造车这件事情,恐怕小米的雷总,都感觉到还挺吃力的。
从chatGPT 2022年11月30号发布,到2023年7月中下旬,估计国内搞AI创业的很多人都极度焦虑。
主要焦虑的是,人工智能是一个大风口,chatGPT的成功已经证明了这件事情。
但是,炼大模型太费钱了,到底是烧钱还是不烧钱?
我倒是没有焦虑。
因为人工智能学界还有一个传统,就是喜欢开源。
也许是被人质疑太多的缘故,他们不但喜欢做个东西出来演示,而且喜欢直接开源。
开源是什么呢?
就相当于把图纸、设计细节都给你,而且还给你一栋毛坯房。
你装修装修,就能住了,而且还可以再造一栋。
果然如我所料,在2022年底到2023年7月,就有不少开源的大模型放出来,但是规模都不是很大,效果也不是特别好。
到了2023年7月中下旬,有一个惊天的消息,Meta,就是Facebook发布了一个重量级的开源大模型llama2(llama是羊驼的意思)。
这个可是大公司集中了大量的顶尖人工智能专家,而且砸了无数的钱搞出来的。
几天之后,我记得就是去年第二次线下会前夕,我用一台显卡一般的电脑把llama2架起来了,是里面最小的一个模型。
Llama2是全英文的,我记得我问的第一个问题,是条顿堡森林战役。
当时显卡的风扇狂转,电脑卡的不行。
在这种算力的情况下,llama2回答问题是非常非常慢的,可以说是一个字要出好半天。
从图中可以看出,1个token相当于3/4个英文单词,约等于1个单词,基本上是2-10秒,才出一个单词,可见有多慢了。
尽管有上面说的一系列缺点,但是这就是历史性的时刻。
那个时刻,我只想到了四个词:生产资料。
当晚,一夜无眠,我看看旁边囤的显卡,说,你们可以派上用场了。
绝大部分人做不起来,往往不是自己不够努力,不够勤奋,而是缺乏生产资料。
而生产资料门槛最低的时刻,往往就是风口的初期,所有的系统都还没有那么大的时候,那个时候也是最容易获得的时候。
很久很久以前,还没有个人电脑,计算机是很贵,分为大型机、中型机、小型机。
就算是小型机,也不是一般家庭可以买得起的。
后来的个人电脑,在这个序列中,连小型机都不能算,只能算微机。
那个时候的计算机巨头,叫IBM,巨无霸一般的存在。
当艾伦.保罗看到美国大众电子杂志上发布了一款可以用于个人电脑的芯片,他就知道机会来了。
他告诉了比尔.盖茨,比尔.盖茨直接从哈佛辍学了。
有很多人说,比尔.盖茨后来是靠在IBM当董事的老妈,才拿到IBM的合同,从而发家的。
但是微软公司第一个产品,并不是后来闻名遐迩的Dos操作系统,而是Basic语言。
这个就是比尔.盖茨和艾伦.保罗两个人就做出来了。
没有这个产品,微软公司撑不到那个时刻,也没钱去买Dos系统。
对,Dos操作系统,是微软公司买的,而Dos操作系统最开始,就是另外一个公司,只用了一个人写的。
当然,当年那份杂志,还有一个人也看到了,那就是乔布斯。
乔布斯也就是2个人,就搞出了苹果I电脑。
这个就是生产资料容易获得的含义,几个人就能干。
硅谷之火传到中国后,求伯君一个人,就在酒店就写出了wps文字处理系统。
雷军,2个人,就是写出了一个杀毒软件。
你现在要搞什么wps,360杀毒软件,你可能1000个人都不够。
三、做一个生产者
这种生产资料容易获得的时刻,极其稀缺。
现在别人花了几个亿训练出来的模型,你搞台电脑就能用了。
开源大模型,你拿去卖,当然卖不上钱。
但是如果你是一个生产者,你就相当于省了几个亿,货真价实的几个亿。
Llama2就是人工智能界的“奶妈”,国内国外的很多模型,都是Llama2奶出来的,出现了大爆发。
按照很多人的理解,Meta的扎克伯格为什么这么好心呢?
不但免费,而且开源。
这说明你对经济学一窍不通。
你要是懂一点经济学就知道,那不是扎克伯格好心,而是因为竞争。
OpenAI领先,而Meta在这个领域已经落后,就不得不通过开源来获得更多的客户,从而形成生态。
就像智能手机,有封闭的苹果Ios操作系统,也有开源的安卓系统。
这个对于生产者是极为有利的,可以迅速获得生产资料。
作为一个生产者,你才能赚到钱,而不是消费者。
我知道,从2022年底到现在,有很多的人在做AI的培训。
有些人,以前都不知道是做什么的,看见AI火了,现在都开始搞AI培训了。
但是其中大部分,都类似于office培训,就是教你这个工具怎么用,那个工具怎么用。
这个本质是面向消费者的。
显然,我们是面向生产者的,而且培训只是我们整个体系中的一个很小的环节而已。
有些人可能会说,你怎么还卖课?你不是搞房子的嘛,怎么搞起人工智能了?
课与课是完全不同的。
牛哥是计算机科班出生,有二十多年的计算机和互联网经验,并不是什么半路出家的,而且是切切实实的拿出了作品的。
前几年,搞出了文明2现代化版本,现在在百度贴吧依然是有很多人赞誉。
贴吧里面就有人就说了,想不到一个搞房产的V,IT的功底这么深厚。
以我的眼光看来,这次对普通人是一个很大的机会。
因为AI攻破了自然语言处理,就是说,你不懂编程,不懂IT没有关系。
你只要懂你自己的业务,就可以用中文,直接做出很多东西了。
中文提示词,本质上就成为了一门新的编程语言。
以前,也有类似易语言这样的中文编程语言,但是本质上和英文编程语言的核心思想没什么不同,只是用中文来表达而已。
但是这次不同,这次是可以完全使用中文、英文来做很多工作。
这就等于首次给普通人开启了一扇大门,打开了一个新世界。
对,没错,就是首次,在这之前,你都还是要学编程的。
我们社群的人,这才几天,就做了一个东西出来:
四、结语
前面2篇文章,写的都是真正的干货,和广告根本没有关系。
有些人,就是很蠢,还自以为聪明,分不清好坏,分不清别人水平高低。
分不清什么是真正有价值,什么是割韭菜。
这种机会,你要一眼看出来,才是真水平。
我们布局之久,看得之深远,是在多年前就准备了。
有段时间,把公号都停了,就是因为这个机会太大了。
今天不过是回顾一下而已。
这个赛道,雪坡悠长,绝不会说是火几年而已。
很意外吧,这里没有广告,各位大聪明。
如果对你有启发,请点个关注或者“在看”吧。
老读者建议“星标”,没有任何互动,系统可能不会在第一时间推送给你。