国产AI大模型研发终于进入“骂街”阶段

作者:梁应杰

经过一段时间的沉寂,因为的出现,国内互联网又恢复了往日的生机,连“激情互怼”的戏码也搬了出来。

在阔别舞台中心一年半后,搜狗前CEO王小川吹响了进军大模型的号角,成立百川智能,一口气接受了包括36氪、品玩、甲子光年、腾讯《深网》等在内的多家头部科技媒体的专访,一顿强力输出,不惜豪言“年底要做出国内最好的大语言模型”,把自己逼到了墙角。

熟悉王小川的人都知道,这位理工“直男”很喜欢表达,聊嗨了百无禁忌。他曾在《十三邀》里点评高圆圆和汤唯,认为前者成绩太差,后者成绩虽然一般,但身上有很多闪光,并不介意娶她。

这事后来还引发了网友的“讨伐”,最终以王小川解释和道歉收场。

这次被王小川点名的不是女明星,而是老对手李彦宏。有媒体问:“如何看待李彦宏此前所透露的,百度文心一言和的差距是2个月”这一观点,他回复:“采访的可能是平行世界的李彦宏,不是我们这个世界里的。”

20年的恩怨

言下之意,李彦宏不仅吹牛,还吹大发了——按照王小川的计算和业界普遍的分析,中美大模型的差距在两三年。这事王小川原本可以直说,甚至圆滑点,拿业界普遍观点搪塞过去,但这就不是王小川了。

很快,百度集团副总裁、搜索平台负责人肖阳出来回应了一大段话,嘲笑了王小川脱离一线太久,对国内人工智能技术缺乏了解,顺便还翻了旧账:“当年搜狗也立志取代百度搜索,结果也是显而易见的。所以很难评价,那我祝他成功吧。”

这一巴掌直接打出去20年。那会儿王小川刚毕业不久,被张朝阳招入了搜狐,布置了个艰巨的任务:“给你六个人头,灭掉百度。”颇有李云龙攻打平安县城的气势。11个月以后,名字取自电影《大腕》的“搜狗”搜索正式上线。

可惜张朝阳不是李云龙,王小川手里也没有足够的“意大利炮”,对准百度轰是轰了,造成不了实质性伤害。后来兜兜转转,搜狗下嫁给了阿里,最后卖给了腾讯,王小川隐退江湖。

对于自己一个清华高材生,为什么没能竞争过一个北大高材生,王小川曾有过总结:“我比李彦宏技术好,只是没有他命好。”

连李彦宏本人都不怵,何况是手下人,针对肖阳的回复,王小川也不客气:“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人。”

这其实算客气的,当初他怼起来更狠,什么“如果百度能和谷歌一样有创新和远见,搜狗就直接投降了”“如果自己身在百度,百度的情况应该会比当时好一丢丢”,句句直戳李彦宏的肺管子。

那么,过去1.5年,王小川在干嘛? 

一路“卷”过来的天之骄子

据王小川自己介绍,他回归老本行,做数学研究了,希望用数学模型解决生命科学的难题。数学恐怕是王小川除了搜狗外的挚爱,这次复出,有媒体问他怎么看待大模型的竞争,他还拿奥赛举例。这位“天之骄子”也是一路卷过来的。

1990年,12岁的王小川以入学考试第一名的成绩进入成都七中的综合数学实验班,班级里同学的数学成绩没有低于95分的。这些同学包括,B站CEO陈睿、腾讯COO任宇昕、前滴滴研究院院长何晓飞等。

和这帮学霸竞争,王小川丝毫不落下风。三年后,他凭借全国数学联赛一等奖再次被保送进成都七中高中部。一年后,他加入了中科院院士张景中的三人小组团队,用吴文俊消元法,首次在微型机下完成初等几何命题的全部证明。

这项工作让他获得了亿利达青少年发明奖,有幸和诺贝尔奖得主杨振宁以及时任副总理的李岚清见面。据说,李岚清当时问了他一个问题:“你一分钟能打多少字?”后来,互联网江湖常拿这事调侃,认为王小川研发搜狗输入法是冥冥之中的事。

王小川和杨振宁

李岚清视察成都七中

输入法也是搜狗和百度的另一场鏖战,战况刚好和搜索颠倒,王小川和团队取得了压倒性胜利,只不过和搜索的市场相比,输入法市场的体量实在太小。

王小川对人工智能的探索也始于搜狗时期,他说现在搜狗就有12000块GPU在为AI服务,70%做的是推理,无论是搜索还是输入法,都建立在自然语言处理上,所以他和团队做语言大模型有经验和优势。

拿到亿利达青少年发明奖不是王小川的终点,不久他就和队友拿下了国际信息学奥林匹克金牌和团队第一。队友中有个叫陈磊的,就是现任拼多多的CEO。这个奖项也直接让王小川进入清华大学计算机系。

20世纪90年代末那会儿,互联网方兴未艾,计算机方面的人才紧缺。1999年,王小川见到了“归国三人组”陈一舟、周云帆和杨宁,当时他们正在运行一个叫ChinaRen的社区项目,给还在上学的王小川开出了8000元一个月的薪资,那会儿差不多可以在北京买下3平方米。

之后ChinaRen被如日中天的搜狐收购,张朝阳一眼看中了王小川这个小兄弟,放话:“你上学多久我可以等你,你要多少钱我给你开。”事实证明,动不动就变“霸总”的查尔斯张看人比唱歌更准。

卖掉ChinaRen的陈一舟也没闲着,一路创立了猫扑、人人网,成功收购了王兴、王慧文他们创立的校内网。在王小川前,王慧文和他的“光年之外”是非大厂里做大模型声响最大的。

通用人工智能的时代到了

卖掉搜狗后,王小川曾在接受《中国企业家》采访时感慨:“我的性格里有一面,是对世事变化懒得应对近乎迟钝。”但看到ChatGPT横空出世,他立刻表现出了“扶我起来试试”的决心。

在接受“甲子光年”采访时,他表示,自己可能是第一个将ChatGPT定性为AGI的人,而不是业界谨慎判断其是“AGI的曙光”。

AGI实际上就是AI中间加了个G,英文General(通用)的首字母,翻译过来也就是“通用人工智能”。这个词其实带着点人类的无奈:AI本身就是人类希望机器有朝一日能像人一样思考,但经过一段时间的研究,大伙发现一步到位太难了,只能让机器在某个领域,像是视觉、自然语言等方面智能化,因此通用,也就是“啥都能会”的人工智能被视为AI研究皇冠上的明珠。

科幻电影《机械姬》剧照

说是明珠,也就是听上去好听,看上去很美,相当长时间里,AGI有点像科幻概念,相信的人屈指可数,直到GPT-3.5的出现。

2016年,AlphaGo完成了对围棋的挑战。许多人觉得这就是机器比人更精于计算,是天经地义的,“再说了,下围棋再厉害对我的工作有什么影响?”但现在,AI能写诗、写论文、写文案、算算数、画画、生成视频,连人类具有难度的考试也不在话下,很多普通人第一次感受到被AI支配的恐惧。

很早就在研究自然语言的王小川也一激灵。他说人和动物的核心区别就是语言,哲学家维特根斯坦说过“语言的边界就是世界的边界”。

换句话说,在黑暗中摸索了那么多年,AI突然就摸到人类世界了。闭关修炼中的王小川心头一震,沉声低语:“强人工智能的时代来了。”

都还没站上起跑线

当然,无论是真的相信,还是随大溜,大模型这座高峰底下现在已经挤满了中国互联网的精英们。对标ChatGPT,继3月份百度的文心一言发出第一枪后,4月至今,阿里的通义千问、商汤科技的日日新、360的360智脑、昆仑万维的天工3.5、知乎的知海图AI等密集亮相。

这还不包括已经有明确消息还没发布的,以及两三年前就涉足大模型研发,至今还没推出成熟产品的。不得不说,博大精深的中文给予了中国AI大模型起名极大的空间。

上述这些之外,还有达观数据的“曹植”,用的是“七步成诗”的典故;网易下面还有“玉言”,很容易联想到“金玉良言”;华为用的是“盘古”,澜舟科技叫做“孟子”;腾讯的“混元”倒是契合大模型到一定规模后的“涌现”现象,类似的还有中科院的“紫东太初”,“太初”指的是天地未分前的那团混沌元气,算是“混元”的祖宗……

推广搜狗输入法时,王小川没少跟网址导航打交道,最初是一个叫hao123的,后来被百度收购,还有就是取自“不管三七二十一”的3721,后来卖给了雅虎,创始人就是周鸿祎。

周鸿祎和王小川也有一段不太美好的交集。当时张朝阳有意出售搜狗,正在吭哧吭哧挖百度墙角,轰轰烈烈进军搜索行业的周鸿祎是最热情的买家。结果王小川不认同周鸿祎的经营理念,两次出手搅和,一次成全了阿里最后卖给了腾讯,气得周鸿祎给张朝阳甩下一句话:“搜狐姓王不姓张”。

最近这些年,360和周鸿祎也成了被拍在沙滩上的前浪,越来越力不从心,尝试多元化,又是元宇宙又是造车,都没什么水花,去年迎来上市以来的首次亏损,超过24亿。看到ChatGPT,老周的眼睛又亮了。

在3月29日的“2023数字安全与发展高峰论坛”上,他就把自家的大模型拉出来遛了一下,倒很谦虚,“‘刚出生的孩子'抱出来给大家看看。”

另一边的股民也很热情地随了大笔份子钱,带着三六零的股价直冲20元。过去两个月,搭上ChatGPT,三六零暴涨了200%以上。但股民也没想到,随礼随出了个“父母离异”,4月4日,周鸿祎突然和恩爱多年的妻子胡欢离婚。

中国大模型暂时没追上美国,但中国概念股在涨幅和“狗血剧”上还是狠狠扳回了一城。这也属于中国互联网创新的一大特色和常备剧情。

回到王小川和李彦宏(百度)的口水仗,中国大模型能不能在一两个月内追上美国,这是和尚头上的虱子。但王小川想争的可不是这个,他代表的是中国一批试图成为和挑战OpenAI的非大厂创业公司,当然也是后者给了他们勇气,在AGI时代挑战那些不可一世的巨无霸。

有意思的是,之前李彦宏被问到“中国创业公司里会不会再出一个OpenAI?”时,他的回答是“基本不会了”,还强调“没有必要再重新发明一遍轮子。”周鸿祎也曾劝小公司不要淌这趟浑水,在他眼里,360还在大厂序列里。

可偏就有王小川、王慧文、李开复这些不信邪的,轮子不仅要造,还得轰轰烈烈。实际上在国外,挑战OpenAI的也创业公司有人在,其中就包括由OpenAI离职人员创立的Anthropic,被视为OpenAI的最大挑战者。最新消息显示,最早投资OpenAI的马斯克也创立了AI公司X.AI。.0也远不是人类终局。

关于这点,旷视科技联合创始人印奇说得比较实在,未来得看一家公司,无论大小,先把性能对标GPT-3.5的大模型真的做出来,这是所有事情的起点。

所以,别看这两个月国内科技公司恢复了久违的激情,热闹了半天,小脸通红、一身臭汗,最后发现彼此都还没站在起跑线上。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此网站受reCAPTCHA和Google隐私权政策服务条款适用。

Scroll to Top