360 公司创始人周鸿祎日前应邀在哈佛大学第二十七届哈佛中国论坛发表演讲称,发展专业大模型可能是中国的一个巨大机会,所有企业都值得让专业大模型重塑一遍。
并谈到了开源大模型的发展。他认为,虽然现在开源模型的能力达不到 GPT 4。但是专注在一个方向上,用企业内部的专有数据加上专有工具进行能力的加强之后,它就有可能在专业能力上超过 GPT 4。
“我是一直相信开源的力量,至于说网上有些胡说八道,你们也别被他们忽悠了,说开源不如闭源好。一句话,今天没有开源就没有 Linux,没有 Linux 就没有互联网,连说实话的公司自己都是借助了开源力量才成长到今天。开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源只做了一年就已经超过了 GPT-3.5 的能力,所以我觉得未来一两年内,我认为开源的力量很有可能会达到或者超过闭源的水平。”
针对此前李彦宏所说的百度大模型已经超过了 GPT4 这一言论,周鸿祎则表示,李彦宏指的是在写古诗的能力方面。“前两天百度的李彦宏说他们超过了 GPT 4,然后王小川就不相信,他就出来怼李彦宏。其实你仔细听听李总说的有道理,他前面是说在写古诗方面。”
他还透露,360 做了一个在专业的安全攻防知识、安全攻击的自动发现能力上,远远超过了 GPT 4 的安全大模型。并欢迎有好的大模型技术的有志之士回国创业与 360 合作。
周鸿祎在此次演讲中还表达了以下观点:
- 人工智能不见得会淘汰某个人,到时候不用人工智能,不了解人工智能的人会被用人工智能的同行给淘汰掉。
- 不是只有Open AI一条路,Open AI相信 scaling law,对于更多的数据更大的模型增加更多的算力。模型越做越大,最后一定能突破超级强的智能。这条路中国也在走,但是需要点时间。
- 大模型并非只有做超级通用大模型一条路,除了越做越大,还能越做越小。大模型要上终端、上电脑,上手机、上汽车。
- 电脑进入了千家万户、百行千业,才引发了真正的工业革命。所以要把大模型拉下神坛,真正地和很多行业相结合,让很多企业真的能把大模型用起来。
- 企业里要找垂直的场景,要训练专业的大模型,未来在企业里、政府里不会只有一个通用的大模型在工作。
- 未来在企业内部不会只有一个专业大模型,可能会有数十个专业大模型在各自解决各自的问题,培养一个专项专家,而不是做十项全能,很多问题就迎刃而解。
- 做专业大模型,不需要万亿、千亿参数,几十亿、百亿的参数就能用,可能消费级的显卡就能用。这样成本就从原来的一个亿的小目标或者几千万降到了十万级或者百万级人民币,这个量级很多企业就真的用得起了。
- 现在很多创业者先做大模型,再去找场景,这个做法是不对的,用户要的并不是大模型,而是用解决了什么问题,用户要的不是一个钻头,是钻头钻出来的洞。
- 大模型创业,最重要的是找到明星场景、痛点场景、刚需场景,然后根据场景定义功能,再根据功能来训练专业的模型。
- 什么叫痛点刚需场景?找内部业务流程上、外部产品服务的体系功能上,有什么东西什么缓解能够利用人工智能加持,能够提高十倍的效率十倍的体验,或者降低十倍的成本,降低十倍的人力。
- 对很多创业者来说,实际上是产模一体,要先有场景,定义产品,然后由产品再来定义自己专有的模型。做企业级的专业大模型有巨大的创业机会。
- 中国可能会率先带来新的工业革命。中国现在传统行业门类最多,生产力、供应链最齐全,都在搞数转智改。所有的企业都需要让专业大模型重塑一遍,所有的工业级、所有的企业级软件都值得重写一遍。
- 现在的人工智能+实际上就是大模型+,不是做一个大模型,而是把大模型的能力真正赋能到各个传统行业里面去,发展潜能广阔。
此外,他还对公司的名字“360”进行了释义调侃:即 250+110,一群二百五想做网上 110。