(资料图片)
中新网北京8月9日电 题:周鸿祎:让通用大模型“走下神坛”,真正进入千家万户
中新财经记者 夏宾
ISC2023第十一届互联网安全大会9日在京召开,会议期间,360集团创始人周鸿祎在接受中新财经等媒体采访时直言,通用大模型热了一阵之后,大家都在反思通用大模型存在的一些问题。
图为360集团创始人周鸿祎在第十一届互联网安全大会期间接受中新财经等媒体采访。 主办方供图。在周鸿祎看来,通用大模型涉及的问题有两个方面。一是要真正打造一个超强的“全知全能”的大模型所需要的算力和训练成本都非常高,这对于中国市场而言还需要一点时间。
二是通用大模型对普通用户使用起来并不太友好,需要用户变成一个提示词或者指令专家,在中国要发展大模型,现阶段从国家政策来看,仍应围绕产业数字化这一战略来发展大模型。
“所以看通用大模型,我提出来走垂直化、产业化、专业化、企业化之路。因为在企业发展过程当中,有非常多的小场景比较适合大模型,垂直化、产业化的大模型选择的场景相对小切口,对于能力要求不一定那么强。”周鸿祎解释说,这甚至有点像偏科生,不一定要求综合能力很强,如果做这样的大模型,难度反而会降低,而对于企业来说可承受的成本代价包括交付时间,也会减少很多。
周鸿祎透露,360正在训练数字安全大模型,基于其庞大的网络安全大数据,现在要补上真正的深度学习的大语言模型能力,让它从数据大脑真正变成智慧大脑。
他认为,在安全领域,未来还会有各种各样的垂直类大模型,就可以解决不同问题。如果垂直类大模型不需要用千亿或万亿模型,可能用百亿、十亿、几十亿模型,这样模型的整个训练时间、调试成本、部署成本等大概会比GPT的成本低百倍以上,如此才有可能让大模型“走下神坛”,让大模型赋能百行千业、走进千家万户,才能真正掀起新一轮工业革命。(完)