中国首批12款人工智能大模型拿到入场券

《财经》杂志   2023-09-01 06:13:53

作者 | 《财经》记者 刘以秦 研究员 郑可书 编辑 | 谢丽容

通用大模型的陆续开源、开放使用,意味着先发者和后来者差距进一步拉大——用户每一次互动都是在给大模型"喂"新的数据,后来者的竞争门槛会明显提升

8月31日,包括百度文心一言、智谱清言、商汤SenseChat等多款大模型应用终于拿到了监管部门颁发的首批入场券,可面向普通个人用户提供服务。这是一个关键节点,今年年初开始的大模型公司终于可以在国内向个人用户开放。


【资料图】

监管部门对大模型服务提供商颁布的许可备案以地域划分。

北京首批有5家大模型通过《生成式人工智能服务管理暂行办法》备案,分别是百度的文心一言、抖音的云雀、百川智能的百川大模型、AI公司智谱旗下的智谱清言以及中科院的紫东太初。

上海、广东等地也有大模型产品获批上线。商汤、上海人工智能实验室的书生大模型和此前已经开放应用Minimax就是属于上海备案。腾讯、华为属于广东备案。科大讯飞星火大模型和阿里云通义千问大模型也宣称完成备案。上述获批大模型企业共计12家。多数企业官宣了这一消息,但抖音、腾讯相关负责人均向《财经》表示,关于大模型的备案和开放应用暂无相关回应。

截至目前,手机应用商店可以下载的是文心一言和智谱清言,商汤SenseChat和百川智能均仅限网页端使用。《财经》对比三款应用(文心一言、清言和SenseChat)发现,文心一言的数据库相对更新,数据截止到2022年,2023年的部分信息也能回答出来。智谱清言数据库则更新到2021年。

如果提问"最近一周发生了哪些大事",文心一言回答了多条一个月前(2023年7月)发生的大事;智谱清言表示无法回答,这是因为训练数据中没有相关信息;商汤SenseChat则回答了三条分别在不同年份(2013年、2016年、2023年)的事件。

《生成式人工智能服务管理暂行办法》于2023年8月15日施行,要求提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

《财经》获悉,相关公司在其属地的有关部门进行备案,各属地部门自行选择发布时间,备案门槛不高,后续还会有更多大模型公司完成备案。

从最初规划的许可制转变为现在的备案制,意味着大模型面向公众个人的服务门槛是下降的。但这个行业的进入门槛却在事实上提升了——用户每一次互动都是在给大模型"喂"新的数据,后来者的竞争门槛会明显提升。

现在向个人开放晚不晚?

目前已经上线的几款大模型均是面向普通个人用户的免费试用客户端,包括文心一言、智谱、商汤等。目前尚不确定其他已备案公司是否也会针对C端发布免费应用。

国内的大模型厂商此前大多发力点在面向企业的B端市场,包括向企业用户提供大模型的基础能力,提供算力资源,或是要做垂直大模型等。逻辑很简单,其一,未经监管部门备案许可无法效仿ChatGPT先行向个人用户开放使用;其二,面向企业的B端市场商业模式更加清晰。

最新估值290亿美元的OpenAI在发布ChatGPT时就是首先向个人用户开放使用,一位接近OpenAI的人士告诉《财经》,OpenAI的策略是先通过C端应用,短期内覆盖足够多用户,以实现教育市场、抢占市场占有率的目的。此外,用户量越多,大模型获得的反馈和新数据也越多,能帮助测试其效果和能力,有利于进一步优化,才能在B端实现商业化。

不过,一个众所周知的事实是,大模型语言应用成本高昂,海量用户的涌入,会直接导致成本直线上涨,这主要是算力消耗成本。今年初,ChatGPT每天的运行成本约10万美元,到了今年4月,半导体研究公司SemiAnalysis首席分析师Dylan Patel称,OpenAI每天运行ChatGPT的成本可能高达70万美元。

高昂的成本也带来高收益。OpenAI在C端布局的效果明显,今年4月,OpenAI完成103亿美元融资。近期OpenAI已经推出企业版ChatGPT,后续还将推出定制化数据库的分析工具。

高昂的算力消耗成本恐怕是所有入局者不得不考虑的重要因素。截至发稿,百度、阿里、科大讯飞、商汤、智谱、百川等多家公司均未回应《财经》是否会长期延续面向普通个人免费策略。

一位大模型行业人士告诉《财经》,相关公司都在不断调整优化自己的大模型,还没到"成熟"阶段,开放C端应用也是一次检验的机会。尤其是对于创业公司来说,如果可以吸引到大量用户,也有助于后续融资。

文心一言于2023年3月16日发布,此后进入小范围面向个人的内测和企业用户申请使用阶段。这次,除了向社会个人全面开放文心一言,百度相关负责人告诉《财经》,百度的策略是多条腿走路,百度旗下的各类用户侧产品都在用大模型重构,包括百度搜索、百家号、百度文库、输入法等,将陆续推出相关AI功能;另外,面向B端的策略也相当重要,企业用户可以通过千帆大模型平台官网调用文心一言能力。

百度文库已经上线了基于大模型的"AI做PPT"创作功能,百度称,开放12小时后,已经有超过100万人次体验。在面向企业的B端市场,百度已经和一些企业完成了第一期应用场景共创。

智谱AI、百川智能、Minimax都是新一轮AI大模型浪潮中的代表性创业公司。智谱AI成立于2019年,核心团队是清华系背景,目前已完成四轮融资,最新一轮是2023年7月拿到了美团的投资。百川智能成立仅四个月,由前搜狗公司CEO王小川创立。

Minimax成立于2021年,共披露三轮融资,最新一轮是2023年6月由腾讯投资。去年10月,Minimax就曾上线过一款聊天应用Glow,当时还没有相关备案要求。另一家AI公司聆心智能于2022年12月也上线了聊天应用"AI乌托邦",后升级为"AiU",是与智谱AI深度合作的产品,目前也能正常使用。

竞争进入下半场

今年年初,OpenAI和一系列美国科技公司在大模型上动作密集,给了中国科技圈和创投圈一次极大的刺激。多位业内人士向《财经》表达了共同观点:在通用大模型领域中国公司的竞争相对同质化,算法都是基于Transformer,数据均来自开源数据集和爬虫数据。算力方面会有一些区别,大厂本身就有算力积累,也有实力购买或租用更多算力。但是头部的创业公司们在今年也拿到不错的融资,算力方面不会差很多。

一位深度测试过GPT4、文心一言、Minimax和智谱的企业用户告诉《财经》,他对比发现,GPT4的整体效果优于其他三家,如果GPT4是100分,其他家均在70分—80分左右。但GPT4需要调用海外服务器,相对麻烦一点。

另外,从成长速度来看,国内大模型应用的进化速度已经十分快速,和GPT4的差距在快速缩减。

通用大模型的陆续开源、开放使用,意味着大模型的产业竞争已经进入下半场,先发者和后来者差距进一步拉大——通用大模型有一定的先发优势,因为用户每一次互动都是在给大模型"喂"新的数据,后来者的竞争门槛会明显提升。

一位长期关注AI的投资人评价,近期资本对大模型的态度明显降温,这是多个原因造成的:一是大模型很贵,能投的机构本身就不多,且已经入局;二是大家发现OpenAI的商业化路径都不够清晰,国内大模型的商业化都还在PPT阶段。

目前,可以相对确定的新方向是垂直大模型和多模态大模型。

垂直大模型相比通用大模型参数量和模型体量都会小一些,企业用户可以按需选择,成本较低。竞争关键点在于足够充足的垂直领域数据,这是最大的门槛。此外,还需要足够了解垂直行业,发现行业用户的痛点或有能力创造新需求。

多模态则是另一个方向,单模态大模型(只生成文字或图片)的复现已经被证明,多模态是证明科技公司有技术壁垒的新路径。2023年8月17日,OpenAI收购初创公司Global Illumination,目的是补足视频技术能力,为多模态做准备。

多位关注AI的投资人和从业人士都提到,当下大模型产业最大的问题是商业化路径还不够清晰。无论是面对投资人还是面对企业用户,他们通常都会被问到同一个问题,"有什么是你能做到而其他大模型做不到的?"这个问题很多人很难回答。

大模型的商业化是在解决真实问题的基础上,现在业界对于大模型还处于"模糊正确"的状态,"大家的问号太多了,只能确定大模型是一个重要的方向,但是具体怎么做,谁能做出来,都还不确定。"一位投资人提到,所以大公司的策略是不光自己做,也对外投资,比如美团、字节、腾讯等,"既然方向对,就多试几条路。"

(编辑:陈颖)