首页 > 日常经验 > 推理成本增加10倍，参数规模破万亿的大模型即将浮现！业界看好中国这个大招！

推理成本增加10倍，参数规模破万亿的大模型即将浮现！业界看好中国这个大招！

更新：2023-10-12 06:46:34 发布：佚名

推理成本增加10倍，参数规模破万亿的大模型即将浮现！业界看好中国这个“大招”！

8月，号称“欧洲最好的”大语言模型Mistral 7B在中国社交媒体上着实火了一把。一家今年6月才初创的法国公司，凭借一款拥有13亿参数的开源语言模型Mistral 7B，一举击败了扎克伯格此前推出的开源Llama 2和其他可用的开源模型。

Mistral 7B的出现，也让ChatGPT多了一个有力竞争者。要知道，今年的ChatGPT就像科技界的一颗原子弹，而它本身还在快速进步，随着它进化到4.0版本，不仅能生成更加逼真的文字，还加入了图像和语音功能，让追赶者感到更难。

当然，这段时间，国内公司也没闲着。截至今年7月，中国累计已经有130个大模型问世，数量超过美国进入大模型第一梯队。在这场高成本、高门槛的“超级游戏”中，国内主流的互联网公司都已经下场，提交了自己的“作业”。

可是，即便中国大模型遍地开花，并在应用领域取得不少进展。

比如，百度正在加紧训练文心大模型4.0，并根据消息人士透露，文心4.0有可能在10月17日百度世界大会上发布，对标的就是GPT-4。综合模型能力在推理、逻辑等多个方面都有又了质的提升，同时也在推理成本上较文心3.5增加了10倍。

要知道，中文大语言模型与英文大模型不同，中文作为世界上最复杂、最难学的语言，通常一个词汇可以表达多种含义，语言组成较为灵活。

另外，中文还有着深厚的文化内涵，具有丰富的语境意义，而文心4.0所用数据量、推理成本等都比3.5高一个数量级，是真正“万亿级别参数规模”，并且在算力上通过“万卡集群训练”，业内人士评论，文心4.0作为国内首次使用万卡规模集群进行大语言模型训练的大模型，在中文性能方面“赶超GPT-4”并不是什么夸张。#文心大模型4.0推理成本将增加10倍#

法国人在大模型领域3个月的“狂飙”所取得的成就，表明在大模型这场争夺中，没有绝对的领先。只要我们咬定青山不放松，肯持续投入资金和人力，开发出超过ChatGPT的产品，也绝不是一句空话。