热搜词:

推理成本增加10倍,参数规模破万亿的大模型即将浮现!业界看好中国这个大招!

发布:佚名

推理成本增加10倍,参数规模破万亿的大模型即将浮现!业界看好中国这个“大招”!

8月,号称“欧洲最好的”大语言模型Mistral 7B在中国社交媒体上着实火了一把。一家今年6月才初创的法国公司,凭借一款拥有13亿参数的开源语言模型Mistral 7B,一举击败了扎克伯格此前推出的开源Llama 2和其他可用的开源模型。

Mistral 7B的出现,也让ChatGPT多了一个有力竞争者。要知道,今年的ChatGPT就像科技界的一颗原子弹,而它本身还在快速进步,随着它进化到4.0版本,不仅能生成更加逼真的文字,还加入了图像和语音功能,让追赶者感到更难。

当然,这段时间,国内公司也没闲着。截至今年7月,中国累计已经有130个大模型问世,数量超过美国进入大模型第一梯队。在这场高成本、高门槛的“超级游戏”中,国内主流的互联网公司都已经下场,提交了自己的“作业”。

可是,即便中国大模型遍地开花,并在应用领域取得不少进展。

比如,百度正在加紧训练文心大模型4.0,并根据消息人士透露,文心4.0有可能在10月17日百度世界大会上发布,对标的就是GPT-4。综合模型能力在推理、逻辑等多个方面都有又了质的提升,同时也在推理成本上较文心3.5增加了10倍。

要知道,中文大语言模型与英文大模型不同,中文作为世界上最复杂、最难学的语言,通常一个词汇可以表达多种含义,语言组成较为灵活。

另外,中文还有着深厚的文化内涵,具有丰富的语境意义,而文心4.0所用数据量、推理成本等都比3.5高一个数量级,是真正“万亿级别参数规模”,并且在算力上通过“万卡集群训练”,业内人士评论,文心4.0作为国内首次使用万卡规模集群进行大语言模型训练的大模型,在中文性能方面“赶超GPT-4”并不是什么夸张。#文心大模型4.0推理成本将增加10倍#

法国人在大模型领域3个月的“狂飙”所取得的成就,表明在大模型这场争夺中,没有绝对的领先。只要我们咬定青山不放松,肯持续投入资金和人力,开发出超过ChatGPT的产品,也绝不是一句空话。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 admin@9yuanwu.com举报,一经查实,本站将立刻删除。

大家都在看

查看更多日常经验