国内有哪些对标 ChatGPT 的大语言模型? 5 大竞品
ChatGPT 是基于 大语言模型 的聊天机器人,而这个大语言模型是一个人工智能领域概念、技术。
大语言模型通常有十亿、百亿级的参数,需要非常强大的算力、和非常多的用于训练的数据资源。它对海量的无标注数据进行预训练、通过微调和零样本学习来变形、应用。
对大模型的“变形”(DIY),不仅能增强 AI 技术的通用性,还能扩展应用场景、人人都可以用“大模型”,这样也利于形成了一个开放的生态,激发大众创新。
GPT 时代,国内学界和企业也相继基于大语言模型推出自研的大模型。比如:
百度的“文心一言”、复旦大学的“MOSS”、腾讯的“HunYuan大模型”、阿里的“通义大模型”、华为的“盘古大模型”等等。
自研单位 | 大模型 |
---|---|
百度 | 文心一言 |
复旦大学 | MOSS |
腾讯 | HunYuan |
阿里 | 通义 |
华为 | 盘古 |
本篇就将简要介绍这 5 个国内的这些大语言模型~ <喜欢三连👍👍👍笔芯>
百度-文心一言
以上这么多国内大语言模型,目前,最引人注目的就是“文心一言”,它也可以生成各种类型的文本,比如诗歌、小说、新闻等。同时,它被认为是中国 AI 新旧时代划分里程碑式的产品。
怎样体验?
1.通过百度智能云 API 接口调用文心一言的服务;
2.进入官网 wenxin.baidu.com/ 体验;
文本的理解和创作还是“敬请期待”。。
在开放 API 体验 AI 根据文字、风格作画:
前的产品中心只有“文心百中”和“文心一格”两个产品。
看下“文心百中” 提供的体验示例:
实际用起来,跟 ChatGPT / New Bing / Notion AI 比,感觉差距还很大~ 文心百中还是停留在搜索结果上,没有做到联系上下文整合。
文心一格主要提供一些:联想脑洞生成相关图片推荐,试了下,也不够准确。。
用一成语小结:任重道远
复旦大学-MOSS
MOSS 命名上和电影《流浪地球》的 AI MOSS 同名,寓意人和人工智能共同拯救地球。目前,它的参数规模约是 ChatGPT 的 十分之一,仍处在内测阶段,预计三月底开源。
MOSS 的优势是什么?
MOSS 因为参数规模小,所以更节省计算资源和存储空间,易于部署和应用。
另外,MOSS 在设计时还考虑了人类的伦理道德准则,不会产生有偏见或可能有害的回答,这样可以避免一些潜在的法律风险和商业伦理问题。这点上,ChatGPT 则没有明确地处理。
腾讯-HunYuan
HunYuan 利用了腾讯的研发力量,完整覆盖 NLP 大模型、CV 大模型、多模态大模型及其它行业领域任务模型,可谓是:集大成者。
它的目标是打造行业领先的 AI 预训练大模型,以统一平台,对技术复用,使 AI 技术适用于更多场景,并且降低成本。
HunYuan 的参数量级是 万亿!从这点看,腾讯的 HunYuan 格局(画饼)就比 文心一言、MOSS 要大的多的多~~
对于公众 HunYuan 目前也是在内测优化中,未来值得期待。
但 HunYuan 的 NLP 部分,HunYuan-NLP 已经在多个腾讯产品中得到应用,一样也是用于生成文本,比如对话生成、小说续写、广告生成等。
阿里-通义
阿里的通义模型是一系列基于【自然语言处理和多模态理解与生成】的 AI 模型,旨在打造国内首个 AI 统一底座。
它包括以下几个核心模型:
1.AliceMind-PLUG:语言大模型,能够在多个中文语言理解任务上超越人类水平。
2.AliceMind-mPLUG:多模态理解与生成统一模型,能够处理图文、视频等多种数据类型,并进行跨模态搜索、生成等任务。
3.M6-OFA:多模态统一底座模型,能够根据不同的场景和设备动态调整模型大小和性能。
4.S4:超大模型落地关键技术框架,能够支持百亿级别参数的训练和推理。
阿里的这个部署算是最早一批了,值得期待。
目前,我们可以在 魔搭社区 modelscope.cn/home 找到通义大模型的部分开源代码。比如你可以体验中文版的GPT-3 等。
华为-盘古
盘古,这个大家也常听到吧?也属于是大名鼎鼎。
盘古大模型是一系列超大规模的预训练模型,包括NLP、CV、多模态和科学计算等。
其中,盘古NLP大模型是 全球最大 的千亿参数中文语言预训练模型,它能够进行内容生成和内容理解等任务。
盘古CV大模型是 全球最大 的30亿参数视觉预训练模型,它能够进行分类、分割和检测等任务。
这两个全球最大是亮点~ 目前,盘古大模型在华为云:http://www.huaweicloud.com/ 上提供服务。
小结
整个看完下来,我的感觉就是:虽然我们现在的 大模型 GPT 商用还没有像 ChatGPT 或 New bing 或 Notion AI 那么直接能给到大众去使用,但是国内这些最优秀的一批企业/高校也一直在推进这个事情。
技术存在差距,不承认也不行,就像之前所分享的,ChatGPT 能站到大众面前,也经过了美国各科技公司十多年的沉淀、演进,所以我们可能还是起步有点迟了。
但不怕慢就怕站,我们知道训练 AI 大模型 是个方向,就走起来就好了,加油吧~ Maybe 顶峰再见~
OK,以上便是本篇分享,希望各位工友喜欢~ 欢迎点赞、收藏、评论 🤟
我是掘金安东尼 🤠 100 万人气前端技术博主 💥 INFP 写作人格坚持 1000 日更文 ✍ 关注我,安东尼陪你一起度过漫长编程岁月 🌏
😹 加我微信 ATAR53,拉你入群,定期抽奖、粉丝福利多多。只学习交友、不推文卖课~
来源:juejin.cn/post/7208188644293050405