格竹熊(2 月 18 日):
简直受不了那些人了,中美是 AI 领域的第一梯队,各有千秋,不存在什么美国技术碾压的情况。
一、中美 AI 算力基础设施比较
在总算力上,美国占全球的 34%,中国占 33%,差距很小,两者构成绝对的第一梯队。在智能算力上,中国占全球的 45%,美国占 28%,中国在规模上绝对领先,目前智算中心 20 个,在建智算中心 20 个,是美国的一倍多。
中国总算力略低的主要原因就是芯片有差距,单位算力低于美国。随着今年芯片陆续突破,中国有望在算力和规模上均大幅超过美国。英伟达老黄之所以着急,千方百计要绕过制裁,主要是因为:一是中国规模实在太大了,二是华为昇腾和寒武纪为代表的 AISC 芯片有望取代英伟达的强项 GPU 实现弯道超车。
二、中美 AIGC 大模型比较
AIGC 就是生成式人工智能,包括现在很热门的 NLP 模型(神经语言)和 CV 模型(图像视觉模型)。这类大模型很多,但各有侧重,应用场景也不同,捡几个典型的来比较。
1、ChatGPT VS 百度文心
这两都属于典型的 LLM 语言大模型。LLM 是 NLP 的重要一环,主要是针对自然语言的理解、贯通、补齐。ChatGPT 领先百度文心一个半身位。GPT3.0 是 1750 亿参数量,最新的文心参数量是 2600 亿,大概处于 GPT4.0 的水平。不过百度文心能同时满足 C 端和 B 端且更偏向 B 端。ChatGPT 目前来看更偏向 C 端。
2、华为盘古大模型 VS 无
盘古大模型主要面向 B 端行业端。谷歌和微软也有做同类的,但与盘古比基本属于打酱油的。举个例子:你问 AI 识别一列火车的型号,GPT 会给你个教科书的标准答案,但你要问它通过图片视频来预测和判断火车的故障类别,它能提供的回答就很有限,因为美国的铁路已经无法提供足够的参数和样本训练了。同样,你要是问它高铁在时速 350 公里下轮轨的磨损检测,它根本无法回答,因为它连高铁什么样都没见过。
3、阿里通义千问大模型 VS 微软
通义千问也与 ChatGPT 类似可以对话生产内容,但更侧重办公和助手。大概是因为阿里自己有搞钉钉吧。但是与微软的大模型相比就差得比较远。前者参数量是 1500 亿,而后者参数量达到 5000 亿。这主要是微软有 GPT 加持,自己又是长期搞办公助手的。不过阿里开源,也很符合阿里的风格——自己搭台,吆喝大家一起干。
4、腾讯混元大模型——Open AI Text 和谷歌 Switch
混元大模型也与 ChatGPT 类似可以对话生产内容,但更侧重创新创意。这是因为腾讯独一无二的生态,微信社交媒体属性下交易、公众号、小程序、游戏等等商业应用,让腾讯极为重视庞大客户群体 AI 应用的可扩展性。其参数设置达到万亿级别。相比下,GPT4 只有两千多亿,能与之匹敌的是谷歌 Switch 大模型,后者参数量 1.6 万亿。
所以,虽然大家都是 AIGC 模型,但是每家的侧重点和应用场景是不同的,中国的模型更偏向 B 端的行业应用。而美国因为产业空心化,更偏向 C 端(个人)方面的虚拟应用。这就导致普通公众对中国的 AI 比较陌生,而容易被美国的喧闹所吸引。
现在很多人把 AI 简单理解为问答、写作、做点图片视频。然后做一些简单比较就忙着瞎吹神吹。
普通公众跟风就算了,你们那些号称搞投资、财经的“专家”也是人云亦云,跟风炒作,甚至生些莫名其妙感叹反思,连行业应用都不知道,你们平时都在忙着研究什么呢?研究给哪个老板提裤子?研究怎么忽悠散户买你们的理财产品?