谁是中国AI大模型的初代祖师爷？扒一扒那些年抢跑算力的老炮儿们

782 2025-08-30 01:02:37 发布在前沿科技 0

（开头先唠点闲嗑）
朋友们，最近是不是被各种AI大模型刷屏了？ChatGPT、文心一言、通义千问……搞得好像不聊两句“Transformer”都不好意思说自己冲过浪，但你要是以为AI大模型是这两年才冒出来的“小鲜肉”，那可就大错特错了！今天咱就扒一扒国内最早搞AI大模型的那批公司——谁才是真·祖师爷？谁又是“憋大招”憋到同行都上市了还没发布？（手动狗头）

2019年就“偷偷炼丹”的百度：文心大模型的隐秘开局

如果非要给国内大模型找个“初代目”，百度大概率能抢到C位，2019年，当大多数人还在用AI猜你喜欢什么外卖时，百度已经闷声搞起了文心大模型（ERNIE），那时候“大模型”这词儿还没出圈，百度内部管它叫“巨型预训练模型”——听着就像科幻片里的秘密武器。

为啥是百度？原因简单粗暴：算力烧得起，数据管够造，搜索业务攒下的中文语料库+自建AI芯片（昆仑芯）+云计算底座，活脱脱一个“家里有矿”的技术宅，不过当年百度还挺低调，直到2021年才把文心大模型推到台前，结果2023年ChatGPT一火，百度直接被网友封为“国内唯一能打的老将”——虽然文心一言发布时因为画手翻车被吐槽，但人家真是早早就埋了种子啊！

阿里：达摩院的“佛系”研发与后来狂奔

阿里达摩院2017年就成立了,但早期重心在自动驾驶、芯片上，大模型属于“顺便搞搞”，2019年推出自研语言模型StructBERT，更像技术储备而非产品化，真正的发力点是2021年的“通义”大模型系列，但那时候阿里云忙着搞企业解决方案，对C端憋着没放大招。

直到2023年,阿里一看风向变了，立马把通义千问甩出来，还附赠一句：“我们早就研发了，只是没宣传”（潜台词：别光夸百度！），不过阿里胜在生态狠——云计算、电商、文娱数据全打通，搞大模型像在自家后院种菜，缺啥摘啥。

腾讯：氪金玩家的“后发制人”策略

腾讯嘛,一贯风格是“先让友商试水，我再氪金超车”，2019年隔壁百度阿里都在搞模型时，腾讯AI Lab主要在玩围棋（绝艺）和医疗影像，但腾讯有个隐形王牌：微信和QQ的社交数据——这可是中文互联网最肥的语料池之一！

2022年腾讯推出混元大模型,但初期只内部用，比如给游戏NPC写台词、帮腾讯文档自动生成PPT，直到2023年才对外开放，被网友调侃：“腾讯这是等友商把雷踩完了，才开着坦克进场”，不过话说回来，社交起家的腾讯最懂用户需求，混元在C端应用场景的落地速度确实快。

暗线玩家：字节跳动、华为、商汤的“技术流”野望

字节跳动：2019年就在内部用AI写新闻摘要和视频标签，2021年推出火山方舟大模型平台，但张一鸣坚持“产品优先”，直到2023年才推出豆包大模型，主打一个“低调实用”。
华为：盘古大模型2019年就立项，但主打工业场景（比如预测台风路径、煤矿产量），走的是“硬核直男风”，老百姓感知不强。
商汤：作为AI视觉老炮，2019年搞了视觉大模型，但语言模型起步稍晚，2022年才推出“商量”（SenseNova），靠“AI画画”出过一波圈。