【世界独家】对话李彦宏：不要重复造轮子，AI的十倍机会在别处

回应关于文心一言的几个质疑，李厂长还给AI创业者提了几点小建议。

(相关资料图)

采访｜冯大刚

撰文｜邓咏仪

编辑｜杨轩苏建勋

来源｜数字时氪（ID：digital36kr）

封面来源｜视觉中国

2023年，全世界的关注焦点，都在AI大模型的焦灼竞赛。

中国参赛选手、百度“文心一言”在研发阶段时，百度技术团队曾与ChatGPT进行对比测试，李彦宏对36氪回忆，当时“差距是40分的水平，一个月能追得上。”

可过了一个月，技术团队再次测试后，发现差距反而拉大了——AI大模型的发展速度不是线性的。

紧张追赶之后，到文心一言今年3月16日发布时，甚至“能达到它（ChatGPT）今年1月份的水平。”李彦宏对36氪说。要说文心一言和ChatGPT差距多大？“可能最多是两个月。但这两个月什么时候能追上，才是更重要的问题。”

过去一周，AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天，OpenAI发布了新一代GPT-4大模型；后一天，又有微软发布搭载最新GPT-4的AI助手Copilot——均是震撼业界的产品进展。

百度文心一言随之成为激烈争论的对象。带着人们围绕文心一言的诸多质疑，36氪独家访问了百度创始人兼CEO李彦宏，直接发问：为什么发布会用了Demo而不是实时演示？为什么产品在不甚完美时就发布？

这些质疑折射出国人的复杂情绪：人有我无的焦虑，民族情绪的高涨、期待与失望间的起伏……

在回应质疑之外，36氪在与李彦宏交谈中，印象更加深刻的，是他给出了关于AI行业的许多直接论断。

比如，被问到中国创业公司里会不会再出一个OpenAI？他直接回答“基本不会了”，“没有必要再重新发明一遍轮子。”

比如，“在应用层，将会出现全新的、十倍于现在微信和抖音的创业机遇。”比如“AI将会颠覆云计算市场”。

比如，AI虽然会取代人类工作，但有更多意想之外的机会。一个针对个人的提示是，不会面向AI写提示词（prompt，人与机器进行交互的指令语言）的人会被淘汰。

无论如何，我们正站在一个历史性的时点：基于AI大模型技术，可能开启一个新增长时代。就在两天前，英伟达发布了专用于大模型计算的新GPU，能让大模型处理成本下降一个数量级。“我们正处于AI的iPhone时刻。”英伟达创始人黄仁勋在会上三次激动地强调。

暂时忘却历史臧否，而是把百度视作一家在AI领域深耕十余年、花费千亿的公司，李彦宏的声音此时格外有时代意义。

以下为对话全文，经36氪编辑整理：

回应文心一言发布会的所有质疑

36氪：3月16日文心一言发布会之后，网上有非常多的声音，其中有祝福，也有质疑，今天我是代表质疑的声音。首先问一个小问题，今天这样一个突然的采访，会不会让你觉得有压力？

李彦宏：不会。确实像你讲的，3月16日之后，网上有各种各样的声音，我自己也确实有一些话想说。

36氪：有人说你在发布会现场比较紧张，是这样吗？

李彦宏：我真没觉得自己紧张。因为这个东西（指文心一言）是我非常熟悉的，包括那5个演示场景，基本上都是我选的，或者至少是别人给我建议、我认真看过的。

后来我也回看了发布会实况，也没觉得我在任何时候紧张。我猜测，是因为当时在台上，我看不到股价变化，所以没有被它所影响。但是很多在台下的人，包括看直播的人，能够看到一些资本市场的反应，又看不到我们真实产品是什么样子（因为当时还没有发布出来），所以会有此猜测。

36氪：在发布会中，你提到产品还没有准备好。为什么要在还没有完美的情况下发布？

李彦宏：最主要的原因，是因为有市场需求。我们有好多客户都在问，这个东西什么时候出来？我们什么时候能够用？你能不能保证我是第一批试用产品的人？不断有人在问这方面的问题。

目前整个大环境，是ChatGPT非常火，甚至被神话了。大家一定是有焦虑感的，如果我们的客户不能及早地用最先进的产品，他们也会有焦虑感。在这种情况下，我们确实希望尽早把它推出来。

从技术发展的规律来讲，这一类型的产品，确实需要有人类反馈之后，它的演进与能力提升才会更快。我们也希望它更快提升，所以必须要及早推出来。

36氪：选择在3月16日开发布会，这个日期是怎么确定的？

李彦宏：一开始我们想的是3月底，其实哪一天我觉得都是可以的。

但我在很早的时候，答应了去参加今年的亚布力论坛，亚布力是3月17日，那时我会见到很多新老朋友，包括政府领导、媒体，大家一定会问（文心一言），那个时候我们还没有发布的话，别人问起来，我真不知道该说什么了——你说得少，大家会觉得你一点信息都不透露，你不拿我当朋友；说得多，我们是上市公司，等于选择性地披露一些东西，也是不行的。

所以想来想去，决定稍微往前赶一点。为了适应3月17日亚布力论坛，就决定3月16日来开发布会。

36氪：所以碰上OpenAI发布新版本，这是偶然。

李彦宏：对，我们事先并不知道OpenAI会在那一天发GPT-4。对于我们来说实际上也没有那么重要。我们自己能看到的可提升的地方已经足够多了，先把这些东西做好就够了。

36氪：发布会现场为什么会用先做好的Demo，而不是实时展示？

李彦宏：我是希望能现场演示的，因为人机对话产品具有极强交互属性，但后来两个因素让我改变了主意。一是生成式AI每次给出的答案不一定一样，会带来不确定性。二是真正说服我的理由，是全球所有类似发布会，没有一个是现场演示的，都是录好的。如果大家都可以，那我们也OK。

36氪：文心一言发布的产品有五个场景，包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成，为什么是这样的五个场景？

李彦宏：这是很好的问题。我们选择的逻辑是这样：文心一言对标ChatGPT，所以大部分ChatGPT有的功能，我们也要有。

但同时，我们毕竟植根于中国，所以，我们的对话型产品，一定要体现我们对于中文、对中国文化更好的理解。我们确实有一些ChatGPT没有的东西，希望在发布会展示给大家。

所以，前三个场景是对标ChatGPT已有的功能，我希望大家能够感受到我们的东西不差。比如第一个例子是，三体的作者是哪里人？我在ChatGPT里面试过很多次，它答的都是错的，每次生成的答案都不一样，有时候说甘肃天水人，有时候说山西吕梁人，答案非常随机。所以，我第一个例子用了那个例子，但是前三个例子的那些能力，大家已经看过了，在ChatGPT里面那些能力都是有的。

到第四个例子，文心一言对于中文的理解，或者对于中国文化的理解，确实是更加到位一些。我们综合了一些知识增强，检索增强等能力，对“洛阳纸有多贵”“刘慈欣的籍贯”这类事实性问题，文心一言能够理解，并且作出正确的回答，准确率更高一些。

第五个例子，是多模态能力的展示。有一个四川话，有一个文生图，一个文生视频，这代表了百度过去十几年在AI上综合能力的积累。

做这五个例子的时候，我给团队提了个要求，我希望产品发出去之后，能让大家玩起来。第一个就是刚才讲的四川话，我们有语音合成的能力，也对中国情况更了解。所以，我希望当用户提问的时候，不管是提什么问题，我们都能够用语音合成，并且能支持用各种各样的方言说出来，不管是四川话还是广东话。我希望大家觉得很有意思，喜欢去玩这些东西。

第二个要求，当用户的问题本身存在事实性错误时，我们能够辨别，比如“二战期间苏联为什么轰炸波兰？”其实苏联没有轰炸波兰，是德国轰炸波兰。我希望文心一言能够辨别用户问题当中是有错误的，并且告诉你说，你刚才说的不对，我告诉你正确答案是什么。

所以当用户有这样的问题，或者故意进行错误引导的时候，如果产品能够辨别，用户会觉得你很聪明。

36氪：有人说这是为调皮的人类而准备的。

李彦宏：能够给大家多带来一些欢乐的话，何乐而不为？

36氪：提及ChatGPT，别人一定会把它跟文心一言对比，你觉得哪个更领先？假如ChatGPT更领先的话，你觉得它领先文心一言几年？

李彦宏：这个问题应该这样说，ChatGPT发布是去年11月30日，我们现在已经发布了，也就是说不可能被领先几年。

但是科学地去评比，文心一言到底是处于去年ChatGPT 11月30日的水平，还是12月30日的水平？这个我们没有特别严谨的方法评测，我们自己可以保留（产品状态），但是ChatGPT当时的状况我们已经保留不了了。

但是我可以给你讲一个我们内部开发的过程。第一版产品出来的时候，我们和当时的ChatGPT做了一个对比，和它大概差40分。

36氪：这个对比怎么做的？

李彦宏：我们的对话式人工智能大语言模型应该具备的各种各样的能力，每一项能力去挑了提示词（prompt)。

36氪：满分是100分，差了40分？

李彦宏：对。当时我们能看到的提升空间远不止40分，所以我们觉得说一个月之内肯定追上它。但是过了一个月，我们又做了一次评测，发现这个差距不仅没有缩小，而且拉大了。

所以我们当时很紧张，说这个东西越做，跟人家差得越远了，但后来发现，其实ChatGPT那种升级不是匀速的升级，虽然提升很快，但是它有自己的发展规律。

而百度这种一版一版的迭代方式，升级速度是非常非常快的。等到我们敢说3月16日开发布会的时候，我们觉得就是至少可以达到它去年11月30日的水平，甚至说按照理性判断的话，应该达到了ChatGPT今年1月份的水平。所以，那个时候我们才敢出去发的。

尤其当你去测试ChatGPT比较擅长的能力（英文、编程等），会发现差距很大，那是因为ChatGPT也发生了很大的变化。我们发布会前一天，OpenAI上了GPT-4，和GPT-3.5也是不一样的。

所以你要说我们和ChatGPT差距多大？我觉得可能最多是两个月，但是这两个月什么时候能追上，才是更重要的问题。

36氪：可以说，文心一言在两个月后能达到ChatGPT的水平吗？

李彦宏：远远不够，因为人家也在进步。百度进步的速度要比它快，有一天不仅要追上它，还要超过它。

刚才我们讲的文生图能力，百度的能力打磨比较久，大家玩起来挺嗨。GPT4本身没有文生图能力，站在另一个角度比较的话，ChatGPT落后百度，文心一言早就有这个能力了。

早在文心一言发布之前，大家用文心一格（指代百度基于文心大模型的文生图系统）就能体验这个能力，这是我们做得好的地方。ChatGPT发布的时候，大家都说它跨时代、震撼发布等，它发布的理解图片能力，不是文生图，只是输入图片告诉你这个图片是什么。

客观比较下，我们有我们的长处，我们也很有信心在综合能力上，能够迅速追上甚至超过。

刚才我们讲的文生图的能力，百度的能力打磨比较久的时间，我们目前就是大家玩起来挺嗨，但是ChatGPT本身没有文生图的能力，站在另一个角度比较的话，ChatGPT落后百度，文心一言早就有这个能力了。

ChatGPT4发布的时候，大家都说它跨时代震撼发布之类的。其实它发布的所谓理解图片的能力，不是文生图，输入图片告诉你这个图片是什么。我们搜的只是官网上的能力，没有人体验过。

36氪：相比ChatGP的调用成本，百度的成本是更高还是更低？大概是多少？

李彦宏：成本比较类似。但是这个东西不重要，重要是我们可以通过端到端的优化，让这个成本迅速下降。

36氪：比如使用的时候，价格会是ChatGPT的百分之多少？

李彦宏：会稍微便宜一点。

36氪：现在百度已经为文心一言投入了多少，还会继续投入多少？

李彦宏：这很难划分清楚。例如，我们对于大语言模型的投入算不算在内？可能有些投入是去做了辨别式的东西，比如去优化搜索等等，有些是生成式的。

如果单讲生成式AI可能是十亿、几十亿，未来投入会更大。如果是整个这四层（指应用层、模型层、框架层、芯片层），因为需要四层端到端的优化，大语言模型才能够有竞争力，芯片、框架、等等这些都加起来的话，十年投了上千亿元。

如果没有那些投入，根本就不可能出现文心一言这个模型。

中国基本不会再出一个OpenAI

36氪：我看到你自己发的百家号视频，说百度是在全球大厂中第一个发布类ChatGPT产品的，领先于微软，因为微软调用的是OpenAI的接口，Meta、Google没有发布真正同类型的产品，为什么这么说？

李彦宏：人工智能如果按语言模型来分类，一种叫辨别式AI，典型应用是搜索。搜索就是根据你提的需求，看一个个网页跟你的需求匹配不匹配，主要是在辨别；另一种是ChatGPT，也就是生成式AI产品，你提一个提示词，它根据提示词发挥，甚至发挥错了都有可能，这个方向早期并不被大厂看好，积累也没有特别深厚。

关键词：

行业

新闻排行

【世界独家】对话李彦宏：不要重复造轮子，AI的十倍机会在别处

世界看点：闲话杂谈⑤：他们终将为造的每一句“黄谣”付出代价

这个车站“一个顶俩”！青岛地铁2号线二期下王埠站首根钢管柱成功安装|世界热点

全球看热讯：就医周边停车场信息一键可查青大附院推出“停车查询”智慧服务

世界焦点！粤港湾控股将延期刊发2022年度业绩股票将于4月3日停牌

文明青岛随手拍｜爱猫狗更要爱环境，随手拍提醒市民文明养宠物-世界通讯

全球滚动:山东全省动员，以“质”取胜！

福晟国际预期2022年亏损加大净亏损7.5亿元至10亿元-环球快看点

中国天保集团去年收益下跌33.7%至19.24亿元亏损3.47亿元_要闻

女子阳后卧床3天家变垃圾场

【世界独家】对话李彦宏：不要重复造轮子，AI的十倍机会在别处

行业

福晟国际预期2022年亏损加大 净亏损7.5亿元至10亿元-环球快看点

世界焦点！粤港湾控股将延期刊发2022年度业绩 股票将于4月3日停牌

中国天保集团去年收益下跌33.7%至19.24亿元 亏损3.47亿元_要闻

资源控股已配发11.61亿股予认购人 抵消1.16亿港元债务

新闻排行

福晟国际预期2022年亏损加大净亏损7.5亿元至10亿元-环球快看点

世界焦点！粤港湾控股将延期刊发2022年度业绩股票将于4月3日停牌

中国天保集团去年收益下跌33.7%至19.24亿元亏损3.47亿元_要闻

资源控股已配发11.61亿股予认购人抵消1.16亿港元债务