回应关于文心一言的几个质疑,李厂长还给AI创业者提了几点小建议。


(相关资料图)

采访|冯大刚

撰文|邓咏仪

编辑|杨轩 苏建勋

来源|数字时氪(ID:digital36kr)

封面来源|视觉中国

2023年,全世界的关注焦点,都在AI大模型的焦灼竞赛。

中国参赛选手、百度“文心一言”在研发阶段时,百度技术团队曾与ChatGPT进行对比测试,李彦宏对36氪回忆,当时“差距是40分的水平,一个月能追得上。”

可过了一个月,技术团队再次测试后,发现差距反而拉大了——AI大模型的发展速度不是线性的。

紧张追赶之后,到文心一言今年3月16日发布时,甚至“能达到它(ChatGPT)今年1月份的水平。”李彦宏对36氪说。要说文心一言和ChatGPT差距多大?“可能最多是两个月。但这两个月什么时候能追上,才是更重要的问题。”

过去一周,AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天,OpenAI发布了新一代GPT-4大模型;后一天,又有微软发布搭载最新GPT-4的AI助手Copilot——均是震撼业界的产品进展。

百度文心一言随之成为激烈争论的对象。带着人们围绕文心一言的诸多质疑,36氪独家访问了百度创始人兼CEO李彦宏,直接发问:为什么发布会用了Demo而不是实时演示?为什么产品在不甚完美时就发布?

这些质疑折射出国人的复杂情绪:人有我无的焦虑,民族情绪的高涨、期待与失望间的起伏……

在回应质疑之外,36氪在与李彦宏交谈中,印象更加深刻的,是他给出了关于AI行业的许多直接论断。

比如,被问到中国创业公司里会不会再出一个OpenAI?他直接回答“基本不会了”,“没有必要再重新发明一遍轮子。”

比如,“在应用层,将会出现全新的、十倍于现在微信和抖音的创业机遇。”比如“AI将会颠覆云计算市场”。

比如,AI虽然会取代人类工作,但有更多意想之外的机会。一个针对个人的提示是,不会面向AI写提示词(prompt,人与机器进行交互的指令语言)的人会被淘汰。

无论如何,我们正站在一个历史性的时点:基于AI大模型技术,可能开启一个新增长时代。就在两天前,英伟达发布了专用于大模型计算的新GPU,能让大模型处理成本下降一个数量级。“我们正处于AI的iPhone时刻。”英伟达创始人黄仁勋在会上三次激动地强调。

暂时忘却历史臧否,而是把百度视作一家在AI领域深耕十余年、花费千亿的公司,李彦宏的声音此时格外有时代意义。

以下为对话全文,经36氪编辑整理:

回应文心一言发布会的所有质疑

36氪:3月16日文心一言发布会之后,网上有非常多的声音,其中有祝福,也有质疑,今天我是代表质疑的声音。首先问一个小问题,今天这样一个突然的采访,会不会让你觉得有压力?

李彦宏:不会。确实像你讲的,3月16日之后,网上有各种各样的声音,我自己也确实有一些话想说。

36氪:有人说你在发布会现场比较紧张,是这样吗?

李彦宏:我真没觉得自己紧张。因为这个东西(指文心一言)是我非常熟悉的,包括那5个演示场景,基本上都是我选的,或者至少是别人给我建议、我认真看过的。

后来我也回看了发布会实况,也没觉得我在任何时候紧张。我猜测,是因为当时在台上,我看不到股价变化,所以没有被它所影响。但是很多在台下的人,包括看直播的人,能够看到一些资本市场的反应,又看不到我们真实产品是什么样子(因为当时还没有发布出来),所以会有此猜测。

36氪:在发布会中,你提到产品还没有准备好。为什么要在还没有完美的情况下发布?

李彦宏:最主要的原因,是因为有市场需求。我们有好多客户都在问,这个东西什么时候出来?我们什么时候能够用?你能不能保证我是第一批试用产品的人?不断有人在问这方面的问题。

目前整个大环境,是ChatGPT非常火,甚至被神话了。大家一定是有焦虑感的,如果我们的客户不能及早地用最先进的产品,他们也会有焦虑感。在这种情况下,我们确实希望尽早把它推出来。

从技术发展的规律来讲,这一类型的产品,确实需要有人类反馈之后,它的演进与能力提升才会更快。我们也希望它更快提升,所以必须要及早推出来。

36氪:选择在3月16日开发布会,这个日期是怎么确定的?

李彦宏:一开始我们想的是3月底,其实哪一天我觉得都是可以的。

但我在很早的时候,答应了去参加今年的亚布力论坛,亚布力是3月17日,那时我会见到很多新老朋友,包括政府领导、媒体,大家一定会问(文心一言),那个时候我们还没有发布的话,别人问起来,我真不知道该说什么了——你说得少,大家会觉得你一点信息都不透露,你不拿我当朋友;说得多,我们是上市公司,等于选择性地披露一些东西,也是不行的。

所以想来想去,决定稍微往前赶一点。为了适应3月17日亚布力论坛,就决定3月16日来开发布会。

36氪:所以碰上OpenAI发布新版本,这是偶然。

李彦宏:对,我们事先并不知道OpenAI会在那一天发GPT-4。对于我们来说实际上也没有那么重要。我们自己能看到的可提升的地方已经足够多了,先把这些东西做好就够了。

36氪:发布会现场为什么会用先做好的Demo,而不是实时展示?

李彦宏:我是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来两个因素让我改变了主意。一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。

36氪:文心一言发布的产品有五个场景,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,为什么是这样的五个场景?

李彦宏:这是很好的问题。我们选择的逻辑是这样:文心一言对标ChatGPT,所以大部分ChatGPT有的功能,我们也要有。

但同时,我们毕竟植根于中国,所以,我们的对话型产品,一定要体现我们对于中文、对中国文化更好的理解。我们确实有一些ChatGPT没有的东西,希望在发布会展示给大家。

所以,前三个场景是对标ChatGPT已有的功能,我希望大家能够感受到我们的东西不差。比如第一个例子是,三体的作者是哪里人?我在ChatGPT里面试过很多次,它答的都是错的,每次生成的答案都不一样,有时候说甘肃天水人,有时候说山西吕梁人,答案非常随机。所以,我第一个例子用了那个例子,但是前三个例子的那些能力,大家已经看过了,在ChatGPT里面那些能力都是有的。

到第四个例子,文心一言对于中文的理解,或者对于中国文化的理解,确实是更加到位一些。我们综合了一些知识增强,检索增强等能力,对“洛阳纸有多贵”“刘慈欣的籍贯”这类事实性问题,文心一言能够理解,并且作出正确的回答,准确率更高一些。

第五个例子,是多模态能力的展示。有一个四川话,有一个文生图,一个文生视频,这代表了百度过去十几年在AI上综合能力的积累。

做这五个例子的时候,我给团队提了个要求,我希望产品发出去之后,能让大家玩起来。第一个就是刚才讲的四川话,我们有语音合成的能力,也对中国情况更了解。所以,我希望当用户提问的时候,不管是提什么问题,我们都能够用语音合成,并且能支持用各种各样的方言说出来,不管是四川话还是广东话。我希望大家觉得很有意思,喜欢去玩这些东西。

第二个要求,当用户的问题本身存在事实性错误时,我们能够辨别,比如“二战期间苏联为什么轰炸波兰?”其实苏联没有轰炸波兰,是德国轰炸波兰。我希望文心一言能够辨别用户问题当中是有错误的,并且告诉你说,你刚才说的不对,我告诉你正确答案是什么。

所以当用户有这样的问题,或者故意进行错误引导的时候,如果产品能够辨别,用户会觉得你很聪明。

36氪:有人说这是为调皮的人类而准备的。

李彦宏:能够给大家多带来一些欢乐的话,何乐而不为?

36氪:提及ChatGPT,别人一定会把它跟文心一言对比,你觉得哪个更领先?假如ChatGPT更领先的话,你觉得它领先文心一言几年?

李彦宏:这个问题应该这样说,ChatGPT发布是去年11月30日,我们现在已经发布了,也就是说不可能被领先几年。

但是科学地去评比,文心一言到底是处于去年ChatGPT 11月30日的水平,还是12月30日的水平?这个我们没有特别严谨的方法评测,我们自己可以保留(产品状态),但是ChatGPT当时的状况我们已经保留不了了。

但是我可以给你讲一个我们内部开发的过程。第一版产品出来的时候,我们和当时的ChatGPT做了一个对比,和它大概差40分。

36氪:这个对比怎么做的?

李彦宏:我们的对话式人工智能大语言模型应该具备的各种各样的能力,每一项能力去挑了提示词(prompt)。

36氪:满分是100分,差了40分?

李彦宏:对。当时我们能看到的提升空间远不止40分,所以我们觉得说一个月之内肯定追上它。但是过了一个月,我们又做了一次评测,发现这个差距不仅没有缩小,而且拉大了。

所以我们当时很紧张,说这个东西越做,跟人家差得越远了,但后来发现,其实ChatGPT那种升级不是匀速的升级,虽然提升很快,但是它有自己的发展规律。

而百度这种一版一版的迭代方式,升级速度是非常非常快的。等到我们敢说3月16日开发布会的时候,我们觉得就是至少可以达到它去年11月30日的水平,甚至说按照理性判断的话,应该达到了ChatGPT今年1月份的水平。所以,那个时候我们才敢出去发的。

尤其当你去测试ChatGPT比较擅长的能力(英文、编程等),会发现差距很大,那是因为ChatGPT也发生了很大的变化。我们发布会前一天,OpenAI上了GPT-4,和GPT-3.5也是不一样的。

所以你要说我们和ChatGPT差距多大?我觉得可能最多是两个月,但是这两个月什么时候能追上,才是更重要的问题。

36氪:可以说,文心一言在两个月后能达到ChatGPT的水平吗?

李彦宏:远远不够,因为人家也在进步。百度进步的速度要比它快,有一天不仅要追上它,还要超过它。

刚才我们讲的文生图能力,百度的能力打磨比较久,大家玩起来挺嗨。GPT4本身没有文生图能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。

早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验这个能力,这是我们做得好的地方。ChatGPT发布的时候,大家都说它跨时代、震撼发布等,它发布的理解图片能力,不是文生图,只是输入图片告诉你这个图片是什么。

客观比较下,我们有我们的长处,我们也很有信心在综合能力上,能够迅速追上甚至超过。

刚才我们讲的文生图的能力,百度的能力打磨比较久的时间,我们目前就是大家玩起来挺嗨,但是ChatGPT本身没有文生图的能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。

ChatGPT4发布的时候,大家都说它跨时代震撼发布之类的。其实它发布的所谓理解图片的能力,不是文生图,输入图片告诉你这个图片是什么。我们搜的只是官网上的能力,没有人体验过。

36氪:相比ChatGP的调用成本,百度的成本是更高还是更低?大概是多少?

李彦宏:成本比较类似。但是这个东西不重要,重要是我们可以通过端到端的优化,让这个成本迅速下降。

36氪:比如使用的时候,价格会是ChatGPT的百分之多少?

李彦宏:会稍微便宜一点。

36氪:现在百度已经为文心一言投入了多少,还会继续投入多少?

李彦宏:这很难划分清楚。例如,我们对于大语言模型的投入算不算在内?可能有些投入是去做了辨别式的东西,比如去优化搜索等等,有些是生成式的。

如果单讲生成式AI可能是十亿、几十亿,未来投入会更大。如果是整个这四层(指应用层、模型层、框架层、芯片层),因为需要四层端到端的优化,大语言模型才能够有竞争力,芯片、框架、等等这些都加起来的话,十年投了上千亿元。

如果没有那些投入,根本就不可能出现文心一言这个模型。

中国基本不会再出一个OpenAI

36氪:我看到你自己发的百家号视频,说百度是在全球大厂中第一个发布类ChatGPT产品的,领先于微软,因为微软调用的是OpenAI的接口,Meta、Google没有发布真正同类型的产品,为什么这么说?

李彦宏:人工智能如果按语言模型来分类,一种叫辨别式AI,典型应用是搜索。搜索就是根据你提的需求,看一个个网页跟你的需求匹配不匹配,主要是在辨别;另一种是ChatGPT,也就是生成式AI产品,你提一个提示词,它根据提示词发挥,甚至发挥错了都有可能,这个方向早期并不被大厂看好,积累也没有特别深厚。

关键词: