百度发布文心一言AI模型，称中文理解能力超越其他任何模型

2023-03-16 18:42:51来源：南方都市报栏目：数码

3月16日，百度在北京总部召开发布会，正式推出大语言模型文心一言（ERNIE Bot）。据百度创始人、董事长兼CEO李彦宏介绍，文心一言具备人类在自然语言上的理解、表达、逻辑推理等多方面的能力，并称其在中文理解方面可以说是“超过了世上任何一个大模型”。

(资料图片)

在现场Demo演示中，文心一言除了能进行文字交流，也可以根据输入文字输出相应的语音、图像、视频。不过，由于算力成本的问题，当前文心一言还并不会对全部用户开放。

···

续写三体、还可输出图像和音视频

现场展示的文心一言的UI较之ChatGPT较为相似，界面左侧有“新建对话”按钮，此后每次生成的对话也会自上而下排列显示在左侧。主要界面则为一个对话框，用以和AI进行不断对话。

而具体在文学创作、商业文案创作、数理逻辑推断、中文理解、多模态生成等几方面，现场也分别给出了提前录制的Demo视频。比如，在被问到小说《三体》可以从哪些角度出发进行续写时，文心一言给出了它的回答：

而在继续追问“如何从哲学角度进行续写”时，文心一言也给出了回答：可以从生命的意义、人类与宇宙的关系、道德和伦理、价值和信仰、科技与人文的关系等五大方向进行续写。

之后，文心一言也完成了为科技公司起名、解答鸡兔同笼问题、解释洛阳纸贵的典故并写出藏头诗等任务。值得注意的是，在最后的“多模态生成”方面，文心一言在进行交流时，能随时针对输入的文字返回相应的图像、语音和视频。

在现场的演示视频中，文心一言能够根据要求创作一张“2023世界智能交通大会的海报”。

同时，也能生成方言口音的语音，还能根据生成内容制作并返回相应视频。李彦宏现场介绍表示，除了现场演示的四川话，广东话、东北话、闽南语也都能讲。

···

当前模型仍“训练不充分”

在介绍文心一言背后的技术原理时，百度首席技术官王海峰提到，当前模型仍“训练不充分”。事实上，此前业界有观点认为“现在所有大语言模型都是训练不充分（undertrained）的”，也就是说，由于现有的大模型参数量级动辄上亿，已经很难有充足的优质数据来供给模型训练。

而根据李彦宏介绍，文心一言所用的训练数据主要来自于千亿万亿量级的网络页面、几十亿的（百度）搜索请求、巨量图片，以及5500亿条知识图谱（一种结构化的语义知识库）中的事实数据。因此，他认为，百度在面对当前语言大模型经常会出现的“一本正经地胡说八道”的问题时“拥有优势”，可以事先检查生成的内容到底是否和事实吻合，一定程度上保证了回答的准确性。

李彦宏提到，文心一言经历了一个从“判别式研发”到“生成式研发”的过程。现在走上了一条大算力、大模型、大数据的“暴力美学”之路。虽然模型当前还会出现明显的错误，但已经开始让其去适配百度内外部各种各样的产品。

而在谈到当前大热的生成式AI时，李彦宏认为，这代表了一个新的技术范式。比如，未来云计算公司主要的商业模式会变成MaaS，也就是Model and Service（大模型与服务）。

“以后的应用会建立在大模型上，而非过去的云计算的算力或存储上。以前大家看基础云服务，会看算力，看存储，现在就会看你的模型好不好，框架好不好。这对于云计算产业是一个根源性的，改变游戏规则的情况。”李彦宏表示。

采写：南都记者杨博雯

标签：

百度发布文心一言AI模型，称中文理解能力超越其他任何模型

资讯阅读

随机看看

热门文章

精彩推送