百度发布文心一言AI模型,称中文理解能力超越其他任何模型
3月16日,百度在北京总部召开发布会,正式推出大语言模型文心一言(ERNIE Bot)。据百度创始人、董事长兼CEO李彦宏介绍,文心一言具备人类在自然语言上的理解、表达、逻辑推理等多方面的能力,并称其在中文理解方面可以说是“超过了世上任何一个大模型”。
(资料图片)
在现场Demo演示中,文心一言除了能进行文字交流,也可以根据输入文字输出相应的语音、图像、视频。不过,由于算力成本的问题,当前文心一言还并不会对全部用户开放。
···
续写三体、还可输出图像和音视频
现场展示的文心一言的UI较之ChatGPT较为相似,界面左侧有“新建对话”按钮,此后每次生成的对话也会自上而下排列显示在左侧。主要界面则为一个对话框,用以和AI进行不断对话。
而具体在文学创作、商业文案创作、数理逻辑推断、中文理解、多模态生成等几方面,现场也分别给出了提前录制的Demo视频。比如,在被问到小说《三体》可以从哪些角度出发进行续写时,文心一言给出了它的回答:
而在继续追问“如何从哲学角度进行续写”时,文心一言也给出了回答:可以从生命的意义、人类与宇宙的关系、道德和伦理、价值和信仰、科技与人文的关系等五大方向进行续写。
之后,文心一言也完成了为科技公司起名、解答鸡兔同笼问题、解释洛阳纸贵的典故并写出藏头诗等任务。值得注意的是,在最后的“多模态生成”方面,文心一言在进行交流时,能随时针对输入的文字返回相应的图像、语音和视频。
在现场的演示视频中,文心一言能够根据要求创作一张“2023世界智能交通大会的海报”。
同时,也能生成方言口音的语音,还能根据生成内容制作并返回相应视频。李彦宏现场介绍表示,除了现场演示的四川话,广东话、东北话、闽南语也都能讲。
···
当前模型仍“训练不充分”
在介绍文心一言背后的技术原理时,百度首席技术官王海峰提到,当前模型仍“训练不充分”。事实上,此前业界有观点认为“现在所有大语言模型都是训练不充分(undertrained)的”,也就是说,由于现有的大模型参数量级动辄上亿,已经很难有充足的优质数据来供给模型训练。
而根据李彦宏介绍,文心一言所用的训练数据主要来自于千亿万亿量级的网络页面、几十亿的(百度)搜索请求、巨量图片,以及5500亿条知识图谱(一种结构化的语义知识库)中的事实数据。因此,他认为,百度在面对当前语言大模型经常会出现的“一本正经地胡说八道”的问题时“拥有优势”,可以事先检查生成的内容到底是否和事实吻合,一定程度上保证了回答的准确性。
李彦宏提到,文心一言经历了一个从“判别式研发”到“生成式研发”的过程。现在走上了一条大算力、大模型、大数据的“暴力美学”之路。虽然模型当前还会出现明显的错误,但已经开始让其去适配百度内外部各种各样的产品。
而在谈到当前大热的生成式AI时,李彦宏认为,这代表了一个新的技术范式。比如,未来云计算公司主要的商业模式会变成MaaS,也就是Model and Service(大模型与服务)。
“以后的应用会建立在大模型上,而非过去的云计算的算力或存储上。以前大家看基础云服务,会看算力,看存储,现在就会看你的模型好不好,框架好不好。这对于云计算产业是一个根源性的,改变游戏规则的情况。”李彦宏表示。
采写:南都记者杨博雯
标签: