百度文心一言:
要做必不可少的生产力工具
来源:中国新闻出版广电报 时间:2023-03-21
□本报见习记者 齐雅文
“洛阳纸贵是什么意思”“帮我生成一篇公司成立的新闻稿,600字左右”“请为2023世界智能交通大会创作一张海报”……面对众多问题和要求,百度文心一言给出了不同的回复和解决方案。这是3月16日百度文心一言新闻发布会上的热闹场景。
在百度召开的这场发布会上,百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成5个场景中的综合能力。其中,文学创作、中文理解和多模态生成与传媒领域密切相关,也是业内关注的焦点。
广泛适用传媒相关工作场景
文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。
发布会现场,在文学创作场景中,文心一言根据对话、问题将知名科幻小说《三体》的核心内容进行了总结。“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?”在面对这样的问题时,文心一言给出了自己的答案,并具体讲述了《三体》《三体2:黑暗森林》《三体3:死神永生》3本书的核心内容。在给出续写建议时,文心一言从角色塑造、情节设计、文化背景和哲学思考4个不同的角度提出建议,体现出其对话问答、总结分析、内容创作生成的综合能力。
同时,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”“于和伟和张鲁一谁更高”等问题,文心一言基于推理能力给出了答案。可以说,文心一言延续了百度知识增强的大模型理念,大幅提升了事实性问题的准确率。
“帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级,字数600字。”瞬间,相应的新闻稿洋洋洒洒地出现在人们面前。在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
李彦宏表示,在连续3次内容创作生成中,文心一言既能准确理解人类意图,又能清晰表达,这是基于庞大数据规模而发生的“智能涌现”。AI要写好一篇稿子,除了需要准确理解人们的意图,还要有清晰的表达能力。这背后有一个基础,就是庞大的数据规模。文心一言大模型的训练数据包括万亿级的网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于头部位置。
文学创作、商业文案创作、数理推算是大语言模型常见的优势和能力。在此基础上,文心一言还表现出更优秀的中文理解及多模态生成能力。
作为扎根中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。发布会现场,李彦宏提出了几个问题:洛阳纸贵是什么意思?这个成语在现在的经济学原理里,对应的理论是什么?用“洛阳纸贵”4个字写一首藏头诗。面对这些问题和诉求,文心一言都一一给出了相应准确的回答。
在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。李彦宏向文心一言提问:“请为2023世界智能交通大会创作一张海报。你认为智能交通最适合哪个城市发展?请用四川话将以上内容讲出来。请将以上内容生成视频。”文心一言根据不同的问题和诉求,分别生成了新媒体海报、文字回复、四川方言语音和视频的多种形态。“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。
进步空间大让日新月异可期
从现场展示来看,文心一言在某种程度上具有理解人类意图的能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来一定会飞速发展,日新月异。
面对文心一言,广大网友又有着怎样的评价和诉求?不少网友分享了自己的看法和观点。
“互联网的信息太杂太乱,要找到自己想要的信息需要花很多时间和精力,想通过文心一言帮助自己更好地找到想要的资料,提高学习效率。”
“回答问题真实有效,做到人+AI协同工作,以求效率最大化。”
“我想要文心一言帮我写底稿,让AI为我打工。”
……
《中国新闻出版广电报》记者从多个平台的反馈观察到,文心一言凭借其海量的知识、数据等资源优势,获得大批网友的青睐。大家十分期望文心一言为自己提供知识类服务,进行内容生成。大家的诉求专业性更强,期待文心一言能够提供更多专业、精准的内容服务,服务于自己的工作和学习等多个场景。
百度首席技术官王海峰介绍,百度构建了面向中文、服务应用、富含知识的多样化训练数据,使文心一言掌握的知识更精准,更懂中文和应用场景,并建立了人类反馈、奖励模型和策略优化的飞轮机制。随着真实用户反馈越来越多,文心一言的效果会越来越好,能力会越来越强。文心一言融合不同类型的数据和知识,能够自动构造提示,包括实例、提纲、规范、知识点和思维链等,提供丰富的参考信息,激发模型相关知识,从而生成高质量结果。
百度对文心一言的定位是一个通用的赋能平台,千行百业都可以基于这个平台来实现智能化变革,实现效率提升,创造更大的商业价值。
李彦宏表示:“之后,文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给人‘士别三日,当刮目相看’的惊喜。文心一言这样的大语言模型,将成为每个人必不可少的生产力工具。”