谷歌的AI有意识,中国的AI“懂开车”?

2022-07-22 13:57
不久前,谷歌一研究员爆料AI有意识的事件刚上热搜,今天,2022百度世界大会上的一个小插曲,再度引发大家对AI的讨论。
7月21日上午,2022百度世界大会官方视频号直播突然被中断,随后紧急恢复。有不少网友调侃,可能是直播中提到无人驾驶,一直在说“开车”,被AI判定为违规。
这当然只是一个玩笑,但“AI已经具备人格,要意识觉醒了”似乎是AI发展历史上的永恒话题。长期关注AI的朋友都知道,这还很遥远,但其实,AI的创作能力已经到了开始抢人类“饭碗”的地步。
这次“百度世界大会”上,百度创始人、董事长兼首席执行官李彦宏分享了对于AIGC的思考,让AIGC的概念备受关注。
什么是AIGC?李彦宏指出,AIGC(AI generated content,AI生产内容)是继UGC(用户生产内容)、PGC(专业生成内容)之后,全新的内容生产方式,不仅能提升内容生产的效率,还能创造出有独特价值和独立视角的内容。
伴随着元宇宙、Web3概念的走红、下一代互联网的演进,用户对于内容的需求越来越旺盛,内容产业迫切需要升级迭代,AIGC也随之越来越被需要。
在这届以“AI深耕,万物生长”为主题的百度世界大会上,百度展现了以AI修复残画《富春山居图》的能力,这只是百度基于文心大模型AIGC能力的尝试之一。百度AI虚拟人度晓晓、希加加的对话、跳舞、作画、作词作曲的实现,也都离不开百度的AIGC能力。
有业内人士指出,看似遥远的AIGC时代已经悄悄到来,赋予了AI强大的生产力。除了百度之外,在国内市场上,互联网大厂、AI独角兽以及一众创业公司都已经将触角探入了这个前沿领域。以AI能力为基座,一场面向下一代互联网的较量已经悄悄开始。
那么,百度的AIGC长什么样?背后的AI技术发生了怎样的变革?百度在这种争夺战中处于什么位置?本文试图回答这些问题。

图片

全能AI来了?

在百度世界大会现场,一幅AI修复的《富春山居图》缓缓展现在人们眼前。
元朝画家黄公望的这幅《富春山居图》,自明朝末年遭火焚断为上下两卷后,后人再也无法得知缺失的部分。AI弥补了这一缺憾,不仅补全画作,还在画上题诗一首。就连黄公望纪念馆负责人毛传镔也说,这幅AI修复版名画“与现存真迹风格一致”。
2022722
百度利用AI技术补全《富春山居图》
AIGC的修复能力强大,效率也非常惊人。大会现场,主持人撒贝宁还在百度APP上,勾勒几笔,通过AI技术补全这幅名画,体验了一把AI修复。同样,每个人都可以对这幅名画进行AI修复,一千个人,就有一千个版本的修复版《富春山居图》。
当然,AI作画只是百度AIGC蓝图里的早期阶段,结合百度对于AIGC领域的探索,李彦宏在大会上判断AIGC将走过三个发展阶段:第一阶段是AIGC的“助手阶段”,辅助人类进行内容生产;第二阶段是AIGC的“协作阶段”,AIGC以虚实并存的数字人形态出现;第三阶段为AIGC的“原创阶段”,AIGC可以独立完成内容创作。
在第一阶段,人们的印象大多停留在单点技术上的AIGC产品,包括AI写诗、AI作曲、AI剪辑等。李彦宏举例称,他的《智能交通》一书AI超拟真有声书版本就是利用AIGC技术创作生成的。其音频合成效果还原度几近他的原声,普通用户基本无法辨别。AIGC的第三阶段,由AI独立完成从0到1的创作,当前真正意义上实现,还比较困难。李彦宏称,AI大模型的突破正在加速这一趋势。
这中间的第二个阶段,百度的度晓晓、希加加等AI数字人用行动在过去的半年里做了详细诠释。
早在2021年12月底的一场沟通会上,李彦宏就发现了AIGC概念正在走红,谈及2022年目标时表示,称要打造一个虚拟形象,由AI完成各种动作。
于是两个多月后,百度的AI虚拟偶像希加加正式出道。据了解,希加加的形象包括外形、名字、服装、发型等,都是AI技术生成,是AIGC的成果。而且,希加加具备语言、面部表情和肢体动作表达的能力,能够像人一样对话、行动,最重要的是可进行自主学习及迭代,凭借AI能力进行创作快速生成内容。过去几个月,希加加化身AI设计师,已经联合发布了多套数字藏品。
百度另一位AI数字人“度晓晓”,更是有“劳模”之称,过去半年里持续引领着AIGC潮流。文本创作上,她在上海高考时挑战了40秒完成40篇高考作文,效率惊人;图像层面,她数十秒之内创作了AIGC画作数字藏品,24小时销售额突破17万,并受邀参加西安美院毕业展;音乐层面,她和明星龚俊数字人一起作词、编曲,发布了首个虚拟偶像AIGC单曲《每分每秒每天》。
度晓晓、希加加之外,百度AI数字人家族成员还有央视网虚拟主持人小C、理财专员小浦、文博虚拟宣推官文夭夭等。
这些AI数字人们变得能听、能说、能理解、可互动,越来越“聪明”,近乎全能。
百度对于AIGC的布局,远不止打造AI数字人,更在于加速数字人的规模化落地。今年1月,百度发布了To B的百度智能云曦灵平台,这是一个整体上更接近全链路实现AIGC的数字人平台,能够为各行各业提供数字化生成和内容生产服务,降低数字人的使用门槛。
据百度数字人与机器人业务负责人李士岩介绍,百度智能云曦灵平台目前拥有四个子平台,分别是数字明星运营平台、数字人手语平台、数字人直播平台以及与交互能力相关的对话配置平台。以最近发布的数字人直播平台为例,这一平台能够生成AI主播,商家购买服务后,可以无需真人主播、中控人员、复杂硬件的支持,就能获得24小时无休的AI主播。
在AIGC的助手阶段、协作阶段,百度已经成为深度玩家。

图片

AIGC背后,谁是最大功臣?

当百度进入AIGC的第三个阶段,就需要AI大模型即预训练大模型获得新的突破了,这已经成为近几年人工智能技术和应用的重要方向。
以前AI深度学习训练模型,都要进行大量的数据标注,也面临着通用数据激增与专用数据匮乏的矛盾。AI大模型在大规模数据集上完成预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。
从2020年,OpenAI发布模型参数为1750亿的NLP预训练模型GPT-3开始,国内外大厂们,包括谷歌、微软、Meta、华为、阿里、百度等,就在预训练大模型领域展开了一场“军备竞赛”,各家开始拼参数、拼算力,参数从千亿到万亿甚至飙至10万亿。
百度从2019年就已开始积累AI预训练模型技术,先后发布飞桨深度学习开源开放平台、知识增强文心(ERNIE)系列模型。基于百度飞桨深度学习平台,百度在2021年12月发布了全球首个知识增强千亿大模型鹏城-百度·文心,参数规模达2600亿。
不过,拼参数的时代正在过去。“2022年,是AI大模型产业落地的关键年”,百度研究院认为,2022年,超大规模预训练模型将逐渐实用化、破除盲目增加参数规模的“军备竞赛”,呈现知识增强、跨模态统一建模、多学习方式共同演进的趋势。
据百度首席技术官王海峰介绍,基于飞桨深度学习平台,百度在预训练大模型领域不断精进,目前文心全景已经发布20多个大模型,既包含基础通用的大模型,也包含面向重点领域、重点任务的大模型。这次世界大会上,百度文心还推出世界上第一个航天领域的大模型——航天-百度·文心大模型。
2022722
产业级知识增强大模型文心全景图
百度的AIGC能力,离不开百度文心大模型。此次大会上AI修复的《富春山居图》,就是用到了文心大模型当中多任务统一学习的视觉大模型。文心大模型先是学习了大量的中国山水画,从山水画“小白”向“大师”进阶,然后再针对黄公望的《富春山居图》进行单样本学习,掌握其精髓,从而让补全的画作与现存真迹风格一致。
也正是百度文心大模型,让数字人能够通过AI技术以自动编排合成的方式生产内容。据了解,百度AI数字人度晓晓的陪聊对话能力,使用的是对话生成大模型文心PLATO,其现已升级到百亿参数的文心PLATO版本,在开放域对话效果上得到了持续提升。
百度数字人的画画能力,使用的是文心大模型跨模态图文生成模型ERNIE-ViLG,这种图像和文本双向生成模型,不仅可以根据个性化需求自动化生成油画、水彩画、中国画等多种风格的不同分辨率图像,还能实现“看图说话”的效果。
随着大模型技术的不断突破,百度正在加速AIGC向原创阶段发展演进,一旦跨过某个奇点,就能产生真正意义上的AI原创内容。

图片

元宇宙浪潮,离不开AIGC

2022年被不少业界人士称为AIGC元年。
从PGC、UGC到AIGC,伴随着AI技术的成熟,这场内容生产变革的背后,是下一代互联网对于数字内容的数量、形式和交互性都提出了更高的要求。市场需要以更低的成本、提高内容生产效率,创作出有独特价值和独立视角的内容。李彦宏称,未来十年,AIGC将实现以“十分之一的成本”、以百倍千倍的生产速度,去生成AI原创内容。
但不可否认,AIGC的概念还相对早期,李彦宏也是在一众互联网大佬中率先公开定义了这一概念。
观察当前的市场可以发现,很多玩家们或许还未明确AIGC概念,但从动作上早已有所涉水,总体而言,聚焦在两个板块,一个是针对AI底层技术去做突破,进行内容的生成;另一个则是围绕着数字人的形态,进行技术的整合,通过AI技术结合相关的图形识别、视觉技术、3D建模、CG渲染、动作捕捉等技术,不断完善数字人的个性化和交互能力。
无论哪个板块,都有大厂和创业公司在加码布局。其中,在AI技术层面,国内的科大讯飞、商汤、阿里、腾讯、小冰,都长期深耕。诸如AIGC技术研发商数字力场、游戏AI公司超参数科技等创业公司,聚焦在AIGC技术层面,都以AIGC概念获得了融资。
而数字人赛道在过去一年可谓风头正盛,据了解,单是2022年第一个月,融资已达近百起,金额超4亿元。虚拟人相关公司中,一类侧重于虚拟偶像、虚拟IP的内容运营,一类则是技术服务商,侧重于虚拟人相关技术的融合,并输出解决方案。参与者不乏阿里、腾讯、网易、科大讯飞、商汤这些大厂、独角兽公司。
在这些试水AIGC的市场玩家当中,百度的特色是覆盖领域广、布局深入。
和互联网大厂相比,百度做虚拟人,已经打造出了度晓晓、希加加等虚拟IP,又搭建起了包含全链路AI能力、全产业链各个环节,从建模到绑定、到动力学等能力的平台,能实现一站式数字人服务和交付。
即便放在AI赛道上,AI积累也是百度的强项。李士岩对深燃表示,百度是国内唯一一家既有视觉能力,又有语音、语义相关能力,还包括计算机图形学等全链路AI能力平台型的公司,底层全栈AI能力是曦灵的优势。
百度对于AIGC也抱有较大期望,百度研究院发布2022年十大科技趋势预测就曾指出,2022年,AIGC借助大模型的跨模态综合技术能力,将提升内容多样性,降低制作成本,将实现大规模应用。
百度有优势,过去半年里在AI虚拟人领域的频频布局,无不彰显着要在下一代互联网到来之时抢先占位的野心。

*题图来源于《银翼杀手2049》