百度:AI赋能媒体智能化
【慧聪广电网】党的十八大以来习近平总书记多次谈及AI对产业升级的重要驱动作用,而随着媒体融合的不断加深,AI成为建设新型主流媒体不可或缺的力量。百度作为我国AI产业的执牛耳者,不仅依靠技术建立了庞大的移动生态帝国,还将其在媒体内容层面二十年来的探索经验和技术积累打包成媒体解决方案通过百度智能云开放给媒体行业,将AI基因赋予给传统媒体机构。
深耕云智一体
打造AI底层技术支持
李彦宏在2021年3月23日百度香港上市现场的致辞中表示:“有1块钱的时候,我们也会投进技术里。”百度对技术的重视程度由此可见一斑。从最初的搜索引擎公司转型为如今全球领先的AI生态型公司,大数据与AI已经成为百度的核心驱动力。 ▶ 业务与战略并举,合力锻造百度智能“底色”
自成立以来,百度在业务上的探索驱动着其各个层级战略的演进,而战略的变化也推动着业务的发展。搜索引擎是一项天然的大数据服务,连接了人和信息、人和服务,其目的就是为了更好地理解用户的搜索需求,将信息与用户匹配起来。基于数十亿次的搜索请求、万亿级的数据量级,为实现“更全”“更快”“更准”的搜索需求,百度从搜索引擎开始就将大数据技术与人工智能技术的发展视为重中之重,成为了一种必然与必须。2010年初,百度成立了自然语言处理部门——尽管最初的目的是为了服务搜索中产生的智能化需求,但接下来不断在语音、图片等技术上布局,敲定了其在知识图谱技术上长期投入的战略。之后的故事,就是我们所熟悉的百度AI创业史了。从爬虫到算法,从超大规模分布式存储和计算系统到数个亚洲一流的数据中心,从“All in AI”到“云智一体”,百度以搜索引擎为原点,一边沉淀技术,一边拓展业务版图。
在2020年的组织架构调整后,百度的业务版图被划分为移动生态事业群组(MEG)、人工智能体系(AIG)、智能驾驶事业群组(IDG)、智能生活事业群组(SLG)、新兴业务事业群组(EBG)和金融服务事业群组(FSG)。其中,2020年新调整的AIG包含技术中台群组(TPG)和智能云事业群组(ACG)两大群组,由首席技术官(CTO)王海峰整体负责。同时,智慧政务、智慧医疗、智慧金融、智能客服与营销四大业务板块升级为四大事业部,并将在工业互联网、视频、物联网、工业质检、物流地图等领域加大投入。可以说,AI已经成为百度的“底色”。目前,百度AI在专利数、飞桨深度学习开源平台、AI日调用量、开发者生态规模、AI Cloud等各方面都位列行业第一。2019年,百度 AI 进入了工业大生产阶段,并与百度业务以及各行各业的生产实践深入结合;2020年,百度公布了AI新基建版图,AI商业化脚步开始提速。在发布新基建版图时,王海峰表示:“对于百度而言,我们既是AI基础设施建设者,也是AI技术及应用创新引领者和推动者。以百度大脑、飞桨、智能云等为代表的AI平台,已经成为智能时代的重要基础设施,正在帮助国家社会发展实现经济效益和社会效益的同步提升。百度正在依托包括百度大脑、飞桨、智能云、芯片、数据中心等在内的新型AI技术基础设施,推动智能交通、智慧城市、智慧金融、智慧能源、智慧医疗、工业互联网和智能制造等领域实现产业智能化升级,希望成为中国新基建AI服务最大提供商。”
▶ 云智一体,赋能行业的“动力工厂”
大约从2017年开始,百度开始整合自身的人工智能体系;2020年新AIG的成立更加明确了云计算与人工智能要成“底座”的发展方向,并随后提出了云智融合的战略思路和AI-Native的理念;2021年初,百度再次夯实了自身的人工智能战略,从“AI+云”的整合,过渡到“云智一体”的新阶段。王海峰表示,全新升级的百度智能云融合了云计算、百度大脑、大数据等百度核心技术,将在新基建大潮中,成为加速AI工业化大生产的关键力量。“云智一体”不仅要帮助企业的数据、信息、业务上云,还要用AI帮助企业完成业务能力的全面升级。
为了更好地执行新战略,百度智能云对业务架构进行了调整。新架构分为三层:底层是百度大脑,包括基础层、感知层、认知层和安全,是百度核心技术引擎;中间是平台,包括通用的基础云平台、AI中台、知识中台,以及针对场景的平台和其他关键组件;在基础层和平台的支持下,上层的智能应用和解决方案将为各行各业赋能。同时,百度智能云打造了一体化的安全体系,全面覆盖从AI模型安全到行业生态安全的方方面面,为产业智能化发展保驾护航。其中,AI中台包括AI能力引擎、AI开发平台两大核心能力以及管理平台。AI能力引擎可以为企业提供百度已有的250多项成熟的AI能力,AI开发平台拥有全球前三、国内第一且具备自主知识产权的深度学习开源框架“飞桨”。
在媒体业务领域,百度智能云中的智能多媒体平台可提供一站式音视频、图像、文档等智能多媒体解决方案,全面整合百度在图像、语音、文字领域的人工智能优势,开放百度内容生态,可应用于短视频、长视频、娱乐/赛事/游戏直播、在线教育、广电、平面媒体等场景。在技术层面,主要包括语音识别、图像识别、视频理解、增强现实等感知能力以及自然语言处理、知识图谱、用户画像等认知能力。百度以自身的业务大数据为基础,一方面推动自身移动生态的运作,另一方面则形成相关解决方案通过百度智能云向外界开放,赋能整个传媒行业。
AI技术应用
支撑移动生态发展
在百度的业务半途中,移动生态事业群正是我们所理解的媒体类业务集合,其发展离不开AI技术和能力的支撑。其实,百度的媒体类业务发展并非一帆风顺。2019年5月,沈抖出任副总裁,全面负责移动生态事业群组。上任之后,沈抖一方面主导了对百度移动生态的战略重构,搭建了以百度App为核心、以搜索+信息流为双引擎、百家号+智能小程序+托管页为三支柱的移动生态布局。另一方面,沈抖统一了用户产品、商业产品和销售体系,把移动生态业务划分为“2+2+1”的模式,即两个平台、两种垂类和一个变现平台。其中,两个平台是信息分发和互动文娱,两种垂类是知识垂类和行业垂类,这些产品都由统一的变现平台进行商业化。所以,业界也有说法称:百度的移动生态战略重心回归搜索,将在移动端重做以搜索为核心的内容生态。在新的战略思路下,百度几年前因为亏损放弃掉的“四大金刚”业务即音乐、视频、文学和游戏,又重新回来了。 ▶ 数据融通和技术赋能,支撑移动生态转型
从目前的移动生态事业群的业务划分来看,我们也可以将其拆解为信息分发的内容线和流量变现的营销线。百度利用AI技术一方面服务于智能搜索和内容的生产、审核与分发推荐等,另一方面则服务于智能营销和服务的创意策划、精准投放、效果评估乃至托管等。
基于“智能搜索+智能推荐”技术,百度移动生态形成了X+Y结构的业务布局。其中,X作为横向布局,主要包括百度App、好看视频、爱奇艺、百度贴吧等多个用户入口产品。这些产品的主要目标在于完成覆盖不同场景下用户需求的同时,能够不断扩大用户规模。Y作为纵向布局,主要目标是深耕行业垂类。
搜索业务的背后是自然语言处理、语音能力、知识图谱等AI相关能力的支持。自然语言处理技术是搜索引擎的核心技术,在百度搜索的持续发展中起到了决定性的作用;语音能力包括语音识别和语音合成,与搜索相结合,则可实现语音搜索,以满足用户的多样化需求;而知识图谱技术则是搜索引擎进阶的重要助力,通过将知识表达成机器能够处理和理解的形式,使机器能够像人类一样认知世界并做出决策。目前的百度搜索是文字搜索+图片搜索+语音搜索三种功能的集成,并通过背后的知识图谱,实现更加精准的关联与推荐,实现了智能搜索、知识图谱问答和热点事件脉络整理等功能,为用户提供更好的搜索功能和搜索结果呈现。
内容生态中的技术支持主要围绕内容运营流程展开。在内容创作方面,百家号基于百度多项AI技术打造了创作大脑,以关键词指数、以文推图、错别字纠错、热点中心、近似图搜索、图片质量检测、热点日历、版权图片识别等八大功能助力作者在创作各个环节中提升效率;除此之外,在视频业务上,百度孵化出了全自动视频生产技术——VidPress图文转视频技术,它可利用算法和AI模型帮助创作者实现全自动智能化新闻视频内容的生产,提升视频制作全流程的效率。在内容审核方面,百度利用技术和人工合力保证其内容合规。首先,百度通过AI内容风控提高内容的审核效率,其内容风控的范畴分为违法违规、垃圾信息、内容质量差等三部分,包含了图像、富媒体、文字等多种内容形式。利用图像识别、富媒体识别、自然语言处理、分类/聚类、关联挖掘、机器学习方案六大类算法能力,百度可以及时发觉色情图片、水印侵权等问题,并自动对创作者账号进行相应处理。其次,百度还利用人工辅助技术进行双重审核。根据官方招聘信息,百度的人工审核包括自有团队和外包人员。其中,外包人员主要工作包括数据标注、信息审核等;内容风控团队则负责对外包人员的监督,审核机制、业务流程、管理制度的优化等,百家号和好看视频等都设有审核运营岗位。除此之外,百度还开发了一系列算法主要面向百度搜索以加持内容合规,如蓝天算法、清风算法、冰桶算法等。在内容的推荐与分发上,百度基于百度大脑用户画像的能力、知识图谱的语义关联能力以及视频理解能力,将文章、视频背后蕴含的内容模型通过兴趣点图谱关联起来,作为关键技术应用到百度信息流、好看视频、度小视等产品中,根据大规模的数据和计算,对用户进行个性化智能推荐。 ▶ 内容数据和AI能力,助力智能营销变现
基于自身强大的移动生态提供的丰富数据和百度大脑提供的AI技术能力,百度围绕着营销打造了智能数据洞察、智能营销创意、智能投放等几个层面的能力和优势,赋能AI智能营销。目前,百度全面打通了移动生态内百度App、好看视频、百度贴吧、百度聚屏等百度系产品数据底层,不但形成了丰富的广告资源库和广阔的流量资源池,也为AI技术的发展提供了良好的数据体系。目前,百度的智能营销体系已经形成了非常成熟的产品与工具体系,并朝向SaaS的方向发展。
从工具角度来说:在智能数据洞察层面,百度大脑打造了超过200万特征和10亿+网民画像,利用百度指数实现关键词的热度和舆情能力共享,然后使用一站式全链营销数据引擎针对不同行业深度洞察品牌和用户特征,全场景多维度智能分析并进行用户触达,在投后利用百度统计监测效果人群的定向追踪能力,以智能化洞察覆盖用户的生命周期。在智能营销创意层面,百度利用AI完成创意原生化,通过AI建模+大数据打造了系列智能化创作产品和服务,帮助企业创作优质内容吸引用户,从而提升营销效果。如提供图片、视频、标题工具的创意中心、提供内容营销服务的度星选以及专业提供视频制作服务的慧合平台等,在百度营销工具体系中承担着创意生产的功能。在智能投放层面,百度可以基于其用户画像和用户的实时行为,为用户智能推荐创意并根据内容自动追投广告,并根据点过的人群和其他落地页的浏览行为进行优化,帮助提升精准投放效率。
从SaaS服务角度来说:上文提到,百度正在打造以百家号、智能小程序和托管页为三大支柱的移动生态布局。其中,托管页是面向商家的移动商业解决方案——从快速建站、运用营销工具到以技术和数据做客户管理,形成一整套闭环营销体系。百度在财报中将其解释为“一个销售和市场的SaaS,由市场工具、受众建设向赋能中小企业以人工智能能力进化。依托人工智能能力,中小企业可以实现行销自动化,客户开发,营销到销售的漏斗分析”。业界分析认为,在托管页出现后,百度竞价广告并不以导向企业主自身网站为目的,而是重构了以百度托管页的手机、电脑、微信三合一网站为载体,并建立了一套以统一用户账号为基础的用户可互动、流量可追踪、数据价值可细化的营销工具。有媒体称:托管页不仅解决了广告投放客户的数据价值最大化问题,对百度而言,也能实现移动生态内广告资源的扩容,同时,托管页作为一种营销工具,还超出了传统CPM广告形式,对稳定百度客户群、拉长服务周期价值巨大。
基于自身经验
输出AI+媒体能力
国务院印发的《新一代AI发展规划》指出我国在2020-2025年AI发展将进入第二阶段,AI成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。发力AI新基建之后,百度也将AI技术和能力体系化地开放给媒体行业,一方面形成相关工具、产品等在具体业务层赋能外部媒体机构,另一方面打包成解决方案,以深度助力媒体产业的数智化转型,加速全媒体融合进程。 ▶ 产品工具单点开放,赋能外部媒体业务
在产品和工具层面,百度以APK、API接口等形式通过百度智能云平台对外开放,主要围绕文本、语音、图片、视频层面的内容生产、分发、审核等在业务运作的具体环节上赋能外部媒体机构。
除了知识理解、语音识别、图片识别等较为基础的技术能力外,百度主要在内容创作和内容审核方面推出了智能创作平台和内容审核平台、人机审核平台。智能创作平台基于百度领先的语言与知识、多模态AI技术,从媒体内容生产全流程角度为企业提供智能策划、智慧采编、智能审校、分发助手、科学评馈五大场景功能模块,覆盖了策略选题、文章写作、内容生产、审校审核等功能。在百度和半岛新闻的合作中,半岛新闻在新闻辅助生产系统中引入了百度智能创作平台的热点发现、事件脉络接口能力,使系统可以及时获取全网及青岛本地热点事件并持续追踪,促进了其采编智能化。百度的内容审核平台和人机审核平台可对图像、文本、语音、短视频等多媒体内容进行智能审核和人工复审,以百度大脑提供的AI识别能力、包含16类色情识别标签、12类暴恐识别标签等在内的丰富标签体系和人机协同多方位助力媒体内容合规,同时还与百度的零门槛AI开发平台EasyDL打通,以降低使用门槛。社交App猫爪接入百度内容审核平台,对其用户在聊天、好友圈、微日记中UGC内容进行多维度识别和审核,缩短了用户内容从发布到呈现的周期,在促进内容传播的同时保证了社区内容生态的健康。
针对内容视频化的趋势,百度于2021年推出了智能视频云3.0,将云智一体的能力与视频技术深度融合,打造了含智能编码、智感超清、实时音视频通信、低延时直播、内容分发加速CDN、智能视频SDK等在内的AI视频基础设施,赋能视频分析、生产和应用流程。在视频内容理解分析上,百度基于强大的多元异构知识图谱增强视频深度理解,支持视频的分析、审核和检索。在视频智能生产上,智能视频云可将图文资讯、数据、图集等多种形式内容转换为视频,并基于知识图谱的结构化数据、事件脉络能力创新视频生成。在视频交互方面,百度将虚拟主播应用于视频,可适配多种媒体业务场景需求。在百度与一点资讯的合作中,一点资讯利用百度的AI能力对每日入库的海量视频进行智能化分析并提炼核心内容标签,高效地解决了其作为新闻资讯平台对于视频打标的需求,从而进一步提升了用户驻留、点击量等核心业务指标,提高了此类互联网内容平台的信息生产和传播效率。
▶ 解决方案整合输出,助力主流媒体数智化转型
针对传统主流媒体转型需求,百度云智一体的智能媒体平台提供了以智能策、采、编、审、发为主的智能媒体解决方案,帮助其搭建媒体融合的新基建,助力其进行数智化转型。
百度智能云针对媒体行业打造了媒体AI中台、媒体知识中台、媒体经营中台等媒体中台,并在此基础上形成了以智能策、采、编、审、发为主的智能解决方案。在智能策划方面,百度智能云基于跨模态语义理解、异构数据关联、热词分析、知识图谱等技术,利用海量的信息数据、热点的实时分析和专题的深度挖掘等能力帮助媒体行业实现策划全流程的自动化和智能化。智能生产方面,百度集合AI技术打造了包括智能写作、直播剪辑、AI打标等在内的生产工具矩阵,深入媒体内容生产全场景,并融合百度大数据以扩充生产资料,在数据层面为内容生产提供帮助,从而提升生产效率。智能采编层面,百度智能云利用多模AI技术进行加持,助力新闻快讯、专题报道、视频新闻等新闻业务流程智能化。智能审校方面,百度利用AI通过文本纠错、语法纠错、一致性检查等技术对采编素材、视频文字等多维度进行审校,全方位保障内容质量。智能分发层面,百度基于用户画像数据、用户行为数据等用户数据和图文、视频等内容资源,依据用户理解和内容理解能力,打造了基于知识图谱的个性化和精准化推荐。智能应用层面,百度还打造了基于数字人技术的AI主播和基于AR/VR的虚拟直播和沉浸式体验,助力媒体业务新形态的产生与发展。
百度智能云依托媒体能力和解决方案与传统主流媒体进行深层次合作,技术更加深入赋能而非仅停留于业务层面,大大加快了主流媒体进行深度融合与智能化转型的速度。2018年,百度与人民日报共建创作大脑,将全媒体内容生产工具覆盖全媒体策划、采集、编辑、传播效果分析等各环节和业务场景,大幅提高了新闻产品的生产效率;2019年,百度和央视网共建智能化媒资系统项目,不止停留于单纯媒体业务流程层面的技术合作,而是将触手深入中台构建层面,共同打造了集智能分析、智能搜索、智能语音、智能审核为一体的AI中台,更加彻底地利用AI赋能央视网的智能化转型升级,增强了主流新媒体的传播力、引导力、影响力、公信力;2021年,百度携全场景智能媒体解决方案与苏州广电共建智能媒体研发中心,将AI、大数据、云计算等技术应用于媒资管理、内容生产、内容版权等方面,帮助苏州广电打造媒体智能化新型基础设施,推动传统广电媒体打破固有边界,引领数智化转型纵深发展。
在建设新型主流媒体的过程中,百度卓越的AI能力一方面支撑着自身的媒体业务,另一方面开放给媒体行业,助力传统主流媒体在媒体融合中进行智能化转型。而AI+媒体的深度融合,对媒体产业的转型升级也发挥着重要的驱动作用。百度作为AI领域和移动生态的结合体,在未来建设新型主流媒体中如何进一步将自身能力赋能媒体融合转型,我们拭目以待。