微博:打造用户专属网络个性社区

作者:齐雅文 来源:中国新闻出版广电报 时间:2022-08-09

  □本报见习记者 齐雅文

  当前,以人工智能为代表的新一代信息技术加速创新发展。7月27日,由中国互联网协会指导、微博和新浪新闻主办的“融合生态 价值共创”2022新智者大会召开。微博首席运营官、新浪移动首席执行官、新浪AI媒体研究院院长王巍发表了题为《云为数智 技术融合应用赋能微博复杂业务场景》的主题演讲,围绕热点应对、算法推荐和内容安全方面,分享了微博的探索与创新。

  热点监测 技术扩容

  微博如何利用云计算架构的优势和技术创新,在短时间内聚集大量算力,从而帮助微博应对热点带来的流量洪峰?

  王巍表示,热点应对一直是微博业务中面临的最大挑战,微博作为全民关注的社交媒体平台和舆论广场,全社会的重大事件都会在这里发酵,很多事件都成了全民关注的超级热点,这些热点事件通常是不可预知的。

  王巍以“唐山事件”为例表示,事件当天的热点流量较日常流量峰值翻了一倍。如果按常规方案,微博除了采购应对日常流量的服务器之外,还要额外常备大量的服务器以应对这种突发热点,这会造成日常服务器大量闲置,付出较高的成本。如何用更小的资源成本应对突发的热点流量,这是第一个挑战。

  随着微博用户体量的不断增加,微博上的热点也越来越多,而且用户逐渐养成来微博消费热点的习惯。如何更快地把扩容服务器部署到线上是第二个挑战。

  微博通过不断地技术创新和应用,来应对这些挑战。

  王巍介绍,微博很早就应用了微服务+Docker容器化技术,提升服务运维的效率,实现了服务动态扩缩容能力,并且搭建了以“私有云+公有云”为资源底座的混合云平台,通过这个平台抹平自有实体服务器和多个公有云资源的差异,实现了高效的弹性部署和自动扩缩容能力。

  “当前我们已具备10分钟调度超过一万台的扩容能力,用较低的成本,获取足够的服务器来应对热点流量,从而解决了第一个挑战。”王巍说。

  另外,微博建立了热点监测机制和热点联动体系,并通过微博自研的Weibo Mesh技术,实现不同服务间跨语言的高效调用,提升整体服务的性能和联动扩容效率。王巍说:“微博从公有云获取服务器、部署服务镜像、启动服务及预热,直到线上流量承接全流程,扩容时间大幅缩短,很好地解决了第二个挑战。”

  充分理解 精准推送

  微博环境下做推荐系统,既具有鲜明的微博特色,同时又面临着复杂的业务场景。面对复杂的业务场景,微博推荐系统整体由3部分构成:内容理解、用户理解和推荐系统。

  要想明白一个微博到底在说什么,仅理解文本内容是不够的,必须采用多模态理解技术,融合博文、图片、视频等多种媒体信息。王巍说,微博结合自身特色,训练了自己的微博多模态预训练模型,通过“对比学习”,这种自监督学习方法,来进行多模态预训练。

  在用户理解方面,微博采取了超大规模图计算,来更好地理解用户的阅读兴趣是什么。“我们以用户和博文作为节点,以用户间的关注关系、用户和博文的阅读及转评赞等互动行为,建立起超大规模图。通过大规模图计算中的信息传播、汇聚和集成,形成表现用户兴趣的embedding向量,可以更好地理解用户兴趣。”王巍介绍。

  当理解了微博在讲什么,理解了微博用户的兴趣,那么就会通过微博推荐系统,将高质量的微博个性化地分发给对此感兴趣的用户。那么,如何在这种复杂场景下构造高效率的推荐系统?王巍说,微博采取了多场景建模的方式。微博通过网络参数在场景间共享,或者场景自己独享私有网络参数,来体现场景的共性与个性。通过这种方式,就可以兼顾场景的共性与个性,能够通过一个模型服务多个场景,节省模型资源。

  技术助力 安全网络

  在内容安全层面,微博采取了很多技术创新和应用。

  在日常运营中,微博严格贯彻执行《网络安全法》《数据安全法》《个人信息保护法》等法律法规和相关管理规定,投入大量资源,对有害不良信息进行清理整治,以净化网络环境。王巍坦言:“随着治理不断深入,黑灰产也呈现出激烈对抗的态势,违规图文信息更加多样、手段更加隐蔽,难以通过单模态判断有害信息,所以我们必须通过图文多模态算法,深层次融合图片+文本特征,然后通过特征融合网络进行编码,对内容合规性作出及时有效的评估,从而有效控制黑灰产的违规行为。”

  此外,为了进一步贯彻落实2022年“清朗”系列专项行动的相关要求,全面整治“饭圈”拉踩引战、网络暴力等问题。微博依托海量的微博文本语料,自研预训练模型,对站内数据进行深度语义理解、情感分析,建立了性别对立、粗俗冒犯、网暴预测等方面识别能力,对可能遭受言论攻击的用户进行保护,帮助国家和社会来营造安全、文明、和谐的网络生态环境。

  王巍表示,无论是互联网企业还是传统企业,都应该在万物互联的格局下,重新思考未来的发展战略,用AI思维去思考,用更加开放的心态与新技术去融合,让云计算、AI、大数据等技术,成为发展的基础底色,为社会创造更大价值。