Sora问世给出版业带来新课题

作者:支星晨 来源:中国新闻出版广电报 时间:2024-03-11

  以ChatGPT为代表的生成式人工智能(AIGC)技术让我们进入了一个大语言模型时代。现在,文生视频人工智能模型Sora可能在全世界又一次掀起轩然大波,那么Sora的问世将给出版业带来哪些深远的影响与新的课题?关于这个问题,我认为,不要被工具所困,而应当通过工具释放潜能。

  技术在跨行业应用中,尤其是在非科技行业,常常遇到一个问题,就是信息差,信息差会导致技术显得格外神秘和无所不能,这会造成两种显著的极端情况。

  一种是“唯技术论”,总感觉一项跨时代的技术能够解决全部问题,还有一种就是“反技术论”,因为不了解个中原理,导致不以为然,而且喜欢抓住一个错误不放,导致有的人觉得技术不靠谱,还是保持现状就行。

  这在出版行业非常典型,比如ChatGPT出现以后,有的编辑就总是琢磨怎么用它审稿校对,希望它变得再聪明一些;有的编辑则试了几次觉得AI生成的内容总有欠缺,干脆就弃之不顾,因此最近在有些出版社内AI的热度反而是有所降低的。

  Sora的出现,一样在出版业开始引起了一些讨论,我想提醒的是,我们不应该因为一项新技术的出现又被技术带跑偏,技术始终是要为产业所用,这一点并不因为技术的先进与否而有所变化。

  因此我觉得下面这些课题,是值得我们去思考和实践的。


  哪些与行业相关的视频可以用AI尝试生成


  从我们步入这个行业开始,就知道一个概念,出版是将作品公之于众的行为。虽然我不是这个行业的从业者,但我们公司作为一个长达10年为这个行业进行技术赋能的企业,我们也目睹了出版的内涵其实一直在演化。

  纸制品早就不是出版的单一形态,视频确实开始渗透到这个行业的很多方面,也许我们都会惊讶,原来出版业跟视频已经有了千丝万缕的联系。

  比如,现在很多教辅书会配套教师的讲解视频,科技类的教材会使用视频演示某个零件的实际内部结构,还包括现在很多出版社自己开了小红书等短视频账号,当然也不要遗漏了,很多年前就有“音像出版物”的概念,那个时候的影视剧、节目都属于视频类的出版物。

  而这其中,我们不妨先从一个简单的标准——平均时长,来判断哪些视频类型完全可以试着在Sora等一些AI工具将来成熟上线的时候生成。

  我想这一定是一种有趣的体验,而我能够预测的是,类似广告业,将来出版物的广告视频,也就是所谓的图书推广介绍视频,是肯定有不少用武之地的。

  事实上,较超前的出版社,据我所知,虽然目前Sora还不能正式使用,但他们已经在用目前已有的其他工具开始生成一些自媒体内容视频了。

  Sora出现的另外一层影响,在于我们再一次深刻地感受到AI的强大,而在国内,一定会在下面的几个月里,有很多头部公司会倾注精力在AI视频的领域。

  优质的模型一定需要更加体系化、针对性、丰富的实验数据,我一直说,出版社一定要发掘自己在大模型时代天然的价值:优质数据资源,这些数据来自精品图书、科研资料,它们都可以成为国内大模型企业的底层实验训练数据。

  因此探索这种合作的可能性,我想是非常前沿和可行的。


  哪类图书的配套视频生产更适宜借力AI


  由于Sora模型对真实物理世界的规律的审视与理解尚有提升空间,我们可以先把探索实践的重点,放在“不真实的世界”,在电影业,事实上早在2022年,斩获奥斯卡金像奖的《瞬息全宇宙》的特效团队便是在AI技术的加持下,仅靠5人就完成了后期制作,其中的名场面“热狗手”还获得了业内外的一致好评。

  图书有一种门类——童书,其配套多媒体内容已经不是什么新鲜事,大量的配套音频、动画都成为它们在市场竞争中的有力武器。

  这部分内容,如果可以通过AI加持,进行大量的规模化制作,我想是完全可以有想象空间的。

  事实上,就在前不久,中央广播电视总台发布了我国第一部文生视频AI动画片《千秋诗颂》。这迈出了非常具有意义的一步,给出版业能够带来一些参考。

  而且我倒不是特别担心所谓的“雷同”,因为童书里的每一个故事都独一无二,每一个策划编辑的想象力也不同,接下来很可能就是到了比拼想法而不是硬技术实力的时代。

  另外,一些科技类的、科普类的、工具书类的图书,存在一些解释类内容的需求。在AIGC风靡之前,这些内容往往还是以文字或图片为主,不一定足够形象可感,要解释一个事物、概念,如果都能使用视频形式,一定是事半功倍的。

  而这类视频,往往对内容的精细化要求并不高,但是对制作成本和效率要求比较高,这恰恰是短期内Sora的强项。

  既然出版社拥有海量优质的来自各类书籍的“提示语”,那么除了和大模型公司的合作外,在应用层,其实也完全可以探索建立自己的AIGC资源库,作为未来的基础设施建设的一部分。

  这个课题并不新鲜,但因为Sora的出现,我们应该会更加重视人工智能生产内容的可行性。

  至于生成哪些资源,是否先从文字和图片的生成开始,以及这些资源的生成如何标准化、系统化,前期需要哪些对数据的整理工作,这需要有一套比较完善的标准和试点。


  技术热背后关于内容安全的冷思考


  如今,我们已经能在很多自媒体平台上看到,在某些短视频的左下角,出现了“本内容可能由AI生成,请审慎甄别”的提示。

  在这个提示的背后,我想是具有复杂的意义的。因为我们对于未来的世界充斥“AI生成的内容”这件事到底是好是坏,其实本就还没有定论。

  Sora的出现,一方面,让我们意识到确实可以通过AI不断降本增效;另一方面,作为我们国家重要的内容产业支柱,出版业也必须正视那些不可控的风险,以及可能出现的伦理和法律问题。

  例如,AI生成的内容可能涉及版权问题,它可能模仿或复制已有作品的风格和内容,这就需要明确创作权和版权归属(这在AI图片领域也是一个争议热点)。

  同时,我们还需要关注内容的真实性和准确性,特别是在教育领域,任何误导性的信息都可能产生严重后果。

  随着AI技术的发展,它能够生成越来越逼真的虚假内容,比如“深度伪造”视频,这就要求我们开发更高效的检测工具,以识别和过滤这些内容,保证公众接收到的信息是可靠和安全的。

  针对这些挑战,以政府和行业协会的名义,发起建立一套AI内容生成和使用的标准和规范,确保所有参与者都遵循同样的原则和法律框架,显得更加紧迫。

  而在版权识别和内容审核方面,使用AI模型倒过来分析追溯其源头与识别过滤不合规的内容,成为重要的议题。

  总之,Sora的出现和AIGC技术的发展为出版业带来了无限的可能性,当然也带来了挑战。只有通过持续创新实践、合作与高效负责任的管理,出版业才能充分利用AIGC技术的优势,同时控制其潜在的风险。

  (作者系上海触讯信息科技有限公司副总经理)