以AI助力出版数智化转型

作者:同方知网数字出版中心副总经理龚婷同方知网腾云系列产品线项目经理 何朝辉 来源:中国新闻出版广电报 时间:2024-05-28

腾云出版行业大模型架构图




腾云出版行业大模型应用场景


  自2022年11月OpenAI发布ChatGPT后,国内外各互联网企业、科研机构等争相布局大模型,抢抓时代发展的新风口,各类大模型如雨后春笋般涌现。人工智能大模型技术在赋能千行百业的同时,也不断推动着内容生产方式、出版业务流程的变革,彰显着高质量出版数据的价值,为出版业带来了新的发展机遇和挑战。

  同方知网作为一家数字出版企业,在服务全国各行业知识创新与学习的同时,也在人工智能技术赋能出版转型方面做了大量的探索与实践。2023年,同方知网与华为联合成立人工智能联合创新实验室,共同打造自主可控、可信增强的中华知识大模型,重点解决已有大模型知识记忆错误、信息时效性不足、逻辑推理错乱、缺乏专业知识的问题。

  在此基础上,同方知网面向出版行业应用场景,利用出版相关的高质量专业知识资源(全国书目、出版规范、出版专业论文、评审意见、词典百科等)进行可信增强,推出了腾云出版行业大模型,并全面升级相关产品和服务,打造了新一代腾云数字出版平台。将AI技术全面融入“策、采、编、审、发、评”等各环节,通过研究趋势分析、AIGC检测、智能审校、学者画像、审稿人智能推荐、精准推送、知识溯源等一系列智能化的出版工具或服务,赋能学术出版数智化转型。

  在选题策划环节,提供腾云出版大数据选题系统和期刊决策分析系统,基于中国知网出版大数据、用户行为大数据、文献引证大数据分析,结合AI大模型技术,为编辑提供最新研究热点、新兴主题推荐、作者推荐、选题评价、图书评价、市场分析等客观数据服务,实现选题策划、选题推荐和精准作者推荐。

  在内容创作环节,提供CNKI写作投稿服务平台,实现AI智能写作服务,将大模型内容生成能力与专业知识库融合,面向技术方案、调研报告、规划报告、研究报告、工作总结等写作场景,辅助用户快速、高效地生成各类专业文档,实现精准选刊、稿件润色和快速投稿等服务,并集成智能审校、参考文献审校、翻译助手等特色工具,全面解决学术论文写作和发表过程中遇到的各类困扰。

  在稿件审校环节,提供腾云期刊采编平台和腾云图书稿件预审系统,实现对期刊文献的采编和对图书稿件的预审,集成多个针对稿件的智能化检测工具,其中智能审校工具可实现对导向观点问题的预警,以及对涉政、涉恐、涉暴内容和编校差错的检校;AIGC检测工具能准确识别稿件中是否存在国内外主流AI生成的内容;抄袭检测工具充分利用中国知网的海量文献作为比对库,准确识别稿件中的抄袭内容。

  在出版环节,提供格式精灵,实现对期刊文献、学位论文、图书稿件的智能化排版功能,提供4000多个期刊排版模板和1000多所高校的学位论文版式模板,仅需几分钟即可自动完成稿件排版。

  在发布传播环节,提供腾云网刊平台和精准推送服务,实现对期刊内容的广泛发布和精准传播。基于学者画像,利用邮件推送、微信推送、CNKI读者推送等多种方式,进行文献精准推送,基于中国知网海量读者数据和文献数据,通过大数据算法进行匹配,将最合适的文献推送给读者。

  此外,同方知网依托自身的华知大模型底座及专业大模型技术团队,通过全方位多维度合作,整合多方高质量数据,与各出版机构共同服务行业的智能化升级。一方面,提供便捷的向量库生成工具、AI KBase向量数据库,支持将出版机构的图书、历年构建的知识库、有价值的会议纪要、各种内部文档等生成向量和向量库,挂载在大模型上,提供检索增强生成(RAG)服务,利用出版机构高质量数据、大模型的自然语言理解和生成能力,为广大用户提供专业友好的知识服务。另一方面,利用中国知网的高质量数据以及强大数据处理能力、大模型预训练和微调能力,打造面向行业、面向业务、面向特定场景的各类垂直大模型,共同为行业提供更智能化的服务。

  同方知网为出版机构提供多种部署模式的大模型服务,通过私有化部署,提供“模型+昇腾服务器”软硬一体化服务;提供本地训练、推理方面的技术支持和服务,帮助出版机构从零开始构建模型;采用云端“大模型租用+本地向量库部署”的模式,在确保出版资源不出社的前提下,实现资源的本地训练、本地调用;提供云服务模式,方便出版机构租用同方知网大模型算力和向量知识库,并将其融入自身的知识检索、知识服务等场景应用中,为内外部提供可信知识增强服务。

  截至目前,腾云数字出版平台已经服务了全国200多家出版社、3000多家期刊社,个人用户超过1500万,处理稿件1000多万篇,获得广泛好评。

  在人工智能技术为出版业带来颠覆性变革的当下,同方知网将与各出版机构共同努力,紧跟时代发展趋势,持续创新,不断驾驭新技术,创造出更多满足读者需求的出版产品,从而形成“大模型+”的数字出版新生态。