文修大模型:

626页书稿,AI校对只用23分钟

作者:本报见习记者 蒲添

资料图片


  具备深度语义理解能力的大型模型,可以进一步增强AI校对能力,以满足更高标准的校对需求。据《中国新闻出版广电报》记者了解,蜜度科技股份有限公司的产品校对通用户已超过1万,同时他们还在尝试通过DeepSeek进一步增强AI校对能力。


  文修专业大模型赋能审校效率提升


  据蜜度科技股份有限公司研发副总裁张晓娟介绍,该公司研发的重点应用于校对通的文修校对大模型(以下简称文修大模型)已形成文字标点差错、知识性差错、内容导向风险识别三大类35个小类的错误审校能力。在测试中,利用校对通对简体转繁体的精准率可达98.58%,繁体转简体的精准率可达98.60%。

  文修大模型出版行业应用场景还包括“质检校对”辅助审读、“数字内容”辅助审读、批量校对等。其核心价值在于可以更多维、更便捷、更灵活地提供校对服务,全面提升用户的校对体验感。例如文修大模型可以对PDF文件扫描件里面的图片、文字、敏感元素、人进行自动识别,并可以对时政表述、重要讲话/报告、引用、论点检测、涉内容导向风险等内容进行审核,最后自动生成审读报告。还有一大亮点是可以节省人力成本,提升效能。大模型支持批量上传审核稿件,不用编校人员时刻守在电脑前,通过系统自动校对完成后,可以随时点击查看勘误。

  此外,文修大模型还新增图书版面分析模型,能够识别13个版面元素,格式误报率从优化前的15.9%降低到优化后的4.35%。通过分批渲染,一本626页的PDF书稿校对速度从优化前的58分19秒提升至优化后的23分6秒,可以实时校对,实时审核。


  为何要融入DeepSeek?


  文修大模型是蜜度科技股份有限公司针对校对任务和审核场景设计的专业模型,主要解决文本中存在的错别字、标点、语法、术语、规范用词、常识差错等问题,并支持文本、图片、音频、视频等多模态内容审核。

  在新闻、出版等高度专业化的实际校对场景中,用户对于专业术语、规范用词等要求极为严格,文修大模型具有更专业、更高的知识密度和更快的校对速度。例如,以时政类差错检测类型为例,文修大模型构建了专业的知识图谱,通过专项校对模型训练,检测结果准确率高于95%。

  DeepSeek作为通用大模型,擅长问答、写作、推理等多样化任务,在数学、逻辑推理等领域有着优异的表现。张晓娟表示,DeepSeek是代表通用大模型核心技术路线发展的一个方向,通过深度思考模式提升推理能力,这对文修大模型有借鉴意义。DeepSeek训练的参数规模足够大,可以在通用知识性的错误表述纠错方面有很好的表现。但DeepSeek也存在一些现实的挑战仍待解决,例如存在推理慢的问题,一本20万字的书稿需要处理5个小时以上,导致在书稿审校场景全面应用方面还有非常大的挑战。


  DeepSeek提升校对实际效能


  今年2月,校对通“DeepSeek体验版”正式上线。此次,校对通将DeepSeek深度融入文字校对场景,助力校对领域迈向智能化新高度。蜜度科技股份有限公司相关负责人介绍,校对通与满血版DeepSeek-R1融合之后,进一步提升了校对通在文字标点差错和知识性差错方面的泛化能力。例如,在对全国出版社青年编校技能竞赛试题1000 +条差错案例的测试中,校对通“DeepSeek体验版”对文字标点错误纠错的准确率提升了3.14%,知识类错误纠错的准确率提升了33.83%。

  此外,通过融合DeepSeek的深度思考能力,校对通系统在原有纠错基础上,还可以对纠错建议进行解释,让用户更直观地了解大模型的“思考”逻辑,辅助用户判断纠错结果是否可靠。

  张晓娟表示,未来校对通将持续推进与DeepSeek的深度融合,不断优化产品性能。期望通过融合,在校对速度、校对类型、校对效果上获得更好提升。

数字报|客户端|网站

Copyright 中国新闻出版广电报 | 京ICP备2024089961号-2

中国新闻出版传媒集团有限公司