盘活中华典籍的“数字家底”

讲述人:中华书局古联(北京)数字传媒科技有限公司总经理 洪涛

古籍大数据对中国传统文化领域有着独特的价值和作用。近年来,我们建立了百亿级的古籍大数据中心,可以满足不同类型的用户和研究需求。

数据作为生产要素,其质量的优劣直接影响着生产结果。因此,我们建立了严格的数据加工流程和审核机制,确保将高质量数据产品投入市场。同时,还将古籍图书的线性文本内容进行结构化处理,使隐藏在古籍文本中的知识更加突显,甚至打通不同学科之间的知识壁垒,建立知识关联,持续发掘、提升数据价值。

在古籍大数据的开放共享方面,我们积极携手各大研究机构、图书馆和高校,共同推动古籍数字资源的广泛共享与高效利用。我们研制了图像采集、文字整理、知识组织等20多项古籍数字化规范标准,确保数据在不同平台间无缝流通和共享。同时,我们采取先进技术手段,严密保护数据安全与隐私,严防数据泄露与滥用。

在交易流通方面,我们积极探索市场化运作机制,推动古籍数字资源的商业化利用。我们与20多家出版机构和科研团队合作,制定了公平交易规则和价格体系,通过国家级古籍整理与数字化综合服务平台——籍合网这个统一的线上发布平台,实现了古籍数字资源的流通和传播。在交易过程中,我们注重保护知识产权和原作者的权益,建立完善的版权保护机制,确保每一份数字资源交易合法合规。同时,我们也积极推广数字版权保护技术,提高用户的版权意识,共同维护良好的数据市场秩序。

近期,我们正尝试利用古籍大数据进行大模型研发,在自动摘要、文白翻译、自动构建古籍知识图谱等具体应用方面进行探索,不断挖掘和强化数据作为生产要素这一属性的重要价值,推动古籍大数据资源发挥更加显著的作用。

(项目团队:光明日报记者 方曲韵、杜倩、苏雁、陈雪 光明日报通讯员 李梦、金永成)

《光明日报》(2024年04月19日 07版)

责任编辑:李爱莉
分享到微信

分享到:

主办单位:中国出版集团公司 网站维护:中版集团数字传媒有限公司 技术开发:博云易讯技术有限公司 中国出版集团公司 2009,All Rights Reserved 京ICP备12053001号