首页 >>  正文

如何看待古籍数字化

来源:baiyundou.net   日期:2024-07-22

本文转自【人民网-人民日报海外版】;

全国累计在线发布古籍数字资源13万部(件)

数字化助古籍走出“深闺高阁”

安徽博物院文物科技保护中心纸质文物修复室的工作人员对古籍文物进行修复。

新华社记者 周 牧摄

为查阅古籍文献,要出差到各地,探访各家图书馆——这是许多古籍研究者的共同记忆。在数字时代,这种情况正发生改变。国家图书馆(国家古籍保护中心)等6家单位近日在线新增发布古籍数字资源6786部(件)。至此,全国已累计在线发布古籍数字资源13万部(件)。依托数字化手段,卷帙浩繁的古籍走出“深闺高阁”,让文明触手可及。

兼顾“藏”与“用”

古籍,作为文物必须保护,作为文献必须为读者所用。兼顾“藏”与“用”,一直是古籍保护工作的重点,而数字化是最好的方法。中国古籍数字化起步于20世纪90年代。随着数字技术不断成熟,科技赋能古籍工作取得可喜进展。

“2016年国家图书馆搭建起‘中华古籍资源库’平台,发布了普通古籍、甲骨、敦煌文献等数字资源,并全部实现免登录在线阅览。”国家图书馆副研究员南江涛介绍,国家图书馆还联合海内外收藏机构发布“法藏敦煌遗书”“天津图书馆古籍”“云南省图书馆古籍”等,基本搭建“国家古籍数字平台”架构。

随着“中华古籍保护计划”深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。国家图书馆先后联合39家单位发布数字古籍,1月4日是第7次联合发布,其中不仅包含明清版刻,还有碑帖拓本等特色资源。相关数据显示,在现有的13万部(件)数字古籍中,超过10.2万部(件)归属于“中华古籍资源库”。

“这13万部(件)古籍数字资源,对于我们研究者来说格外珍贵。”北京大学中文系教授杨海峥感叹,在线查阅免去了往返奔波图书馆的时间,平衡了古籍的文物性与文献性。

AI助力古籍整理

把纸质古籍转化成数字文本,只是古籍保护的第一步。“现有的数字古籍大多由缩微胶片转换而成,分辨率低,使用也不方便。”杨海峥举例解释,这类古籍通常不具备检索功能,想查阅某个内容,需逐篇逐页阅读原文,很难快速找到想要的知识。

人工智能的快速发展,为数字古籍的整理分类带来革命性变化。2022年10月,由字节跳动与北京大学数字人文研究中心合作研发的数字古籍平台“识典古籍”便是一个生动案例。

进入“识典古籍”的网站,记者看到《周易》《左传》《礼记》等陈列于首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既顺应现代人的阅读习惯,又还原了古籍纸张的阅读美感。

“与一些数字化平台不同,‘识典古籍’是完全免费的,而且增加了简繁体转换、底本影像对照、全文检索等一系列便捷功能。”抖音集团企业社会责任部产品总经理唐垲鑫介绍,该平台主要应用了文字识别、自动标点和命名实体识别这3种技术,不仅能将影印本上的文字提取整理,还能通过序列标注识别文本中的人名、地名等信息,准确率达到96%至97%。

“平台已整理上线了685部经典古籍,共计7900多万字,主要来自《四部丛刊》。”唐垲鑫说,“识典古籍”已上线手机移动版,未来平台中的书目将持续更新。

业内人士预测,随着AI技术的运用,古籍文献中所蕴藏的古代历史文化知识将不断被抽取,构造成各种各样的知识库,并将以知识图谱的形式支持互联网前端应用。

跨界合作成趋势

事实上,在“识典古籍”上线之前,文保机构、科研院校与互联网公司的跨界合作已越来越普遍。比如,腾讯联合敦煌研究院开发了AI病害识别技术,帮助“问诊”敦煌千年壁画。

由于在产品研发、设计方面存在优势,互联网公司等社会力量的加入会进一步保障古籍数字化平台的服务质量。“我们有优秀的产品经理、设计师、软件工程师,能够不断优化数字古籍平台的产品功能。”唐垲鑫说。

“识典古籍”的诞生离不开专家学者支持。北京大学数字人文研究中心主任王军表示,北大在这次合作中负责人工审核与校对,弥补人工智能有识别错误率的短板,并利用自有学术平台,连接更多专业研究者和学生群体。

专家认为,在古籍整理中,人文社科学者要积极介入,并加强与技术人员的合作,那样才能更好地利用机器而不是被机器牵着鼻子走,从而保证结果的准确性。

“高校古典文献学等相关专业如何培养兼具技术与学术能力的复合型人才、如何形成多学科交叉的课程体系等,都是需要综合考虑的问题。”王军说。

","force_purephv":"0","gnid":"9d755525ed44d9489","img_data":[{"flag":2,"img":[{"desc":"","height":"229","title":"","url":"https://p0.ssl.img.360kuai.com/t01534020f9252f92ad.jpg","width":"400"}]}],"original":0,"pat":"art_src_1,fts0,sts0","powerby":"hbase","pub_time":1675048684000,"pure":"","rawurl":"http://zm.news.so.com/e4da75fb335a6db260e52f0a978a1d4e","redirect":0,"rptid":"835bb8d155d62760","s":"t","src":"环球网","tag":[{"clk":"kculture_1:北京大学","k":"北京大学","u":""}],"title":"数字化助古籍走出“深闺高阁”

邰差山4301李约瑟 - “李约瑟难题”是什么?解开了么?
凌卫李17214896740 ______ 李约瑟先生在研究中国科学技术发展史的过程中,提出了这样一个问题,就是在公元... 在知识经济条件下,正确理解和看待中国传统文化的科学精神是我们走向民主、自由...

邰差山4301女子的艺术体操主要有哪些比赛项目?
凌卫李17214896740 ______ 与女子项目不同的是,女子的艺术体操主要有:绳操、圈操、球操、棒操和带操五种;而男子的通常没有球操和棒操,但加入了棍操

邰差山4301面条是意大利人发明的?
凌卫李17214896740 ______ 面条的由来 我国的面条起源于汉代.那时面食统称为饼,因面条要在“汤”中煮熟,... 古籍中第一次出现关于挂面的文字记载,乃元人忽思慧的《饮膳正要》:“挂面,补...

邰差山4301联系的特点是什么
凌卫李17214896740 ______ 联系具有的四个特点:1、普遍性:时时有联系,处处有联系.联系普遍存在,每个事物都通过中介和其他事物联系,又同时是其他事物联系的中介.2、客观性:联系是客观存在的,不因主观转移.3、多样性:联系的存在是多样的,例如有直接联系和间接联系.4、条件性:(在一定条件下产生联系)条件对事物发展和人的活动有支持和抑制作用;条件不是一成不变的,人可以发挥主观能动创造事物发展所需要的条件;条件的创造不是任意的,要符合事物发展的客观规律.

邰差山4301你怎样理解“适者生存,不适者淘汰”这句话?你觉得它有什么现实意义?
凌卫李17214896740 ______ 这句话比较适合现在的工作岗位,现在的竞争激烈,适者生存,意思是工作岗位要适合的人,淘汰很明显就是中国最不缺的就是人,你不干有的是人,你搞不好还是一样,物竞天择,适者生存

邰差山4301吃香蕉的好处 - 吃香蕉有什么好处,有什么禁忌吗,什么人不适合吃香蕉?
凌卫李17214896740 ______ 从营养角度看,香蕉是淀粉质丰富的有益水果,而从中医学角度去分析,香蕉味甘性寒,可清热润肠,促进肠胃蠕动,但脾虚泄泻者却不宜.凡事总有合理解释,香蕉性寒...

邰差山4301知识管理的阶段
凌卫李17214896740 ______ 知识管理需要五阶段的操作活动:获取、存储、解释、传播和为改进公司绩效目的而进行的内部和外部信息的审计,它能使企业组织更好的了解他们的知识环境,更好的创造和应用技术来管理知识.

邰差山4301小学要求学生掌握的标点符号有哪些? -
凌卫李17214896740 ______[答案] 常用标点符号用法简表 一、基本定义 句子,前后都有停顿,并带有一定的句调,表示相对完整的意义.句子前后或中间的停... 半字线“—”(占半个字的位置)、和浪纹“~”(占一个字的位置).⑦专名号只用在古籍或某些文史著作里面.为了跟专名...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024