文章故事
欢迎光临本站
首页 | 中国民间故事 | 中国神话故事 | 国外民间故事 | 国外神话传说 | 传奇故事 | 名人故事 | 野史趣闻 | 儿童文学 | 传统文化 | 教育知识 | 百科知识 | 文化动态
当前位置:当前位置:首页>文化动态>文章内容

“汉典重光”首批实现海外20万页中文古籍“数字化回归”

作者:佚名 来源:故事谷 时间:2019-5-31 22:35:25 阅读:9

  中国海外古籍“数字化回归”项目“汉典重光”平台18日下午在北京中国科技馆正式发布,通过先进的人工智能(AI)技术,一批珍藏于美国加州大学伯克利分校的中文古籍善本,以数字化方式回归故土,落地“汉典重光”古籍平台。

   

  “汉典重光”平台称,首批20万页古籍已完成数字化,并沉淀为覆盖3万多字的古籍字典,公众可通过该平台翻阅、检索古籍,这20万页古籍的识别准确率达到97.5%。

  “汉典重光”项目由阿里巴巴公益基金会、四川大学、美国加州大学伯克利分校、中国国家图书馆、浙江图书馆合作开展,旨在寻觅流散海外的中国古籍并将其数字化、公共化,让普通人也能亲近古籍,通过古籍与先贤对话,与优秀传统文化对话。

  2019年,阿里巴巴和四川大学提出“数字化回归”设想,获得中文藏书量排名全美第三的加州大学伯克利分校支持并达成共识,将伯克利东亚图书馆的中文古籍善本逐步数字化。

  本次首批数字化的20万页古籍中,包含40余种珍贵宋元刻本、写本;明清至民国时期著名学者钱谦益、翁方纲、王韬的抄本、稿本;著名藏书楼嘉业堂、密韵楼的抄本,还有清文澜阁《四库全书》零本等。

  为将伯克利提供古籍的扫描图片和编目数据全部文字化,阿里巴巴达摩院技术团队与四川大学专家联手研发出一套全新的古籍识别系统,以97.5%的准确率完成对20万页古籍的整体识别。目前,该系统已能批量识别百本古籍,并沉淀覆盖3万多字的古籍字典。

  比起专家录入,这套人机交互的识别系统将效率提升近30倍。随着古籍识别规模的扩增,机器还会自我进化,不断提升准确率和效率。阿里巴巴达摩院院长张建锋表示,阿里计划将这套技术工具连同古籍数字化平台一并捐赠,交由权威公共机构长期运营,同时,阿里仍将在古籍数字化工作上持续投入人力物力。

  据了解,因邦交、贸易、战乱等,历史上中国古籍时有出海,近代以来,战争和动荡更加剧了古籍的损毁和流散。据不完全估计,散居海外的中国古籍超过40万部、400万册,包括甲骨简牍、敦煌遗书、宋元善本、明清精椠、拓本舆图、少数民族文献等。(来源:中新社 记者 孙自法)


上一篇 中国私人博物馆添色城市文化   下一篇 娃娃学元曲 传承非遗文化【组图】
随机推荐文章
·扎穆里姑娘
·燕子
·九个哥哥和一个妹妹
·后娘的故事
·连心溪的故事
·台湾民间故事《不老泉》
·台湾民间故事之蛇郎君
·台湾民间故事——元宵怀念椅子姑
·台湾民间故事:阿里山的传说
·台湾民间故事:邱罔舍的故事
·台湾汉族民间故事——鸭母王
·台湾民间故事——林半仙
·台湾高山族的神话传说
·半屏山的传说故事
·足迹传说
·风水传说
·神仙传说
·地道传说
·皇帝微行传说
·台湾民间故事《林投姐》
·台湾民间故事——员外选婿
·火烧岛传说
·日月潭的传说
·[台湾民间传说]半屏山和望夫石
Copyright © 2007-2014 鬼故事网 版权所有