古籍数字化对学术的影响及其对未来的发展方向
栏目:新闻资讯 发布时间:2020-12-01
 数字古籍给历史学、古典文学研究等学科带来的便利已经是引人注目的事实,《四部丛刊》、《四库全书》已经成为文史研究者电脑的必要工具。看到古籍数字化的美好前景,一些科研机构、高等院校、商业公司纷纷投入巨资,对上晋以后到清末的各种古籍著作进行数字化处理。

 古籍数字化对学术的影响及其对未来的发展方向(图1)

 数字古籍给历史学、古典文学研究等学科带来的便利已经是引人注目的事实,《四部丛刊》、《四库全书》已经成为文史研究者电脑的必要工具。看到古籍数字化的美好前景,一些科研机构、高等院校、商业公司纷纷投入巨资,对上晋以后到清末的各种古籍著作进行数字化处理。但是,由于笔者有限的见闻,特别适合学者,对学科发展有重要影响的特色数据库还很少。另一方面,对古籍数字化的理论探索相对滞后,对选题设置、数字化对象、处理方式、元数据标准等的理论深度探索尚少。在实际运营中,有时会出现选择题重复、资源浪费、效率低下等问题。另一方面,几乎所有学者都认为数字化的电子版古籍是有用的,每当出现新的电子版时,就会迅速占领很多学者的硬盘。另一方面,几乎没有学者从事历史学和古代文学研究。与IT专家一起规划和推进古籍数字化进程。这种情况极大地制约了古籍数字化的良性发展。总结近几年古籍数字化的经验教训,探讨古籍数字化对相关学科学术发展的影响,探索新技术条件下古籍数字化的特点和运行方式,促进古籍数字化与文史学科发展的密切联系,是摆在IT行业和文史从业者面前的重要课题。笔者希望不要浅薄,稍微解决其中的一两个小问题,扔砖引玉,学术界专家可以教我。


  珍藏的历史书籍、古籍扫描是图书馆、档案馆、博物馆面临的重要工作。为了让更多的人共享宝贵的历史文案,如何迅速有效地将书籍和古籍转换成随时共享的电子影像资料,是档案工作者亟待解决的最重要问题。


  Book2net(伯尼)非接触超高速书籍扫描仪的诞生立即解决了这个问题。以相机为中心的设计,无需拆文件,在生成电子视频的同时,可以确保珍贵的原件不受损,并在图书馆、档案馆、博物馆、法院、政府等行业快速高效地捕捉文档图像。


  KIOSK  KOSIN  A2生产型书籍扫描仪沿袭了德系产品特有的先进技术和优秀品质。搭载的图像增强处理软件是本公司技术人员经过多年研究探索开发的高端解决方案。扫描速度为0.3秒,扫描周期为1.9秒,提供无与伦比的生产力。将过程扫描管理、连接到独立PC、自动剪切、自动校正、自动分页等多种功能集成到批处理命令中,通过一次扫描即可自动处理图像,从而大大提高工作效率。一次生成一个PDF多页文件,节省时间和精力,是各系统机构扫描文档的首选解决方案。


  一、古籍数字化对学术研究的影响


  毫无疑问,对很多文史科研、教职人员来说,古籍数字化进程越快,对科研和教学工作越有利。但是古书的数字化究竟对学术研究有什么影响?这种作用是只停留在工具层面,还是渗透到历史学和古典文学研究内部?它是在比较浅的水平上使学科发生什么样的表层变化?还是对这种历史悠久的传统学科进行更深层次的根本性改造?这是所有当代文史研究人员都无法回避的问题。笔者认为,避免或无视古籍数字化对文史研究的深刻影响,必然会导致研究水平的落后。这种落后,不仅作为研究手段不能与时俱进,而且古籍数字化对文史研究这一传统学科的深入介入,暴露出学科发展前所未有的一些新特点,不能适应这种变化的学术研究必然落后于时代的要求。


  笔者认为古籍数字化对文史工作者至少有以下影响。


  1.改变了学者们审查图书的方式。学者们可以用可移动硬盘或类似的便携式存储器携带中型图书馆。随着无线网络的发展和国际通用信用卡的普及,预计学者们可以随时随地找到互联网的丰富资源和世界各图书馆的藏书。一些理论家认为,喜欢互联网的人只是剪贴网上的东西,拼凑别人的文章,收集一些没有创意的文章。这种批评不能说完全没有道理,学术界也确实存在这样的人。不可否认,网络上各种资源的质量参差不齐,垃圾信息也随处可见。问题是,抄袭、假造他人文章的行为不是网络本身的缺陷。抄袭、抄袭行为是在互联网出现之前大量存在的。互联网的出现只会使这种行为更加方便地实施。行为的主体是人,不能怪网络。同样,随着可以远程访问的数据库的增加,高质量的学术信息和数字图书也在迅速增加,这一点不容忽视。各国数字图书馆、虚拟博物馆建设如火如荼。存放在不同国家和地区的这些宝贵资源过去常常因距离和成本等因素而无法得到一般学者的期待。现在只要有通行支付手段,就可以随时通过网络使用。


  这种阅读方式对自然科学工作者或人文社会科学工作者具有划时代的意义,文史研究者也不能例外。随着视野的扩大,学术研究方法和研究范式的进步不可避免地促进了科学研究的发展,这一点毋庸置疑。


  2.古籍数字化可以帮助学者消除重复信息的干扰,更快地研究对象和研究资料的内部。由于时间、能量、藏书等限制,一个人的阅读能力和阅读范围相当有限。杜甫可以成为历代文学家的榜样,他说:“读书打破万卷,毛笔像神一样写。”因为对古人来说,图书流通、贷款不便、家庭贫寒、几乎没有个人藏书的读书人很难读很多书。少数阅读方便的阅读者由于时间和精力的限制,只能多读一个领域的书,很少精通庆京、四史、子、家、天文、反向山等学科的普通材料。读完天下书,做学问,只是古今中外永远无法实现的梦想。随着印刷技术的急剧变化、现代学术的迅速发展、学科分类的进一步细化,知识和信息呈现出爆炸性增长趋势。对从事传统文史研究的学者来说,一方面要面对浩如烟海的古籍,另一方面要注意目前在这个学科领域不断出现的研究成果,要读的范围要比古人广得多。不管研究什么历史人物或作家,都要研究那个朝代的文化背景、交流、诗文歌曲、历史事件对人物活动的影响等,其背后的相关文献仍然相当庞大。根据传统的阅读方法,寻找这个领域有价值的信息,一定会以很低的成本遗漏重要的学术资料和信息。


  3.通过计算机的桌面查询和远程搜索技术,古籍数字化在研究方法上可能会影响学科的发展。在现代学术研究体系中,随着学者队伍的壮大,学者知识结构不断更新,学术发展向更加科学、规范、精密的方向发展。学术的发展和成熟要求学者们不再对任何现象、任何历史人物、任何作家或文学作品进行简单的分析,而是尽可能地耗尽这一领域的所有知识和信息,全面掌握历史发展规律,做出正确的解释。人文色彩最强的学科,如文史研究,也经常适用数理分析、统计运算、绘图表等方法。这使得过去学者们很难用传统方法涉足的课题得以解决。例如,古书中文学作品签名的错乱问题,自古以来,不断博学多识的学者们指出,某作品是某作品长官,某作品又可以在某人的文集诗集、诗集中看到。但是,如果想探究一代人或几代人中文学作品的作者被错误放置的总数或频率,光靠人力几乎是可以识别的。数字古籍和计算机强大的计算和识别功能,使古琴文学作品的作者能够轻松地排列错误放置的事件、总数、误差频率和误差类型。这个问题的解决有助于对古代文学作品的传播和出版物进行深入研究,对重新编制古人的文集或某一代文献丛书有很大帮助。同时,传统的研究方法也可以在古籍数字化的基础上得到根本性的改造或功能性的提高。例如,在研究作家的影响时,概括地谈谈某诗人和小说家对后世的影响是如何深远的,这是难以深刻地叙述历史真相的必要性的,因为这不能符合现代学术。利用数字古籍资源,可以比较容易地统计在后人的文学选本、著述和创作中收录或引用这位作家作品的次数和频率,还可以安排后人从单词、句法、韵律、形象等方面受到前一代作家作品影响的具体表现。这些证明当然在学术研究中更有说服力,更符合现代学术规范的要求。


  4.以古籍数字化为基础制作的数据库将对一些学科的发展产生深远的影响。例如,对板本学和西书学的重视是文史研究中的重要传统,正史中的例句、经书自古以来就是文史研究者入门的必要阅读书目。这种传统现在不能说已经失去了,但在互联网发达的今天,在文史研究中,这种基础学科本身也在发生巨大的发展和变异。按时代或类别分类的目录学、文献学书籍的重要性将降低。在web数据库中搜索这些文档目录不仅更方便,还可以找到可以随时添加的最新内容,因此现有出版物的修订和审判是一个比较长的过程。一些索引类的工具书也是文史研究人员的必要工具。但是,随着古籍文献的数字化过程,编纂对古籍的索引已经失去了原来的意义。数字化的古籍文献本身就已经具备了专业搜索功能,谁还需要看目录索引!例如,过去哈佛燕京学会编纂了《庄子引得》,现在只要在网上搜索《庄子》中的任何一个单词,就能找到正确的位置,谁还需要那个《庄子引得》?熟悉数据库和软件开发的业界人士近年来也利用计算机技术接连制作了更科学、更缜密的古籍文献索引,但读者对象主要是没有掌握计算机应用程序或索引的对象,似乎还没有电子版。随着文献数字化进程的加快和学者年龄及知识结构的变化,传统文献索引等学科工具必将结束历史使命。