当前位置: www.89677.com > 科技产品 > 正文

考据为文史研究打开一扇窗,与考据新生态

时间:2019-12-10 04:59来源:科技产品
“大数据”如今已渗透到人类生活的方方面面。随着各种数据库的大量出现,传统文史研究也发生了变化。近年来,与“e考据”和“数字人文”相关的研究日趋增多,因此,进一步探索

“大数据”如今已渗透到人类生活的方方面面。随着各种数据库的大量出现,传统文史研究也发生了变化。近年来,与“e考据”和“数字人文”相关的研究日趋增多,因此,进一步探索如何更切实地将理论、方法与研究实践有机结合,就变得十分重要。

古籍数据库就像为文史研究打开了一扇窗,外面全是待开垦的沃土,就看研究者能不能冲出去,开拓新的研究领域。台湾中研院院士、台湾清华大学教授黄一农说。日前,黄一农在北京清华大学历史系以e-考据与文史研究为主题发表演讲,分析了基于古籍数据库的e-考据对文史研究的重要影响。《中国社会科学》2011年第2期曾刊发黄一农题为《e-考据时代的新曹学研究:以曹振彦生平为例》的文章。

一种好的、行之有效的方法,本身应有完备的理论支撑,它诉之于学术的,不只是一种解决问题的工具,更应是一种理念、一种观察问题的视角,只有这样,它才能从形而下的器,升格为形而上的道。如此看来,问世不久的E考据方法在自身不断完善方面,还有很长的路要走。

扬弃既有研究成果

相较于传统的文史研究,e-考据有什么独特之处?e-考据给研究者提出了哪些新要求?记者就此采访了相关学者。

随着图书文献资料数字化的不断发展,利用数量巨大的电子资源进行学术考据研究给学者带来了很大的便利,E考据在文本电子化时代应时而出,并在文史研究领域获得广泛应用。围绕此一方法之是非得失所展开的争论,一时间也热闹非凡,引人注目。是之者认为此一方法借助高科技的力量,为传统学术研究提供了极大方便,并带来革命性的变化;非之者认为此一方法导致研究者不读原著,贪图捷径,仅利用字词检索搜罗证据,拼凑成文,甚至败坏学风。平心而论,这两种说法都只看到了事物的一个方面,并沿着此一方面作了过度的夸张,从而形成一种貌似有理的深刻片面。

大数据时代对传统文史研究产生的影响,首先表现在资料上。近些年新推出的电子资源在内容上甚至有超越传统出版物之势,检索的快捷性和精确度,可以令学者省却翻检群书、游历访书之劳。在这样的学术环境下,探讨某些疑难问题可能只需简单检索,许多“悬案”的解决难度也相应大幅度降低。前人因资料局限而不得不大量运用的“理校”“推论”“悟证”诸方法,在大数据时代无疑要重新进行扬弃。

考据为文史研究打开一扇窗,与考据新生态。e-考据不仅是技术更是态度

www.89677.com,世间任何事物都包含利弊两端,一把菜刀,可以切菜,也可以伤人;发达的互联网,可以传播海量信息,也可以成为谣言家的乐园。所谓甘蔗没有两头甜、科技犹如双刃剑,说的都是这个道理。作为一种与高科技相伴而生的方法,E考据不可能不带有母题本即存在的某些缺憾,认识不到这些缺憾而一味高度肯定,无疑是不明智的;但如果因为它有缺憾就无视其远超传统方法的优长,甚至拒绝使用,那就如同让人从大机器时代回到手工作坊,其僵化、冬烘更是不可理喻。实际上,方法本身并无好坏,关键在于人如何运用而已。与其只围绕方法说长论短,不如将注意力更多地放到如何提高使用者自身的学养上,以及如何更科学地使用此一方法上。

在学术史研究中,清人往往因所见善本不丰而大量运用“理校”法展开研究,其中有的结论或与善本相合或遭善本否定。今人既然已经能够在研究中大量占有善本供校勘,那么这种研究方法虽仍有学习的必要,但其实用性也难免会打些折扣。大量新材料理应引发大量新结论,一些“常识”或“定论”必然也会随之遭到质疑甚至颠覆,这对于现有的研究自然会有相当明显的刺激作用。近年来学界对于近代学人的成就时有争论,原因之一就在于当时学者以一人之力所做的资料性工作,精度和效率都很容易被数据库所超越。不少在民国时期“古史辨”中几乎成为公认的定论,随着出土文献的发现而被推翻(典型的例子如对《孙子兵法》的辨伪),足见新材料在某些研究领域确实处于相当核心的地位。

近年来,古籍数字化工作在文史研究的各个领域全面展开,《中国基本古籍库》、《中国方志库》、《文渊阁四库全书》等古籍数据库已成为文史研究者常用的辅助研究工具。

利用E考据进行文史学术研究,粗略想来,大致可分三个层面:

通过数据库重新打捞那些以往不被关注的文献,这实际上仍是发现新材料,其性质与考古相似,亦可称之为当下的“预流之学”(陈寅恪:《敦煌劫余录序》)。与此相关的一个问题是,在超过120亿字的可检索的古典文本,以及各种不同类型的数据库中,还蕴藏无限问题可供发掘。而这些数据资源能否被学者使用,很大程度上取决于其所在单位购买的数据库数量。在高校间已有明显“数位落差”的现实条件下,学者个人的学术水准有可能受到所处文献环境的制约,而不同文献环境导致的信息素养的差异可能会进一步拉大这一差距。

古籍数据库给文史研究带来了巨大变化,有鉴于此,黄一农在《两头蛇明末清初的第一代天主教徒》自序中首次提出e-考据的概念。他说,随着电子数据库的普及,我们有机会在很短时间内就掌握前人未曾寓目的材料,并填补探索历史细节时的许多隙缝,或透过逻辑推理的布局,迅速论断先前待考的疑惑或矛盾。事实上,一个有机会孕育e-考据学派的时代或已出现!

一是进行关键词检索,为研究积累海量资料。就笔者目力所及,当下已投入市场并可供检索的大型电子文本就有《文渊阁四库全书》(香港迪志文化出版有限公司和上海人民出版社合作出版)、《四部丛刊》(北京书同文数字化技术有限公司、万方数据电子出版社合作出版)、国学宝典(北京国学时代文化传播公司研制)、汉籍全文检索系统(陕西师大历史文化学院研制)、中国基本古籍库(北京爱如生文化交流有限公司制作),以及多种多样的网络版文献资料。这些电子文本包容量大(仅中国基本古籍库试用版即有10000种古籍书目,300种古籍全文数据和382个版本的图像数据),排列方式多样(如汉籍全文检索系统就有四部序、时代序、拼音序),检索非常便捷(如在《四库全书》电子版中输入关键词,在几秒或数十秒时间内,即可在其3461种著作79309卷中找到所有与之匹配的资料)。利用这些电子文本,大大节省了时间和人力,一人一天的工作成效胜过此前千百人一年甚或多年的工作成效。由此我们看到:一种先进的技术手段,奠定了一个崭新的学术研究背景,为研究工作提供了莫大的便利。

数据库大量涌现,学术评判标准也会发生变化。出于“功利”眼光计算,当代学者费尽周折的考据工作,很可能被下一代学者轻易解决。其原因并非人的智力、才能有别,而是文献环境不断变化提供的巨大方便使然。一代有一代之学术,面对不同的环境,学术范式也应随之转移。所以,当下正是海量文献可供使用、可以大有作为的时代,也是考据研究缺乏亮点而趋于同质化的时代。换言之,即使是在数据仍未被充分电子化的当下,考据研究的合法性也正在受到冲击。一般性的文献挖掘仍然重要,但能够解决核心学术问题的研究更为重要。

黄一农表示:e-考据不仅仅是一种技术,更是一种态度。海量的数据要求研究者有更强的问题意识,最大限度地利用可能的资源。比如,在考证曹雪芹是不是曹芹溪这一问题时,他就调动了题跋、诗文等一切有可能用到的资源。对于每一个有疑问的字词,都放到语料库中进行检索。此外,黄一农特别重视构建历史人物的人际关系网络图,这也是能够凸显古籍数据库优势的一个方面。

二是要有明确的问题意识,从历史语境出发,科学地提出问题,利用E考据方法进行多角度、多层面的词语查询。世间的事情都是有因果关系、彼此关联的,这种关联有些是直接的、显性的,有些是间接的、隐性的。倘若只将注意力放在某一时段或孤立的词语上,而忽视了它的来龙去脉和相互关联,进行单一的线性搜索,固然也能很快得到某些数据,但这些数据对问题的真正解决未必有利,有的甚至可能南辕北辙,使人深陷片面化、非学理化的泥潭。E考据的提出者黄一农教授认为:在新的历史情形下,问问题的方式将会很大程度上拉开研究者的差距。这话是有道理的。因为在电子化、网络化的时代,只有想不到的问题,很少有做不到的事情;而要想做得到且做得好,首先要能想得到、想得好、想得妙。由此而言,如何强化研究者自身的学术积累,培养对研究对象的认知度和敏感度,准确而多样化地设置检索关联项,是用好E考据并取得成效的一大关键。

引发学术伦理讨论

清华大学历史系教授刘北成认为,e-考据是一种与时俱进的研究手段,是一种新的方向,未来肯定会有新突破。信息时代要求学者在掌握传统方法的基础上具备掌握更多资讯的能力。大陆学者已开始较多地利用古籍数据库。

三是依据E考据,构建完整、全面的学术数据库。建构数据库是一个长期的过程,它要求学者有一个较之一般证据搜集更为宏阔的目标,并潜下心来,在浩如烟海的资料堆里摸爬滚打、排比统计、去粗取精、不断更新。一个数据库的建构,最初往往只是围绕某些具有固定指向的问题进行的,但随着数据的逐渐丰富,库之规模的不断扩大和完备,其所指向的问题便已不局限在一两个方面,从中还可发现此前未曾意识到的新问题,并对相关或相邻的课题做出回应。在某种意义上,数据库的建构过程,就是发现、细化和深化问题的过程。它一举而多得,虽费力而成效显著。

在电子检索受到学界瞩目的同时,一些批评尤其是对于学术伦理的讨论也随之热门起来。电子检索的高效快捷,令不少学者担忧其可能引发更严重的学术不端。比如,有的研究者可能对相关领域了解有限,但在检索工具的助力下仍敢匆匆上马,轻易立说;有的研究者征引繁复,可谓博瞻,但实际上许多材料是脱离语境的“遥读”,经不起细加辨析;有的研究者过于迷信电子文本的全面性,但却因此而忽略了那些未被电子化的文献;有些电子文本存在错误,研究者未核查原书导致误引误断;等等。

e时代对文史研究者提出更高要求

当然,一种好的、行之有效的方法,本身应有完备的理论支撑,它诉之于学术的,不只是一种解决问题的工具,更应是一种理念、一种观察问题的视角,只有这样,它才能从形而下的器,升格为形而上的道。如此看来,问世不久的E考据方法在自身不断完善方面,还有很长的路要走。而不少纸媒尚未电子化,也一定程度地限制了E考据功能更全面的发挥。

对这些实际存在甚至时显泛滥的问题,我们可以尝试从以下几个方面来进一步认识。首先,技术本身是中立的,上述批评很大程度上是在针对研究者个人的文史素养和治学态度,并未否定技术能够令优秀学者如虎添翼。而擅长检索的学者也能够认识到文史素养的重要性,并非一味依赖电子资源。从现实情况看,电子技术确实使那些曾经看上去遥不可及的一流学者,变得可以企及了,这至少是正在提升学术研究的平均水准。校勘、笺注、考据中的一些前期工作,可由计算机更精准地代劳,在人机结合的研究过程中,“高明子弟,自然沉潜”。

目前,古籍文献数据化已是东西方学界的共同趋势。欧美几大电子文献出版公司如Gale、AdamMathew等,专门制作开发电子古籍资料库,很多海外名校也致力于此项工作。在海外,不仅有如EEBO、ECCO这样的大套综合型资料库,也有很多特定领域和主题的资料库。

(作者系武汉大学中文系教授)

其次,当下的电子文本绝非完美,即使是扫描版也往往不能完全忠于原书,引用之前必须与原始文献核对,不能径用。但这恰好说明,现在的数据库还没有脱去以往“工具书”的性质。前人做研究,亦会查阅类书、索引等,甚至常有转引、代查的现象,这证明“工具”本来也不被排斥。如将数据库理解为一种高级的“逐字索引”,则其学术价值自然彰显。此外,纸质文献同样常常有误。古籍校勘中,也多有以“通行本”为底本的典范。事实上,核心问题不在于当下的电子文本有多少具体错误,而在于能否使注释具有可回溯性和规范性。如果一味排斥征引电子文本,很可能也会使数据库开发者缺乏将电子文本精确化的动力。

台湾清华大学游博清博士介绍说,古籍文献数据化给西洋史的研究带来了极大便利:第一,过去由于基础馆藏的不足,研究西洋史或中外关系史的学者常需至欧美各地图书馆调阅资料。而如今,在很短时间内,学者便能寓目研究课题部分甚至大多数的西洋古籍。第二,电子资料库机械式的全面搜寻能力和逻辑处理程式,能间接辅助人脑拥有一些以往无法操作的能力,也能让研究者查找出未曾想过的材料。第三,很多数据库已经拥有高解析度的图像,有助于研究者发掘问题。第四,由于史籍取得方便,中外学者之间很快便能就相同的史料进行讨论、对话。古籍数据化可以有效促进中外学界的交流。

促进材料深度辨析

不过,要在茫茫史料中搜寻到令人满意的材料,也取决于很多因素。游博清认为,对课题的认知与问题意识将决定搜寻的字词,而是否熟悉电子资料库的特性和搜寻技巧,一定程度上也会影响结果。e时代对文史研究者提出了更高的要求。

一般观点通常认为,电子检索作为一种“捷径”,往往令学者过于重视关键词,却忽视同一词语所处的不同语境。时代的风气、作者的习惯、史料的性质等,都在大数据时代的考据中付之阙如。在笔者看来,这种弊病在传统文史研究中同样并不少见,却有可能在大数据时代觅得新的解决契机。

黄一农告诉记者,目前海内外学者的数字鸿沟不断缩小,在新的历史情形下,问问题的方式将会很大程度上拉开研究者的差距。充分调动电子资源的前提是构建自己的知识地图,培养对材料的敏感度,这样才能穷尽各种角度发掘问题,最快地觅得数据的所在,同时配合传统文史考据的方法,做深入的研究。年轻学者需要打开眼界,了解不同的学术传统,进而占领新的学术高地。

首先,大数据时代资源丰富,找寻辅证、反例的难度都较以前小,可以在一定程度上防治孤证武断,并有益于深入理解史料所处的特殊语境。

e-考据无法取代传统阅读

其次,当大数据呈现出全部信息时,可以在多方面帮助学者辨析问题,甚至可以用“结构取义”的方式展开新的研究思路。例如高树伟在研究《永乐大典》的辑佚条例时,推翻了认为《大典》“直取全文”的成说,并且依靠海量文本对校的方式,提出了《大典》征书的新通例。这一认识既变,或许在一定程度上可以借助通例建立参考系,并以此来重新认识前人辑佚的成果,不妨称之为类似于“理校”的“理辑佚”。黄一农最近在脂批本“宁”字抄写避讳的研究中,也提及抄本研究应建立参照系,这些见解似可遥相呼应。又如在文本细读工作中,作者究竟是直接使用某一典故,还是受到文化传统影响,实际存在多种可能。笺注、考据家往往侧重于锁定甲乙间的因果承袭关系,但容易忽视文化大传统的潜在影响。近年来古代文学研究引入“互文”理论,尝试说明这种影响往往是网络状、多源多流的。张昊苏在此基础上提出“e互文”思路,意在指出大数据时代有助于深入理解这种多样性。

尽管古籍数据库为海内外的文史研究者带来了很多便利,但是学者普遍认为,电子检索永远不能取代传统的文献阅读。e-考据只是研究手段之一,并不是学术研究的全部。

借助大数据提供的便利,考据学出现了“后发先至”的现象。前辈学者经年研究的难题,很可能被新一代学人在短时间内解决。至少在这类问题上,信息素养的意义很可能要高于传统知识体系,掌握查找知识的能力很可能也比掌握知识更为高效且重要。这里并非是说新时代的学者可以不掌握知识而解决问题,而是说,信息素养可以出于研究的需要,迅速进入新的领域并建构具有针对性的知识体系,这种大幅度的跨界是传统学者较难做到的。当然,就目前的研究状况来看,大数据时代“数字人文”研究还没有作出第一流的成果,多数成果仍然是在研究具体问题,而尚未建立新的范式。但近十余年来这一领域的学术积累正以指数级速度增长,足以令人期待由“量变”产生“质变”。或许,未来传统学者也应该未雨绸缪,需要考虑能否做出不被数据库遮蔽、凸显研究者个性的学问。

复旦大学中文系教授陈尚君向记者表示,古籍检索的手段可以解决很多以往没有办法解决的问题,比如看书时记忆比较模糊,很容易就能检索到准确的信息。现代科技手段给古籍文献研究提供机遇的同时也带来了很多问题:比如一些年轻学者不读书,就靠检索拼出论文。他们对于检索得来的文本的可靠性、文本的早晚、文本的真伪缺乏判断力,看起来是旁征博引,其实只是笼统地堆砌。事实上,电子检索永远无法代替阅读,原因在于:古籍库里的文本并未考辨精详,这些文献还需要利用善本来进行校对;在可检索文献以外还有大量文献,仅仅依靠检索文献做文章,缺乏系统学科力量感;并非所有检索出来的东西都能成为好的学问,大量阅读所形成的对文史的融会贯通是检索永远无法实现的。因此,电子数据库会使学术研究提升到一个新的层次,但这只是一种高层次的机械化升级,有很多非常复杂的文献处理的问题,仍然需要动用学者所有的学术积累来完成。

(作者单位:南开大学文学院)

黄一农也特别强调,构建知识地图最重要的途径还是传统的文史功底,e-考据不只是用数据库来考据,它与传统文史考据和阅读方式不是相冲突的,相反它必须与文史基本功训练同时进行。一个学者研究能力的高下,不是取决于他使用数据库的水平和熟练程度,而是他传统文史素养的深浅。

编辑:科技产品 本文来源:考据为文史研究打开一扇窗,与考据新生态

关键词:

  • 上一篇:没有了
  • 下一篇:没有了