敦煌遗书数据库简介

2012年01月31日11:02
  一、《敦煌遗书数据库》说明

  《敦煌遗书数据库》是为《敦煌遗书总目索引新编》(施萍婷主撰稿 邰惠莉协编 北京 中华书局 2000年7月出版)研制的机算机查询检索程序。由敦煌研究院文献所和兰州大学图书馆联合研制开发。

  1962年商务出版社出版了王重民、刘铭恕先生编著的《敦煌遗书总目索引》,公布了英藏、法藏、北图藏及国内外散藏的敦煌遗书约2万余号。是敦煌学界第一次比较完整意义上的敦煌遗书目录。此书的编纂在体例上有许多可取之处,在叙录中采用了“题记”、“说明”项,揭示卷子内容,反映考证结论。对所收条目编制笔画索引,外化研究成果。自出版之日起就倍受敦煌学界好评,成为研究敦煌文献不可或缺的工具书。

  1986年,台湾新文丰出版公司出版了黄永武主编的《敦煌遗书最新目录》,对《敦煌遗书总目索引》未定名的一大批佛经进行定名,并公布了列宁格勒所藏敦煌遗书目录。在编制体例上省略了“题记”、“本文”、“说明”项,没有编制索引,不能直观地给读者更多的信息。《敦煌遗书总目索引新编》是综合以上二书的优点于一身,增加了标志、按等揭示写卷内容的说明部分,尽可能反映敦煌遗书研究近百年研究成果的一本综合性目录。《敦煌遗书数据库》以新编总目为依据,利用机算机强大的信息处理功能,方便、快捷、准确、全面地向使用者提供所需信息。

  二、《敦煌遗书数据库》的建库

  目前使用的敦煌遗书目录一般是由卷号、名称(经名)组成。有些目录包括题记、本文、说明等项。但现有的这些还不能完整地反映一件遗书的面貌。对于敦煌研究的使用者来说,研究的方向不同,对遗书目录的检索也有特殊的要求。构想设计这个遗书总目数据库时,我们试图尽可能全面地将遗书所能涉及的内容包涵进去。

  敦煌遗书数据库的应用程序需涵盖敦煌遗书的基本信息。包括:遗书的收藏地、统一编号(卷号)、名称(经名)、标志、分类号、对应号、题记、说明、本文、按、图等相对完整的敦煌遗书目录所包括的信息内容。数据库的应用程序须有相对完备的数据库维护功能,能进行数据的录入、数据检索、数据修改等。应用程序还应能满足对数据统计和分析的要求。

  根据信息组织的需要和用户使用的需求,确定数据库只需一张数据表格就能涵盖所有相关信息,该数据表格应包含如条目:

  1、统一编号(KTYZ)编号指收藏单位对文献所给予的流水号。在数据库中起着查重的作用。

  2、 收藏地(KSCD)以代码的形式反映遗书的收藏地点。。

  3、对应号(KDYH)仅适用于北京图书馆。北京图书馆所藏敦煌文献在1909年入藏时,是采用我国传统的千字文分类法,从“地”字开始至“位”字结束,缺“天”、“玄”、“火”,共八十七字,每字编一百号,共编8738号。1930年陈垣先生编著《敦煌劫余录》时,按分类整理排序,虽然没有编著新的顺序号,却也没有再按千字文号排序。1979年北京图书馆拍摄缩微胶卷时,也是按《敦煌劫余录》的顺序重新编号即现在使用的顺序号。但长期以来学者在使用时采用的还是千字文号。这次编著《敦煌遗书总目索引新编》时,北京图书馆采用顺序号,在顺序号后用小括号对应千字文号。计算机在管理中,自动按汉语拼音的顺序排序,当使用千字文号进行检索时,就形成了既不是千字文号排序,又不是顺序号的排序,检索千字文的某一个字时,这时显示的排序不是从1~100号,而是在千字文编号后按顺序号的大小排序的,这是在使用过程中需要特别注意的地方。

  4、经名(名KJMZ)即该遗书所抄写的实际内容的直接反映。此条目在数据库的要求中不能成为空值。

  5、 品名(KPMZ)反映经卷中所存在的子目项,多用于佛经。

  6、标志(KBZZ)是遗书保存现状的反映,也是我们定名的依据之一。按原卷的实际情况著录,用代码的形式注明为首题、尾题、原题、首缺、尾缺、首尾俱全、首尾俱残、中题、拟名等十二种。

  7、分类号(KFLZ)按类别归属遗书。依文献内容分十三大类约七十小类,最细分至三级编码。

  8、 原文(KBWZ)比较特殊或有重要学术价值的文献,照录原文,对不甚重要或无明确意义的杂写,在说明项中叙述。

  9、 题记(KTJZ)是透露经卷书写年代、书写因由及施主或受持者目的等信息的最有价值的部分,本数据库一律全文抄录。敦煌遗书中的题记有纪年题识、译经题记、写经缘由题记、受持者题记等。

  10、 现状(XIANZHUANG)反映文献卷长、卷高、纸质、纸张数、天头、地脚等详细资料。

  11、 图片(TUPIANMIN)遗书是具体形象的实物资料,将每件遗书的原貌以图片的形式输入数据库,以利于读者研究。目前只有少数遗书的图片输入,在本数据库中留下该字段,以便于将来数据库内容的扩展。

  12、说明(KSMZ)是诸项中最为灵活、信息量最大的部分。对原卷内容的揭示(如佛经中的品题)、对卷子的文字描述(书法、品相、避讳字、武周新字、尾轴、校勘、经音字)等都可放入说明项。

  13、按是对《敦煌遗书总目索引》内容的扩充和增补。刘铭恕先生的《斯坦因劫经录》列有“说明”一项,王重民先生的《伯希和劫经录》也有说明项,只是没有冠“说明”二字。《敦煌遗书总目索引新编》保留了王、刘二位先生的“说明”项,而将新加的说明改用“按”,以示区别。“按”是体现作者对经卷主观认识的窗口。对该卷研究的现状、定名的依据、及与此卷相关的内容介绍均可入此。

  三、《敦煌遗书数据库》前端编程和运行系统

  (一)、前端编程:

  1、 编程软件:DELPH15

  2、 运行环境:486以上机型、WIN95/WIN98操作系统。

  3、 运行方式:运行SETUP进入安装程序,按提示进行安装;安装完毕地即可直接使用。

  4、 软件功能:该软件具有一般的数据库应用程序年具有的基本功能,包括:

  数据录入(方便用户大批量录入新数据)

  数据检索(支持多种模糊查询功能)

  数据修改(查询修改在同一界面下,方便快捷)

  数据排序(对检索出的数据根据用户要求进行排序,有四种选择)

  报表打印(允许用户对检索出来的数据进行打印操作)

  5、软件特点:Windows风格的图形界面,方便、友好;

  按钮式操作,简单、明了;

  弹出式说明项,即时掌握程序动作情况;

  即时查看、即时修改,使对数据库的操作更快捷、可靠;

  支持模糊查询,更方便,为数据的统计、分析提供了可能;

  方便的报表打印功能,方便用户查得的数据即时打印。

  (二)、运行程序:

  数据库是存放在系统内的有一定的组织形式的数据集合。为了确保数据的唯一性和查询的方便快捷,需要给数据库定义主关键词。主关键词必须是能唯一确定整条信息,即在一张报表中主关键词的值不能重复,也不能为空值。这就需要结合本数据库中存储的信息内容及字段划定出合适的主关键词。在本表中,存储的是一些关于敦煌卷子的基本信息,包括卷子的名称、品名、收藏地、对应号、分类号、说明、本文、题记、按语等。由于说明、本文、题记、按语等都可能为空值;收藏地、分类又有可能重复,这些字段都不能做主关键词。经名和品名比较集中地反映了数据的信息,但是由于信息的特殊性,是有可能出现经名或品名相同的数据,如下两条数据:

  阿弥陀经 出067 分类号同为00011(佛教典籍类 佛经)

  阿弥陀经 芥040 分类号同为00011(佛教典籍类 佛经)

  这两条数据的经名相同,分类号相同,但显然是两条数据,必须录入两次;若以名称为主关键字,则数据将会拒绝第二条纪录的录入,同理,分类号也不合适单独作为主关键词。

  综合以上所有情况考虑,我们把“统一编号(KTYZ)”作为主关键词。因为它既不会是空值,也不会重复,唯一确定了数据库中的每一条纪录。

  为了查询方便、显示数据时的有续、规整,还需要给数据库中的表添加索引。在本数据库中添加了“统一编号”这一项的索引,定义为“升序、无重复”。“升序”即按“统一编号”对数据项中序号自动排序和识别大小写。

  在数据应用程序中,为了根据用户的不同需要对数据进行排序,采用SQL查询语句中的“ORDER BY字段名”排序语言实现按不同的字段对数据进行排序和操作。如,用户希望将现有的数据按“经名”进行排序列表,程序将运行更新子程序,在其中添加“ORDER BY LJMZ”语句,实现按“经名”对数据进行排序的操作。程序中提供了四种排序方式供用户选择:“按经名排序”、“按统一编号排序”、“按分类号排序”和“按收藏地排序”。

  数据库有ACCESS和PARADOX两种数据库类型,即便于用户使用SCCESS直接打开、修改,也使用户使用“敦煌遗书数据库”应用程序时对数据库的访问更加安全、快捷。

  四、《敦煌遗书数据库》应用程序

  数据库应用程序就是对遗书资料的存贮、修改、管理、查询、显示和打印。

  1、 存贮即数据的记录。本系统设计了方便的视窗式输入,在系统的提示下按顺序输入信息。对存贮的信息设计了安全系统,可永久保存数据。

  2、 修改:如果要对已有信息进行修改,不需要再进入到输入程序中,这是数据库为了自身的安全而附加的一项保护措施。只要进入数据库使用程序,在列表状态下目录中的所有数据表格都出现在界面中,此时只需将光标定位在需修改的目录位置,直接进行修改即可。本数据库具有操作方便、简单易学的优点。在数据库使用中设置了工具栏。只需选择工具栏中的符号,即可到行首、行尾、文件首、文件尾、删除一条旧记录、增加一条新记录等。如要添加或删除一条记录,首先在工具栏中选择添加(+)或删除(-)命令,选择确定符号执行命令即可。

  3、查询:是数据库管理的实用程序。一般情况下,当我们寻找所需要的信息时,传统的方式是采用按笔划排序的笔顺或按汉语读音排序的音序,而所能进入这两项索引的音序或笔顺基本局限于目录的第一个字。而分类检索法,可将相同内容归纳在一起,前提是要熟练掌握规定的分类法。现代计算机检索,模糊了传统的检索概念,实现了索引的多种可能。本系统为用户建立了九种方式的查询模式,还可用“并且”和“或者”同时选用两种以上的方式组合查询。这就是说首先数据库中的各个列表均可进行检索,其次单项的检索可实现任何字串的检索。在查询时可选择自己所希望的查询方式:前匹配方式(所检索的字串出现在文献首)、后匹配方式(所检索的字串出现文献尾)、任意匹配方式(所检索的字串出现在任意部位)、精确查询方式等。

  4、显示:进入数据库管理程序,是用视窗表格形式显示信息,除此之外,用户可根据自己的需要利用查询功能显示信息。利用统计工具用逻辑组配或按顺序号排序方式显示结果。

  5、打印:数据库管理系统可以很方便地根据用户要求,采用表格、文本的形式将所需内容打印出来,在打印之前,可以对所需信息进行编辑,以满足不同的使用要求。

  五、《敦煌遗书数据库》的前景及扩展性

  《敦煌遗书数据库》目前并不完善,首先收录的内容就不完整。据目前已公布的世界各地收藏的敦煌遗书目录统计,遗书的数量约五万件。目前我们的数据库收录的法藏、英藏、北图藏约2万件左右仅占全部遗书的50%左右。另有俄罗斯存约1万8千余件;斯坦因6980后残缺部分约6千件;日本19个收藏单位及私人收藏约1000件;印度收藏的非汉文部分;德国3件;瑞典的数件回鹘文写卷;丹麦14件等约有近2万件还没有完全公开目录。国内收藏中北京图书馆还有新编号约7000件,国内其它9个省市25个文博单位收藏有大约2000余件敦煌遗书,私人手中也还有零星的收藏。将这一部分数量巨大的目录收入数据库,才是完整意义上的《敦煌遗书总目数据库》。其次,对数据库本身来讲尚有待于进一步完善和充实。

  敦煌学研究迎来新世纪之际,将已有的研究成果反映在目录中,建设专题的敦煌学数据库,是敦煌学发展的必然趋势。目前遗书研究向着专题化、纵深化的方向发展。利用敦煌遗书数据库,可以更快捷、更方便地将专题目录归纳在一起,为研究提供了更有利的工具。计算机发展日新月异,容量更大、速度更快的新机型不断涌现,使编制容纳大量遗书内容的实用性数据库成为可能。现代信息高速公路,也可通过网上的传递以实现全球共享最新的研究成果。(邰惠莉 沈子君) 来源敦煌研究所)