没有合适的资源?快使用搜索试试~ 我知道了~
古籍文献数据库存在的问题与突破的方向――试论计算机技术在古典文献研究中的若干问题.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 173 浏览量
2022-06-04
15:04:25
上传
评论
收藏 29KB DOC 举报
温馨提示
试读
6页
古籍文献数据库存在的问题与突破的方向――试论计算机技术在古典文献研究中的若干问题
资源推荐
资源详情
资源评论
――古籍文献数据库存在的问题与突破的方向 试论计算机技术在古典文献研究中的若干问题
内容提要:文献整理与研究中的贡献是极大的,但目前存在着缺乏统一领导与规划;开
发商嗜利忘义;热门文献数据重复,冷门文献数据罕见;技术关卡重重,难以互相兼容;功
能单调,难以真正为科研服务;学术圈地,使人心有余而力难用等问题。解决这一问题的关
键在于建立公共古典文献数据库和开发个性化文献检索服务系统两个方面。具体说来是加强
总体规划,建立公共古典文献数据库;数据库内容与文献检索服务系统分离;加速确定字库
方案;彻底解决古典文献版权问题;建立公平的交易平台和现代化提供了坚实的基础,其贡
献是有目共睹的。然而,计算机技术在古典文献研究中的运用仍然存在着极为严重的缺陷也
“是不容回避的。笔者近几年来主持并直接参加设计 e ”书库 数据库的过程中,感到有必要将
自己的一些想法提供给正在设计有关软件的计算机专业人员、愿意使用该类软件的专家学者
们自然也对一切需要使用古典文献资料的专业研究)起到了极大冲击。
首先简单回顾一下计算机技术在古典文献研究领域内发展的历程。上世纪 80 年代初,
我国一些图书馆、大专院校及科研机构陆续开始大规模地利用计算机设计并建立数据库。大
致说来有两类数据库,一类是书目数据库,一类是文献数据库。南京图书馆于 90 年代初率
先建立书目数据库,对读者检索有关书目起到了极大的帮助。之后,各地图书馆纷纷效尤,
类似的书目数据库很快就普及了。虽说至今各地图书馆的书目数据库的检索方式,仍存在机
读编码格式不统一的问题,然而书目数据库提供的方便快捷的查询功能,对读者来说无疑是
一件大好事,具体到学术研究来说,至少为研究者提供了一个比较方便的查找有关古典文献
的实用工具。
在建立书目数据库的同时,一些大专院校与科研机构开始研发各自的文献数据库。从数
据制作格式来说,大致可以区分为两类,一类是图像格式,即将按原著内容扫描成 PDF 图
像文本,另一类是元数据格式,即录入文献文本内容(或扫描并转化为电子文本)导入数据
库,并转换成可阅读与检索的数据库机读格式。一般说来,无论是 PDF 格式还是元数据格
式,它们数据库容量都较大,也提供了较为原始的检索方式,为学术研究提供了不小的帮助。
从上述两类制作格式的数据库来说,PDF 图像文本可以直接阅读图像文字,但总体说来不太
适应古典文献整理与研究的需要。而元数据格式较为精致,初步具备了较为方便的常用的功
能,可以检索、作卡片等等。
古典文献数据库从收录的文献内容来说,大致可以分为两类:一类是类目数据库,即按
“ ”类 收录有关图籍,如经学类、史学类、文学类以及甲骨文、金文或出土文献资料、石刻资
料等等,另一类是综合数据库,如《四库全书》、《四部丛刊》、《国学宝典》之类数据库。
大陆最早的古典文献数据库是河南大学的《宋人笔记检索系统南宋主要科学院《全唐
诗》、《先秦魏晋南北朝诗》、《全上古三代秦汉三国六朝文》、《十三经》、《全唐文》、
《诸子集成》等数据库、北京大学《全宋诗》数据库、南京师范大学《全唐五代宋词》数据
库、四川大学《宋会要辑稿》数据库(与海外合作)等等。港台古籍数字化起步较早,均采
用繁体字形式。1984 年台湾中央研究院历史语言研究所开始研发《汉籍全文资料库》,香
港中文大学则有《汉及以前全部传世文献》、《魏晋南北朝全部传世文献》、《竹简帛书出
土文献》数据库等等。其中《竹简帛书出土文献》收录《马王堆汉墓帛书》、《武威汉简》、
《睡虎地秦墓汉简》、《银雀山汉简》、《居延汉简释文合校》及其它散见简牍共 140 多万
字的竹简帛书出土文献,价值颇高。
值得注意的是,这些数据库主要是提供给本单位研究人员使用的,当然也有部分数据库
对外开放,为其他研究者提供一定帮助。虽然这些数据库有种种限制,但它们无疑为古典文
献的研究(当然包括其它专业的学术研究)提供了方便。之后,随着网络技术的发展,各科
研机构、大专院校、各地方的图书馆、以及其它数以百计的网站向用户提供收费或不收费的
古籍文献检索服务,甚至还提供古籍文献的下载服务。显然,这些工作的开展,为学术研究
的现代化提供了极为有力的支持。至今为止,据笔者所查索到的除科研机构、大专院校、各
地图书馆数据库之外,提供各种文献下载的中文网站至少在 200 个以上,其中就有不少古籍
文献下载的网站。这些古典文献数据库或有关网站的建立,确实为古典文献整理与研究乃至
其它学术研究提供了极有价值的帮助。
当然,我们也应该清醒地看到,在古典文献数据库大量涌现的同时,一些潜在的问题与
数据库本身的缺陷严重地制约着古典文献数据库的正常发展。
从古典文献数据库技术发展角度来说,笔者认为大致经过三个发展阶段。第一阶段是
PDF 图像文本数据库,其数据来源主要是以扫描方式获得,形成 PDF 图像文本。这种图像
资源评论
老帽爬新坡
- 粉丝: 82
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功