1 从 文献 目录学到数字目录学
20世纪80年代以来,我国目录学家一直寻求文献目录学的突破,书目情报 理论 是一个重要的突破口。书目情报理论对 现代 目录学的突出意义有两个方面:一方面,这一理论确立了目录学的基点,将目录学的核心思想从传统目录学的书目观转向现代目录学的书目情报观。另一方面,拓展了现代目录学的 研究 视野和研究 内容 ,建立了以书目情报理论为基础的文献目录学体系,加强了目录学与情报学及其它相关学科的联系。书目情报理论将文献目录学从“图书(文献)——书目(书目工作)”范畴扩大到了“文献——信息”范畴。在以书目情报为基点的文献目录学的突破中,目录学研究和书目工作的信息化推动着新目录学——数字目录学的诞生。
数字目录学有着丰富的来源和基础。从实践来源看,数字目录学的基础是文献数字化与书目工作数字化实践。以CALIS为例,其建立的联机合作编目中心、馆际互借与文献传递网、分布式联合虚拟 参考 咨询网、统一用户认证服务体系、数字资源建设与服务项目等,表现为新时期的书目工作和文献工作。书目情报的数字化过程具体包括以下方面:一是书目情报的 电子 化;二是书目情报的 网络 化,包括书目情报产品在传统的印刷、卡片形式外出现了电子版、网络版,书目产品传输的网络化,读者通过网络使用书目情报产品[1];三是书目情报的集成化;四是书目情报的智能化。
从理论来源看,数字目录学的基础是在实践的基础上对目录学 发展 的需要和对网络信息资源的探索。目录学界一直强调目录学的现代化,不断开展新领域的研究。武汉大学彭斐章教授带领他的博土生们对书目工作数字化与网络信息资源进行了许多有益的探索,发表了《网络信息资源组织与目录学的创新和发展》、《网络检索工具发展新思维》等系列论文。北京大学王锦贵教授指出:“我们应该从行动上冲破以书籍为载体的传统目录学的局限,立即把重心调整到网络信息目录工作及其检索工具上来”(《大学图书馆学报)2003年第4期)。首都图书馆倪晓建教授指出:信息加工的目的是解决信息激增与用户利用之间的矛盾,从本质上讲,属于目录学的范畴(《信息加工》,武汉大学出版社2001年版)。广东省立中山图书馆的莫少强撰文强调“数字图书馆元数据和资源共享的研究与实践”是网络环境下目录学发展的新课题(《图书情报工作》2002年第1期)。华南师范大学乔好勤教授说:对网络信息目录的研究,也可叫网络信息目录学或称网络目录学。过去有地方文献目录学、文学目录学、医学目录学等,网络目录的研究当然也可以叫网络目录学。这一新领域的开拓和研究,把目录学推向新的阶段——“网络目录学阶段”[2]。
2 数字目录学的原理构建
彭斐章教授指出:“如何 科学 地解决数字 时代 信息资源的生产、聚集、组织、传播、开发和利用等方式 方法 的 问题 ,是21世纪我国目录学研究面临的重要问题。可以说,目录学研究正进入数字时代。”[3]数字目录学正是研究数字环境下的数字资源与网络书目情报工作,解决数字资源的组织与开发利用等问题,为发展信息资源管理和信息服务提供支持的一门目录学新兴学科。
2.1 “数字资源——知识”体系
现代文献目录学是在文献交流系统“文献信息生产者——文献信息需求者”中构建的书目情报交流子系统。在数字目录学中,文献信息交流系统已经发展到数字交流环境,它不是一般意义上的“文献——读者”的体系,而是“数字资源——知识”体系。
数字资源是数字目录学的重要对象。数字资源包括网上数字资源和非网上数字资源(光盘、磁带等)两大类。对各式各样数字资源的揭示与组织、报道与传播,是数字目录学的任务。
然而,数字目录学不仅仅限于数字资源的揭示与报道,还要从知识的角度进行研究。在知识的体系中,数字目录学应当承担两种功能。
一是知识记忆与导航功能。知识资源库和知识导航系统是数字资源系统的精华。American Memory(美国记忆)是知识资源库的一个代表,它集中反映美国 历史 、文化和立法方面的资源;Ohio Memory(俄亥俄记忆)集中俄亥俄州数字历史馆藏;Unesco的Memory of the World(世界记忆)计划试图保护人类的文化遗产,这些系统将支持 社会 的知识记忆。知识导航系统的重点是学术资源导航。CALIS在“九五”期间就开始了导航库建设,各高校图书馆也在大量建设导航库。2003年10月,CALIS确定建立“十五”“重点学科网络资源导航系统”,实现全国高校网络学术资源信息共享。数字目录学家要成为“Knowledge Navigator”(知识导航员),除提供OPAC检索、跨平台检索、一站式检索外,还要提供面向主题和面向问题的知识导航,要主动地根据社会的或者读者的需求编制一些导读系统,有针对性地、定期地把某一领域的资料搜集起来做成索引,提供个性化的导航服务。
二是科学报道与评价功能。利用各种数字评价系统,通过 科技 成果评价、科学竞争力评价等,支持科学研究和创新。美国科技信息研究所出版的三大引文索引数据库SCI、SSCI、A&HCI以及两大化学信息事实型数据库Current Chemical Reactions和Index Chemicus是数字目录学进行数字科学评价的重要工具。ISI Web of Science是全球最大、覆盖学科最多的综合性学术信息资源,ISI Journal Citation Reports(期刊引证 分析 报告,简称JCR)是基于SCI、SSCI的期刊评价数据库。Essential Science Indicators(基本科学指标)是ISI独有的研究和统计数据,可用于评估研究绩效,掌握过去十年间 自然 科学和社会科学发展的趋势和动向。ISIHighlyCited.com介绍了20年来世界范围内的高引用的研究人员及他们的成就。2005年即将推出的Century of Science将回溯数据从现在的1945年回推到1900年,囊括了20世纪以来最有 影响 的科学研究[http://www.thomsonisi.com/demos/webofscience]。此外,我国利用引文分析进行科学评价也取得一系列成果:如 中国 科学院文献情报中心的《中国科学引文索引》(CSCD)和《中国科学计量指标:论文与引文统计》,中国科技信息研究所的《中国科技论文与引文数据库》(CSTPC),南京大学中国社会科学评价研究中心的《中国人文社会科学引文数据库》(CSSCD)等。
2.2 数字资源控制论
如果说,文献目录学是通过书目控制解决文献信息的大量增长与揭示报道文献信息的矛盾,那么,数字目录学是针对网络环境下数字资源无限增长,对数字资源进行控制的。主要有以下方面:
一是数字资源的长久保存与记录问题。在网络环境下,大量动态的数字资源逐渐成为社会知识的主要形式,如何将流动的数字知识信息作为人类的知识库和文化库实现有效的控制,成为数字目录学的重要任务。由于大量的网络信息处于不断更新和流动中,信息资源的网上地址也可能不断变化,如不及时捕获,可能大量有价值的资源会消失在网络中,严重影响人类的社会记忆。那么,哪些数字资源应当长久保存,哪些流动数据必须实时记录,为此应当研究数字资源控制的范畴与标准。
二是解决数字资源鉴定问题。档案界为保证电子文件原始性,从电子文件生成时开始控制,在此基础上建立了真实性的认定方法和手续;同时,建立电子文件的收集和积累制度,将电子文件中心嵌入电子政务系统,实现文档一体化管理,保证电子文件的完整性。从数字目录学的角度,如何确定数字资源的真实性和完整性,除了电子文件之外,其他各种资源也有同样的问题。例如,网上广告信息的真实性问题,网络文学作品的 法律 认可问题,都需要解决。由于网上信息的大量链接,信息在转载过程中的“原始文本”确定,文本加入部分的鉴别和文本作者的识别,各种数字资源在格式转换后的纠错等等,都需要制定各类型数字资源的鉴定策略和鉴定方法。
三是解决网络环境下的数字污染问题。解决数字污染问题,是一个系统工程,包括从技术角度进行网络信息过滤;从法律角度惩治信息犯罪;从伦理角度防止信息污染;从管理的角度进行网络信息检查。还包括从数字目录学角度对网络信息进行提炼,如同传统目录学的“校雠”功能,对网络信息错误进行校正,对网络冗余信息发挥批评监督作用。
四是流媒体和视音频资源的控制。据Internet Movie Database的统计,全球生产影片1991年只有5972部,2001年达到10342部;全球生产CD唱片1998年9万张,1999年存储量58TB;全球生产DVD视盘1999年5000种,存储量22TB,2002年增至43.8TB[4]。通过元数据对大量的流媒体和视音频资源进行控制,包括图像、音频、视频、视音频、多媒体等元数据,在数字资源收集、保存、标引、资产管理等方面发挥作用。
五是数字资源质量评价。 目前 国内外关于网络信息资源的评价[5],主要是网页评价和网站评价,以及数据库评价、课件评价、电子图书评价、电子期刊评价、电子图书馆评价等等。从整体上对网络信息资源进行评价,有定性和定量评价,主要标准有:内容评价(真实性、权威性、准确性、新颖性、时效性、稳定性、连续性、独特性、实用性、系统性等);设计评价(整体构思、版面编排、合理性、用户界面友好性、交互性、导航设计、开放性、兼容性);检索评价(可检索性、检索功能、检索效果、检索速度、易用性);可获得性评价(主页可操作性、链接的有效性、链接响应速度、传输速度);安全性评价;成本效益评价(技术支持、链接成本、价格、利用率、访问量、下载量、引用次数、社会影响等)。
2.3 知识加工论
数字时代的目录学家应当成为“知识工程师”,从事知识的加工与服务。知识加工主要有三个方面,第一个方面是将网络信息转化为知识,包括从显性知识到显性知识,从隐性知识到显性知识等知识的相互转化,是创新型的知识加工。第二个方面是对网络知识进行系统化的组织,如知识分类、知识的表示。已有的各种针对网络资源的分类表、叙语表是知识系统的组织工具,新的组织方法有本体论(ontology)、语义网(semantic Web)和主题地图(topic maps)等。第三个方面是知识揭示,数字目录学必须继承目录学的学术传统,深入到知识层面,将提要、类序、综述、述评等方法与网络和数字技术、智能技术结合起来,发展元知识系统。
2.4 “e-reading”
数字目录学与文献目录学一样,具有指导读书治学的功能。具体表现为,指导“e-reading”(电子阅读)。“e-reading”主要表现为网上阅读。网上阅读主要有网页浏览和网上文献阅读,网上电子期刊阅读已成为科研人员的主要阅读方式,而网上的电子书阅读需求逐渐增长。“e-reading”还包括多媒体阅读。北京大学副校长吴志攀教授在《大学图书馆学报》2004年第1期发表的《移动阅读与图书馆的未来——“移动读者的图书馆”》一文中,预测手机阅读时代的到来,阅读习惯会从“阅读”变为“倾听”。
数字目录学要研究 学习 环境的变化,研究人们读书治学的新的特征,研究信息素养与读书治学的关系,研究电子阅读习惯、阅读行为和阅读心 理学 。数字目录学通过调查用户需求和电子信息服务的使用情况,为数字化学习提供依据。数字目录学还要建立各种学习资源库和学习平台,并进行用户学习培训,提供电子阅读方法的指导。
2.5 网络需求论
数字时代网络需求成为知识社会的重要特征。一方面,信息需求在人们的整体需求中占有越来越大的比重,而网络的需求量又占有突出的地位。另一方面,在网络环境下,知识生产者与知识利用者、书目情报工作者与书目情报需求者、图书馆员与用户之间的界限越来越模糊,因此,所有人都需要网上的信息与知识。
网络需求从微观来说是检索需求。满足这种需求的网络检索技术可分为数据检索、全文检索和知识检索。
从中观来说,网络需求表现为知识需求。网上大量的知识导航系统、丰富的教学网和教学资源上网,以及远程 教育 的发展,为人们的知识学习开辟了更多的渠道和机会。特别重要的是,公共知识的需求将主要通过网络来实现,要加强公共知识管理,发展信息公开、知识自由和公共知识资源的获取。从宏观来说,网络需求的实质是文化需求。网上的文化平等与文化对抗、传统文化与现代文化、单一文化与多元文化同时存在,各种文化努力占领网上阵地,现实文化寻求与网络文化融合。因此,网络的自由交互和个性发展的特征以及文化向知识的渗透,为数字目录学文化提供了依据。




