通过建立 参考 本体以及进行信息整合,无序异构的 网络 信息数据通过语义概念及语义关系被组织到一起,形成一个有序的公共语义知识模型。但是对于具体网络用户的信息导航,并不直接在全部公共语义模型上进行,而是依据用户语义模型有针对性地进行。
3.2.1 用户语义模型
用户语义模型是反映用户观点的概念集合和概念关系。概念集合的确定可以由用户直接提交或者根据用户的注册信息(用户的兴趣、爱好和知识背景等)按照一定的规则 计算 选择。而构建用户语义模型的关键步骤在于建立用户概念集合与参考本体间的语义映射,寻找参考本体中与用户相匹配的概念和关系。
为了将参考本体映射到用户语义模型,需要预先对参考奉体和用户概念集合进行数据训练, 方法 是为每个本体概念和用户概念各标注一定的相关资源作为训练数据,然后利用向量空间模型为每个概念生成向量,并计算其标准权重。
建立语义映射的过程通过计算用户概念集合中的概念向量uc与参考奉体中的每个概念向量间的匹配度来完成。假设在n维向量空间中,用户概念向量uc中第i项的权重为的匹配度为[9]:
首先将计算结果中匹配度高于阀值的若干概念向量与uc建立映射,形成从用户概念集合到参考本体的一对多的对应关系。如果参考本体的一些概念被重复映射,则需要选择其中匹配度最高的映射,以保证从参考本体到用户概念集合的一对一关系,即一个本体概念只能和一个用户概念相关,但一个用户概念可以和多个参考概念相关。在建立用户概念集合与参考奉体对应关系的同时,用户概念也继承了本体中的概念层次结构和其他语义关系,成为一个独立的语义模型。
原则上应该将参考本体中的所有概念都映射到用户语义模型中,但是由于用户语义模型是范围相对较小的概念集合,因此参考奉体中的概念实际上不可能被完全映射。为了保持映射的完整性,可以在用户语义模型中设立一个“其他”概念类,参考本体中的所有没有被映射的概念将成为它的子概念[9]。
举例来说,假设用户提供的信息表明其在 体育 领域感兴趣的概念为“足球”、“足球世界杯”、“足球亚洲杯”、“NBA”、“围棋”、“奥运会”,图2显示了这些用户相关概念经过映射后形成用户语义模型的过程。
用户概念集合中的每一个概念都在参考本体中找到了与之相对应的一个或多个概念,将这些概念从参考本体中提取出来,并根据其语义关系重新组合,就形成了用户语义模型的结构。例如:用户概念“NBA”的对应概念为“篮球”、“篮球赛事”和“美国篮球职业联赛(NBA)”,因此这三个概念都被包含在用户语义模型中,且它们之间的父子关系(即等级关系)保持不变。又如,虽然参考本体中的“其他赛事”概念和用户概念集合没有直接对应关系,但由于该概念和“足球赛事”与“篮球赛事”两个概念间有语义关系,且这两个概念均与用户相关,因此该概念也被包含在用户语义模型中。另外,“世界杯足球赛”概念实际上与“足球”和“足球世界杯”两个概念间都具有对应关系。但由于它与后者的匹配度比前者高,因此将它映射到后者。
3.2.2 个性化导航结构模型
导航结构模型显示了导航系统组织、关联和显示信息 内容 的方式。站点地图就是一种最简单直接的导航结构模型。个性化导航结构模型是基于用户语义模型创建的针对特定用户的导航结构,是个性化导航服务的实现。
导航结构的设计需要考虑三个基本要素:卡片、页面和链接。一张卡片只包含一种类型的信息内容,是导航结构模型中的最小组成单元。页面与物理的web页面相对应,一个页面上可以包含若干个卡片。链接则用于连接各个页面中的卡片以形成整体结构[8]。通常,导航结构模型总是从一个缺省的根页面开始,每一级页面都包含了到下一级页面的链接,信息内容通过卡片和页面进行分类和聚合,导航通过链接来进行。在个性化的导航结构建模中,导航结构是根据用户语义模型来确定内容和链接关系的。图3显示了一个导航结构的部分示例,它是在图2中的用户语义模型的基础上建立的。
导航结构的建模过程就是对各级贞面中的卡片的内容、类型和表示样式的确定过程。卡片的内容根据触发点和用户语义模型来选择,不同的用户将获得不同的信息内容。
导航结构中的卡片被分为两种类型:静态卡片和动态卡片。静态卡片的内容独立于数据源,主要包含静态文本、图片等。导航结构中的根页面通常都包含静态卡片,具有预先定义的锚点,指向下一级的页面。动态卡片的内容视数据源而定,如果数据源改变,则卡片的内容必须重新计算生成。动态卡片还可以细分为四种类型,每一种都代表了对信息进行结构化的一种典型方法:
(1)列表型(List)卡片:显示实体的实例列表,每一条实例都可具有指向该实例具体内容的链接入口。列表中的实例可以按照某种属性排序或索引。图3中的页面P2、P3、P4、P5都包含了列表型卡片。
(2)事实型(Fact)卡片:详细地显示一个实例的具体内容,如图3中的页面P4包含的“新闻内容”卡片和页面P5包含的“赛事内容”卡片。
(3)幻灯片型(Slide)卡片:顺序显示一组实例的具体内容,每次一个实例,且具有浏览附近实例的超链接,待显示的实例可以按照某种属性排序或索引。图3中的页面P6包含该类型的卡片,其中每个足球俱乐部的相关信息将被依次显示。
(4)查询型(Query)卡片:要求用户先填写一组实体属性的值,然后查询符合该值的实例并显示,通常该类型的卡片用于导航系统中的信息检索,如图3中的页面P7包含的卡片[8]。
另外,不同的卡片具有不同的表示样式,表示样式描述各种表示元素的属性,例如字体、颜色、布局等。表示样式可以根据用户喜好确定。
个性化导航机制的导航方法采用用户语义模型的查找与语义链的触发相结合的方式。当导航结构中的一个链接被触发时,该链接将被赋予一个查询式Q(C,T,S),式中三个变量的含义分别代表卡片的内容、类型和表示样式,在用适当的值填充变量后,即可利用查询式计算生成链接末端的卡片。例如在图3中,当链接L1被触发后,L1的查询式为:Q(“体育”,List,Stylel),其计算结果为页面P2中的卡片。Q中的变量C的值为L1的触发端点的概念“体育”,Q在计算时将检索用户语义模型,获取此概念的相关概念或相关资源作为卡片的内容。Q中变量T的值为List,因此Q生成的卡片将具有列表型的信息结构。同时,由于Q中变量S的值为Stylel,因此Q还要读取样式表中名称为Stylel的表示样式,并据此决定卡片的外观。同理,链接L2的查询式为Q(“足球俱乐部”,Slide,Stylel),其结果是生成一个信息结构为幻灯片类型,表示样式为Stylel,内容与足球俱乐部相关的卡片”[11,12]。
导航机制采用Semantic Web技术,揭示和整合网络信息资源的深层语义知识模型,能有效解决无序、异构网络信息空间中的“迷航” 问题 。它利用映射方法建立用户语义模型,可以充分表达用户需求的语义知识,以提高个性化导航的效率。
4 结束语
网络信息的利用状况不容乐观,迫使人们努力探索更为先进更为成熟的导航 理论 、方法和技术。第二代web技术——Semantic Web在信息服务中的 应用 ,促进了网络导航新技术的 发展 。它作为导航系统的信息组织框架,能够使复杂的信息空间变得有序、清晰和直观,它采用机器可读的形式化的知识表示方式,有利于知识内容的自动获取。 目前 ,Semantic Web技术正获得越来越多的应用,相信经过不断地 研究 和优化,以Semantic Web为基础的高级网络信息服务将逐步成熟,智能、高效、个性化的导航系统将成为开发网络信息资源的主流工具。
【参考 文献 】
1 丛敬军,阎辉.数字图书馆的知识信息导航技术研究. 中国 图书馆学报,2003,29(145):51~53
2 马瑞民,衣治安.Web上超文本数据导航方法的研究.情报学报,2001,20(5):538~544
3 张晓林.Semantic Web与基于语义的网络信息检索.情报学报,2002,21(4):413~420
4 刘柏嵩.基于知识的语义网:概念、技术及挑战.中国图书馆学报,2003,29(144):18~21
5 Mike Uschold,Michael Gruninger.Ontologies:Principles, Methods and Applications.Knowledge Engineering Review,1996,11(2):93~155
6 Jeff Heflinetal.Requirements for a web ontology language. http://www.w3.org/TR/webont-req/
7 张平,郭金庚.语义网描述语言 分析 .电脑开发与应用,2003,16(4):31~33
8 OntoWebber Model-Driven Ontology-Based Web Site Management.http://www-db.stanford.edu/pub/gio/2001/ Ontowebber01.pdf
9 Ontology-Based Personalized Search and Browsing.http:// www.ittc.ku.edu/~sgauch/selectedpapera/WLAS2003.pdf
10 毕强,刘早学.QUIC——一个智能超文本导航系统.情报学报,2002,20(12):1277~1281
11 杨卫东,施伯乐.基于状态图的Web导航模型及其特征分析.计算机研究与发展,2002,39(8):992~997
12 钟元生.面向对象的Web导航模型设计.计算机应用,2002,22(12):50~52




