背景:#EDF0F5 #FAFBE6 #FFF2E2 #FDE6E0 #F3FFE1 #DAFAF3 #EAEAEF 默认  
阅读内容

基于粗糙集的关联规则挖掘在餐饮信息化中的应用(1)

[日期:2008-09-12] 来源:  作者: [字体: ]
 摘  要  关联规则挖掘是数据挖掘中的一个重要问题,在最近几年被广泛研究。本文将粗糙集理论及方法引入顾客消费水平评价中,通过属性约简降低属性纬数,然后基于粗糙集理论进行关联规则挖掘,得出了一些有益的结论,为拓展粗糙集的应用领域做出了有益的探索。
    关键词  粗糙集;关联规则;餐饮信息化;区分矩阵;属性约简
 
1  引言
    粗糙集理论(Rough Set)是由波兰数学家Z.Pawlak 在80年代初提出的一种处理模糊和不精确性问题的新型数学工具。利用粗糙集理论进行数据挖掘,重要的一点就是基于粗糙集理论的属性约简。通过约简操作降低属性的纬数,总结出适用于决策支持的知识规则,是粗糙集理论最重要的应用之一。
    关联规则挖掘是数据挖掘中的一个重要问题,随着全球范围内数据库中存储的数据量迅速增大,数据间的关联规则往往过于庞大而难以分析,如何有效的得到有意义的关联规则成为研究热点。本文以酒店行业为应用背景,将基于粗糙集理论的数据挖掘技术应用于餐饮部门顾客消费记录,通过属性约简方法,将餐饮信息数据库中杂乱、无序的原始数据,化简为对企业有用的信息,为企业的决策提供新的解决方法。
2  基本概念 2.1  粗糙集理论的基本概念
    粗糙集理论将分类与知识联系在一起,认为知识源于有认知能力的主体的分类能力,并用等价关系形式化表示分类。
    定义1 粗糙集理论中定义信息系统为一个如下四元组:S = (U,A,V,F),其中U = (x1,x2,…,xn) 是对象集,即论域;A 是属性集合,A = C∪D,且C∩D = Φ,其中C为条件属性,D为决策属性;V 为属性A的值域;F 是U ×A → V 的映射,它为U 中各对象的属性指定唯一值。S又被称为决策表。
    定义2   在信息系统S 中,对于一属性集I ∈A,可构造对应的二元等价关系。IND (I) { < x,y > ∈ U ×U | νa∈ I,有a(x) = a(y) },称IND (I) 为由I 构造的不可分辨关系。不可分辨关系实际上就是I上的等价关系。因此,针对属性集I上的不可分辨关系,U可划分为几个等价类,用U/IND(I)表示。
    定义3   约简定义为不含多余属性并保证分类正确的最小条件属性集。假设条件属性集C的简约是C的一个非空子集C’,C和C’必须满足以下两个性质:
    (1) ind(C,D) =ind(C′,D),不存在C″ C′有ind(C″,D) =ind(C′,D) 。
    (2) 一个决策表可能同时存在几个约简,C 的简约的集合记作Red(C) 。
这些约简的交集定义为决策表的核(Core),Core (C) =∩Red(C) 核中的属性是影响分类的重要属性。
    定义4   信息系统S中关于属性集C的区分矩阵M(C)=(mij)n×n定义为
 

 
    M(C)=(mij)n×n是代表了区分xi,xj的完整信息。
2.2  关联规则
    关联规则是在交易数据、关系数据或其他信息载体中查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构,通过分析数据或记录间的关系,决定哪些事情将一起发生。
    定义6   设I = {i1,i2,…,in} 是项的集合。包含K个项的项集称作K项集。设D是数据库记录的集合,其中每个事务T是项的集合,且T I。设X是一个项集,事务T包含X当且仅当X T。
    关联规则是形如 的蕴涵式,这里,且X∩Y=Φ。X称为规则的左部或规则的前提(简记LHS),Y称为规则的右部或结论(简记RHS)。
    度量规则的参数是支持度(Support)与置信度(Confidence)。支持度是指数据集中的实例同时包含条件属性与决策属性的共同概率,支持度揭示了规则的重要性。置信度表示实例在包含条件属性的前提下,也包含决策属性的条件概率,它揭示了规则的可信度。在粗糙集理论中支持度与置信度可以表示为:

    其中P(X)表示是指X在数据D中出现的概率,其余雷同。Support()指X、Y在D中同时出现的概率;Confidence()表示在X出现的前提下Y出现的条件概率。如果得到的规则同时满足支持度部小于支持度阈值和置信度不小于置信度阈值,则该规则有意义。
3  基于粗糙集的关联规则挖掘模型
    将基于粗糙集的关联规则挖掘的算法应用于酒店顾客消费数据库,整个挖掘过程分为三步:即数据预处理,属性约简,关联规则的挖掘,见图1。

    (1) 数据预处理:通过对餐饮部门的初始数据进行清洗,缺失值处理,转换及数据选择,获取初始信息表,且初始表转换为粗糙集形式,并明确条件属性集和决策属性;
    (2) 属性约简:对条件属性进行约简,删除多余属性,用分辨矩阵来完成约简和求核,在此基础上生成约简属性集,合并相同行,进行属性约简;
    (3) 关联规则挖掘:输入支持度阈值和置信度阈值,根据数据约简结果,利用粗糙集理论文[6]中的算法,进行关联规则的挖掘。
4  数据挖掘在餐饮信息化中的应用
    在全面信息化的21 世纪,我国酒店业面临加入WTO 带来的难得机遇与严峻挑战。酒店企业要在这一全新的竞争环境中生存与发展壮大,信息技术的作用举足轻重。而数据挖掘是企业信息化的灵魂所在,利用它能提升企业信息服务的层次,实现企业信息共享,进而为决策者提供依据。
4.1  典型应用
    酒店是一种提供特殊服务的企业,它出售的商品可以概括为“空间” 、“时间”和“服务”。其中,最重要的经营产品就是客房和餐饮,餐饮信息化是酒店信息化的重要组成部分。数据挖掘技术在餐饮部门中的典型应用包括交叉销售和个性化营销等。
    (1)交叉销售。利用数据挖掘技术从数据库所存储的客户信息,尤其是以前消费行为的信息中,寻找影响客户消费行为的关键因素,并建立预测模型对客户将来的消费行为进行预测分析,分析哪些客户最有可能对企业的产品感兴趣、会对哪些相关产品感兴趣、客户购买某些产品的可能性有多大等,以决定对哪些客户进行交叉销售,并向这些客户提供适合其需求的产品。
    数据挖掘中的关联分析经常被用来帮助企业发现一些隐含的、微妙的且极具商业价值的关系。这种挖掘过程一般分为两步:首先,发现所有的频繁项集,这些项集的频度要大于等于最小支持度,从而找出所有可能被一起购买的关联产品;其次,根据所获得的频繁项集产生相应的强关联规则,这些规则必须满足最小置信度阈值,从而找出一起购买可能性足够大的关联产品。
    (2)个性化的市场营销
近年来,餐饮营销成为现代餐饮管理的重中之重。餐饮营销就是以市场为起点,以顾客需求为焦点,寻求更多次地与客户达成交易。餐饮专职销售作为新的营销理念正在被一些大型酒店所青睐。所谓餐饮专职销售指餐饮专职销售人员对自己的餐饮产品有着深刻的了解,并且通过长期与客户打交道,拥有一批比较固定的客户群。数据挖掘可以把大量的用户分成不同的类,每一类里的用户具有相似的属性,不同类里的客户属性也不同。成功的市场营销必须依赖于对客户的了解,让每次的营销活动都具有针对性,进行个性化营销,这样可以降低营销成本,提高用户的效应率。
   
12下一页  GO
阅读:
录入:中国论文联盟

推荐 】 【 打印
相关新闻      
本文评论       全部评论
发表评论
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款


点评: 字数
姓名:
免费论文搜索


本周热门内容