WEB数据挖掘建立在对大量的网络数据进行分析的基础上,采用相应的数据挖掘算法,在具体的应用模型上进行数据的提取、数据筛选、数据转换、数据挖掘和模式分析,最后做出归纳性的推理、预测客户的个性化行为以及用户习惯,从而帮助进行决策和管理,减少决策的风险。
WEB数据挖掘涉及多个领域,除数据挖掘外,还涉及计算机网络、数据库与数据仓储、人工智能、信息检索、可视化、自然语言理解等技术。
1) WEB数据挖掘分类
Web数据挖掘可分为四类:Web内容挖掘、Web结构挖掘、Web使用记录挖掘和Web用户性质挖掘。其中,Web内容挖掘、Web结构挖掘和Web使用记录挖掘是Web1.0时代就已经有了的,而Web用户性质挖掘则是伴随着Web2.0的出现而出现的。
Web使用记录数据除了服务器的日志记录外,还包括代理服务器日志、浏览器端日志、注册信息、用户会话信息、交易信息、Cookie中的信息、用户查询、等一切用户与站点之间可能的交互记录。 Web使用记录挖掘方法主要有以下两种:
WEB用户性质挖掘
如果说Web使用记录挖掘是挖掘网站访问者在各大网站上留下的痕迹,那么Web用户性质挖掘则是要去Web用户的老巢探寻究竟。在Web2.0时 代,网络彻底个人化了,它完全允许客户用自己的方式、喜好和个性化的定制服务创造自己的互联网,它一方面给予互联网用户最大的自由度,另一方面给予有心商 家有待发掘的高含金量信息数据。通过对Web用户自建的RSS、Blog等Web2.0功能模块下客户信息的统计分析,能够帮助运营商以较低成本获得准确 度较高的客户兴趣倾向、个性化需求以及新业务发展趋势等信息。有关Web2.0下的数据挖掘正在进一步的研究中。
2) WEB数据的特点
3) 典型的WEB挖掘的处理流程
4) 常用的WEB挖掘技术
5) WEB 日志挖掘在客户关系管理(CRM)中的应用
6) WEB日志挖掘在电子商务网站中的应用
作为电子商务网站的运营者不仅要掌握用户在网上关心哪些商品,更重要的是要掌握匿名用户怎么变成注册用户,转化率是多少,匿名用户是直接访问的还是 通过搜索引擎链接来的,购买行为如何,业绩是多少等。对于电子邮件市场推广,通过沉默用户分析其沉默时间,根据发出量、返回量、成交量来判断市场推广效 果。对于广告市场推广,通过曝光量、点击量、成交量来反映市场推广的效果。
7) WEB 商业智能 BI