数据挖掘应用于电子商务中存在的问题

来源:网络发布时间:2010-01-05

  网络的发展带动了电子商务市场的繁荣,大量的商品、信息在现有的网络平台上得以交易,大大简化了传统的交易方式,节约了时间,提高了效率,但电子市场繁荣背后隐藏的问题,也成为人们关注的焦点,突出表现在海量信息的有效利用上,如何更加有效的管理利用潜在信息,使他们的最大效用得以发挥,成为人们现在研究的重点,数据挖掘技术的产生,在一定程度上解决了这个问题,但它也存在着问题,需要不断改善。

  数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。或者说是从数据库中发现有用的知识(KDD),并进行数据分析、数据融合(Data Fusion)以及决策支持的过程。数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。

  数据挖掘技术在电子商务的应用

  1找到潜在客户

  在对Web的客户访问信息的挖掘中,利用分类技术可以在Internet上找到未来的潜在客户。使用者可以先对已经存在的访问者根据其行为进行分类,并依此分析老客户的一些公共属性,决定他们分类的关键属性及相互间关系。对于一个新的访问者,通过在Web上的分类发现,识别出这个客户与已经分类的老客户的一些公共的描述,从而对这个新客户进行正确的分类。然后从它的分类判断这个新客户是有利可图的客户群还是无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待。客户的类型确定后,可以对客户动态地展示Web页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。若为潜在客户,就可以向这个客户展示一些特殊的、个性化的页面内容。

  2实现客户驻留

  在电子商务中,传统客户与销售商之间的空间距离已经不存在,在Internet上,每一个销售商对于客户来说都是一样的,那么使客户在自己的销售站点上驻留更长的时间,对销售商来说则是一个挑战。为了使客户在自己的网站上驻留更长的时间,就应该全面掌握客户的浏览行为,知道客户的兴趣及需求所在,并根据需求动态地向客户做页面推荐,调整Web页面,提供特有的一些商品信息和广告,以使客户满意,从而延长客户在自己的网站上的驻留的时间。

  3改进站点的设计

  数据挖掘技术可提高站点的效率, Web设计者不再完全依靠专家的定性指导来设计网站,而是根据访问者的信息特征来修改和设计网站结构和外观。站点上页面内容的安排和连接就如超级市场中物品的货架摆布一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售。网站尽可能做到让客户轻易地访问到想访问的页面,给客户留下好的印象,增加下次访问的机率。

  4进行市场预测

  通过Web数据挖掘,企业可以分析顾客的将来行为,容易评测市场投资回报率,得到可靠的市场反馈信息。不仅大大降低公司的运营成本,而且便于经营决策的制定。

  数据挖掘在应用中面临的问题

  1数据挖掘分析变量的选择

  数据挖掘的基本问题就在于数据的数量和维数,数据结构显的非常复杂,数据分析变量即是在数据挖掘中技术应用中产生的,选择合适的分析变量,将提高数据挖掘的效率,特别适用于电子商务中大量商品以及用户信息的处理。

  针对这一问题,我们完全可以用分类的方法,分析出不同信息的属性以及出现频率进而抽象出变量,运用到所选模型中,进行分析。

  2数据抽取的方法的选择

  数据抽取的目的是对数据进行浓缩,给出它的紧凑描述,如求和值、平均值、方差值、等统计值、或者用直方图、饼状图等图形方式表示,更主要的是他从数据泛化的角度来讨论数据总结。数据泛化是一种把最原始、最基本的信息数据从低层次抽象到高层次上的过程。可采用多维数据分析方法和面向属性的归纳方法。

  在电子商务活动中,采用维数据分析方法进行数据抽取,他针对的是电子商务活动中的客户数据仓库。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大,可把汇集操作结果预先计算并存储起来,以便用于决策支持系统使用

  3数据趋势的预测

  数据是海量的,那么数据中就会隐含一定的变化趋势,在电子商务中对数据趋势的预测尤为重要,特别是对客户信息以及商品信息合理的预测,有利于企业有效的决策,获得更多地利润。但如何对这一趋势做出合理的预测,现在还没有统一标准可寻,而且在进行数据挖掘过程中大量数据形成文本后格式的非标准化,也给数据的有效挖掘带来了困难。

  针对这一问题的产生,我们在电子商务中可以应用聚类分析的方法,把具有相似浏览模式的用户集中起来,对其进行详细的分析,从而提供更适合、更令用户满意的服务。聚类分析方法的优势在于便于用户在查看日志时对商品及客户信息有全面及清晰的掌控,便于开发和执行未来的市场战略,包括自动给一个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一个特殊的站点等,这无论对客户和销售商来说都是有意义。

  4数据模型的可靠性

  数据模型包括概念数据模型、逻辑数据模型、物理模型。数据挖掘的模型目前也有多种,包括采集模型、处理模型及其他模型,但无论哪种模型都不是很成熟存在缺陷,对数据模型不同采用不同的方式应用。可能产生不同的结果,甚至差异很大,因此这就涉及到数据可靠性的问题。数据的可靠性对于电子商务来说尤为重要作用。

  针对这一问题,我们要保障数据在挖掘过程中的可靠性,保证它的准确性与实时性,进而使其在最后的结果中的准确度达到最高,同时在应用模型过程中要尽量全面的分析问题,避免片面,而且分析结果要由多人进行评价,从而最大限度的保证数据的可靠性。

  5数据挖掘涉及到数据的私有性和安全性

  大量的数据存在着私有性与安全性的问题,特别是电子商务中的各种信息,这就给数据挖掘造成了一定的阻碍,如何解决这一问题成为了技术在应用中的关键。

  为此相关人员在进行数据挖掘过程中一定要遵守职业道德,保障信息的机密性。

  6数据挖掘结果的不确定性

  数据挖掘结果具有不确定性的特征,因为挖掘的目的不同所以最后挖掘的结果自然也会千差万别,以因此这就需要我们与所要挖掘的目的相结合,做出合理判断,得出企业所需要的信息,便于企业的决策选择。进而达到提高企业经济效益,获得更多利润的目的。

  数据挖掘可以发现一些潜在的用户,对于电子商务来说是一个不可或缺的技术支持,数据挖掘的成功要求使用者对期望解决问题的领域有深刻的了解,数据挖掘技术在一定程度上解决了电子商务信息不能有效利用的问题,但它在运用过程中出现的问题也亟待人们去解决。相信数据挖掘技术的改进将推进电子商务的深入发展。