面对一个前所未有的开放的世界,越来越多的数据和信息可以从互联网上获得,对于单个数据来说或许没有实际的价值,但是对于大量数据的采集整理,分析和挖掘则可能产生巨大的商机。
杰诺在线科技可以针对企业的数据需要,为企业建立数据中心,并可以提供数据的二次分析、挖掘,帮助企业分析产品市场行情、舆论导向、价格趋势等等。
杰诺在线科技自身的数据中心也在同时为多家国内外厂商提供数据服务,客户也可以选择使用它来获取和分析数据。
数据挖掘技术的概念和实用价值
1.数据挖掘的概念
所谓数据挖掘,是从海量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。也就是根据预定义的商业目标,对大量的企业数据进行探索和分析,揭示其中隐含的商业规律,并进一步将其模型化的先进有效技术过程。数据挖掘是一门交叉学科,它集成了许多学科中成熟的工具和技术,包括数据库技术、统计学、机器学习、模型识别、人工智能、神经网络等等。
数据挖掘能做以下六种不同事情:分类 (Classification) 、估值(Estimation)、 预测(Prediction) 、相关性分组或关联规则(Affinity grouping or association rules) 、聚类(Clustering)、描述和可视化(Description and Visualization)
(1)分类
分类即区分数据类别。首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。
(2)估值
估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出,同时分类的类别是确定数目的,估值的量是不确定的。
(3)预测
通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。预测其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
(4)相关性分组或关联规则
通过分析数据或记录间的关系,决定哪些事情将一起发生。
(5)聚类
聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚类不依赖于预先定义好的类,不需要训练集。
(6)描述和可视化
即对数据进行归约、概化或图形描述等。
2.数据挖掘的使用价值
数据挖掘技术源于商业的直接需求,因此它在各种商业领域都存在广泛的使用价值。
★客户分析
随着“以客户为中心”的经营理念的不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对积累的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献、交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。
★运筹和企业资源的优化
节约成本是企业盈利的关键。通过分析历史的财务数据、库存数据和交易数据,可以发现企业资源消耗的关键点和主要活动的投入产出比例,从而为企业资源优化配置提供决策依据,例如降低库存、提高库存周转率、提高资金使用率等。
★异常事件的确定
在许多商业领域中,异常事件具有显著的商业价值,如客户流失、银行的信用卡欺诈、电信中移动话费拖欠以及医学中特殊病情的征兆等。通过数据挖掘中的奇异点分析可以迅速准确地甄别这些异常事件。
★企业分析模型的管理
企业成员在使用数据挖掘系统时,会对模型进行调优和定制。这将会逐步积累符合企业自身需要的模型库,成为企业知识库的重要组成部分。
目前,数据挖掘技术在商业上实际应用十分丰富,业务应用中常见的具体例子有:客户细分、客户保留、目标营销、客户拓展、欺诈检测、购物篮分析、信用打分、信用风险评估、投资组合管理、行情分析、安全管理、客户盈利能力分析、资源管理、利润分析、交叉销售、增量销售、客户服务自动化、活动分析、销售预测、收入预测、需求预测、理赔分析、业绩分析、商店选址、库存控制、流程质量控制、故障分析、处方分析等等。