Skip to content

数据挖掘:电子商务评论情感分析

Notifications You must be signed in to change notification settings

TonyJava/datamining2

 
 

Repository files navigation

商品评论情感分析

  1. JAVA代码在source中,是MAVEN工程,请以MAVEN方式导入
  2. 数据sql在sql文件中
  3. 达到的效果图如result文件夹所示。

桑槿 青木商业智能部 2016/2/25

课题介绍

一、前言

公司作为电子商务运营商,每天管理数以千计的商品。如何提供更好的服务,如何了解客户的需求,如何改善自身运营,是个很重要的问题。因此,商品评论情感分析课题被提出,且十分重要。 淘宝买家购买商品之前会先通过浏览评论,再判断商品是否值得购买。所以,通过对评论进行分析,我们可以得出一定的反馈,从而自我改善和进步。通过淘宝自身的评论标签还有业务人员自身的判断,效果差钱人意。当评论数达到一定量时,简直应接不暇。 故必须使用高级手段进行评论数据挖掘。

二、成果

要达到的成果如下:

1、数据的获取和存储

使用自制的爬虫程序或者第三方爬虫软件,进行淘宝商品评论抓取,存储在数据库中。针对评论中的无效和冗余评论,进行清洗处理,以历史数据的形式抽取出来建造数据仓库。 维护好数据仓库是重中之重,此数据仓库的数据可以长期反馈商品状态变化。(何为数据库和数据仓库,请看《商业智能剖析》PPT) 规模化负责人员:技术部门

2、评论情感字典的构造

针对商品的特征,业务人员进行维度划分,如价格、服务、物流、质量。每一维度再构建相应的字典,如价格维度字典可以包括“价格很好”,“价格略贵”,“太贵了”等,再对此些字典进行情感打分,分数段为1-5分,情感由负到正,如“价格很好”打4分,“太贵了”打1分。情感字典同样存入数据仓库中,且可动态添加,补充字典库。 商品维度划分负责人员:推广人员、项目人员、商品管理人员。商品打分人员:推广人员等。 补充:字典构造需要技术部门开发一个批量添加字典系统,方便存入数据库。

3、智能展示结果

通过算法运算,将原始评论进行分词,字典匹配,分数处理,得到商品各维度的平均情感分。在智能系统平台,只需选择商品,商品即可以雷达图的形式显示出各维度的分数。可以进行两件商品的比较,或者一件商品不同时期的比较。

About

数据挖掘:电子商务评论情感分析

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Java 92.5%
  • HTML 7.5%