Opinion Mining
21 May 2017最近要实现用户评论总结的功能,也可以说是观点提取, 效果类似于点评的”大家认为”。
花了两周调研、一周编码。
Steps:
-
抓取评论, 划分为训练集、测试集。
-
使用训练集训练word2vec模型,保存词向量。
-
针对测试集提取候选标签,并向量化。候选标签的构造依赖于StanfordCoreNlp的词性依赖功能,候选标签由三元组<主题词,ADVs,修饰词>构成。
-
针对候选标签向量进行聚类。
-
选出每个类簇中距离中心点最近的标签作为summary。
Code:
https://github.com/Flowerowl/opinion_mining
References:
-
Mining Opinion Features in Customer Reviews - Minqing Hu and Bing Liu
-
What Drives Consumer Choices? Mining Aspects and Opinions on Large Scale Review Data using Distributed Representation of Words
-
Building a Sentiment Summarizer for Local Service Reviews
-
Sentiment Analysis and Opinion Mining - Bing Liu
-
用户评论中的标签抽取以及排序 - 李丕绩