摘要:
针对饮食、娱乐、购物、景观、交通和住宿6个旅游主题, 基于机器学习方法, 开展游客微博主题情感分析方法比较研究。以人工标注的53140条赴日游客微博为数据基础, 应用两种机器学习模型开展建模实验, 并分析不同特征对建模效果的影响。实验结果显示, 两种模型的建模效果良好, 适用于游客微博主题情感分析, 其中最大熵模型效果略优于支持向量机。研究还表明, 在词特征的基础上引入表情符号和主题词进行特征扩展, 可以提高模型的建模效果。
中图分类号:
刘思叶, 田原, 冯雨宁, 庄育龙. 游客微博主题情感分析方法比较研究[J]. 北京大学学报自然科学版, 2018, 54(4): 687-692.
LIU Siye, TIAN Yuan, FENG Yuning, ZHUANG Yulong. Comparison of Tourist Thematic Sentiment Analysis Methods Based on Weibo Data[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(4): 687-692.