<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
python實現簡單的情感分析
# 資料匯入 import pandas as pd data = pd.read_csv('../data/京東評論資料.csv') data.head()
# 資料描述 data.describe()
# 資料預處理 # 取出sku_Id,content欄位 data1 = data[['sku_id', 'content']] data1.head(10)
# 情感分析 from snownlp import SnowNLP data1['emotion'] = data1['content'].apply(lambda x: SnowNLP(x).sentiments) data1.head()
# 情感資料描述 data1.describe()
emotion平均值為0.74,中位數為0.96,25%分位數為0.56,可見不到25%的資料造成了整體均值的較大下移。
# 繪製情感分直方圖 import matplotlib.pyplot as plt import numpy as np plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False bins = np.arange(0, 1.1, 0.1) plt.hist(data1['emotion'], bins, color = '#4F94CD', alpha=0.9) plt.xlim(0, 1) plt.xlabel('情感分') plt.ylabel('數量') plt.title('情感分直方圖') plt.show()
由直方圖可見,評論內容兩級分化較為嚴重;
3637條評論中有約2200條評論情感分在[0.9,1]區間內;同時,有約500條評論情感分在[0,0.1]區間內。
# 繪製詞雲圖(這兒沒有做停用詞處理) from wordcloud import WordCloud import jieba myfont = myfont = r'C:WindowsFontssimhei.ttf' w = WordCloud(font_path=myfont) text = '' for i in data['content']: text += i data_cut = ' '.join(jieba.lcut(text)) w.generate(data_cut) image = w.to_file('詞雲圖.png') image
# 關鍵詞提取top10 # 這兒直接寫import jieba執行會顯示沒有analyse屬性 from jieba import analyse key_words = jieba.analyse.extract_tags(sentence=text, topK=10, withWeight=True, allowPOS=()) key_words
以上關鍵詞顯示,消費者比較在意手機的“螢幕”“拍照”“手感”等特性,“華為”“小米”是出現頻次最高的兩個手機品牌。
引數說明 :
# 計算積極評論與消極評論各自的數目 pos, neg = 0, 0 for i in data1['emotion']: if i >= 0.5: pos += 1 else: neg += 1 print('積極評論數目為:', pos, 'n消極評論數目為:', neg)
# 積極消極評論佔比 import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus'] = False pie_labels = 'positive', 'negative' plt.pie([pos, neg], labels=pie_labels, autopct='%1.2f%%', shadow=True) plt.show()
# 獲取消極評論的資料 data2 = data1[data1['emotion'] < 0.5] data2.head()
#消極評論詞雲圖(這兒沒有做停用詞處理) text2 = '' for s in data2['content']: text2 += s data_cut2 = ' '.join(jieba.lcut(text2)) w.generate(data_cut2) image = w.to_file('消極評論詞雲.png') image
#消極評論關鍵詞top10 key_words = jieba.analyse.extract_tags(sentence=text2, topK=10, withWeight=True, allowPOS=()) key_words
消極評論關鍵詞顯示,“螢幕”“快遞”“充電”是造成使用者體驗不佳的幾個重要因素;螢幕和充電問題有可能是手機不良品率過高或快遞壓迫;
因此平臺應注重提高手機品控,降低不良品率;另外應設法提升發貨,配送,派件的效率和質量。
到此這篇關於利用python實現簡單的情感分析的文章就介紹到這了,更多相關python情感分析內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45