<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
假設通過爬蟲獲得了一個自媒體.txt
想要從這些關鍵詞中提取流量最大的關鍵詞
可以通過如下演演算法實現:
from smoothnlp.algorithm.phrase import extract_phrase import re class_name = '自媒體' class_name_low = class_name.lower() top_k = 100 with open('%s.txt' % class_name,'r',encoding='utf-8') as file: data_str = file.read() keyword_list = data_str.split('n') with open('dont.txt','r',encoding='utf-8') as file: dont_set = set(file.read().split('n')) word_count_dict = dict() new_word_list = extract_phrase(keyword_list,top_k=top_k) for new_word in new_word_list: if new_word in dont_set: continue new_word_low = new_word.lower() if class_name_low in new_word_low or class_name_low == new_word_low: word_count_dict[new_word] = len(re.findall(new_word_low,data_str)) continue add_l = re.findall('%s%s' % (class_name_low,new_word_low),data_str) add_r = re.findall('%s%s' % (new_word_low,class_name_low),data_str) if len(add_l) >= len(add_r): word_count_dict['%s%s' % (class_name,new_word)] = len(add_l) else: word_count_dict['%s%s' % (new_word,class_name)] = len(add_r) for word,count in word_count_dict.items(): print('%st%s' % (word,count))
其中:
自媒體.txt
就是需要的關鍵詞庫
dont.txt
就是過濾掉一些沒有用的詞彙
獲得的結果如下,下面的這些詞就是流量很大的詞彙 可以用於註冊賬號去獲取流量
自媒體領域 702
自媒體軟體 502
自媒體身份證 68
自媒體推薦 450
自媒體研究 199
自媒體素材 378
自媒體原創 1147
自媒體稽核 417
瀏覽器自媒體 110
自媒體閱讀量 378
自媒體app 346
自媒體工具 222
自媒體圖片 416
自媒體電腦 112
自媒體管理 824
自媒體內容 1083
自媒體電視劇 48
自媒體申請 742
自媒體註冊 1597
百度自媒體 545
自媒體同步 89
自媒體電影片段 14
自媒體檢測 36
自媒體抄襲 130
自媒體選擇 215
自媒體產品 105
自媒體資訊 355
自媒體粉絲 474
自媒體下載 173
企業自媒體 789
自媒體收益 1296
自媒體資料 317
淘寶自媒體 263
自媒體手機 568
自媒體剪輯 367
自媒體電影 380
自媒體服務 167
自媒體採集 234
自媒體變現 246
自媒體修改 65
自媒體風險 43
中國自媒體 533
自媒體兼職 182
自媒體定位 143
自媒體英語 53
自媒體傳播 776
抖音自媒體 686
自媒體渠道 212
自媒體影響力 130
0萬粉絲自媒體 18
自媒體系結 47
自媒體免費 205
自媒體認證 1662
自媒體流量 595
自媒體播放量 164
萬粉絲自媒體 42
自媒體評論 116
自媒體邀請碼 137
健康自媒體 96
自媒體問題 35
自媒體收入 826
自媒體垂直 129
自媒體招聘 665
自媒體獎勵 26
自媒體教學 312
自媒體盈利模式 140
自媒體熱點 104
自媒體標題 561
自媒體經營範圍 20
自媒體意識形態 13
自媒體ppt 70
自媒體品牌 219
自媒體競爭 45
自媒體社會 235
自媒體現狀 123
開通自媒體 219
2018自媒體 443
國外自媒體 350
自媒體公司 2862
自媒體介紹 311
自媒體生活 180
自媒體模式 56
自媒體故事 55
自媒體分析 168
自媒體策劃 244
自媒體版權 123
自媒體推廣 1893
自媒體考核 38
自媒體情況 32
自媒體搬運 958
音樂自媒體 337
最後的所有專案程式碼如下:
到此這篇關於基於Python實現搶注大詞的提詞工具的文章就介紹到這了,更多相關Python提詞工具內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45