<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
天氣真的很熱啊… 很想有一杯冰冰涼涼的奶茶來解渴~
但是現在奶茶店這麼多, 到底哪一家最好喝、價效比最高呢?
本文抓取了12個熱門城市的奶茶店名單,
城市包括:北京、上海、廣州、深圳、天津、西安、重慶、杭州、南京、武漢、成都和長沙。
共計68614家奶茶店,3萬多個奶茶品牌。
在構建抓取URL時,
需要注意將城市的維度具體到城市商圈,
因為每個URL最多隻顯示32頁內容,
保證抓取每個城市時的資料量是準確的。
# 構建抓取URL def get_url_1(): for city,city_code in city_dict.items(): for block_dict in area_dict[city]: for children in block_dict['children']: for page in range(1,33): block_code = children['id'] offset = 32 * (page-1) # print(city, area, block, block_code) url = 'https://apimobile.meituan.com/group/v4/poi/pcsearch/{}?uuid=6ddabcb37fdd4a8e9cdf.1599125825.1.0.0&userid=280531290&limit=32&offset={}&cateId=-1&q=奶茶果汁&areaId={}&sort=solds'.format(city_code,offset,block_code) redis_db.sadd('meituan_milk', url)
資料淨化部分,主要清洗了奶茶店鋪名稱,
但是同一個奶茶品牌會有多種格式,如1點點和1點點,
大卡司和大卡司DAKASI。
由於奶茶品牌數量眾多,
並且真假難辨,所以只能進行鍼對性清洗,
對部分名氣高的奶茶品牌名稱要保證其統一。
# 清洗欄位 def clean(x): title = re.sub(u"(.*?)", "", x['title']) title = title.replace('點點','點點').replace('(','').replace(')','') title = title.replace('一點點','1點點') if '一杯會說話的茶' in title: title = '1314一杯會說話的茶' elif '大卡司' in title: title = '大卡司DAKASI' elif '1點點' in title: title = '1點點' elif '都可' in title: title = 'CoCo都可' elif '書亦燒仙草' in title: title = '書亦燒仙草' elif '蜜雪冰城' in title: title = '蜜雪冰城' elif 'royal' in title or 'Royal' in title or 'ROYAL' in title: title = 'Royaltea皇茶' elif 'ALS' in title: title = 'ALS GONG CHA貢茶' elif 'GONG' in title: title = '貢茶' elif '茶百道' in title: title = '茶百道' elif '吾飲良品' in title: title = '吾飲良品' elif '悸動燒仙草' in title: title = '悸動燒仙草' elif '滬上阿姨' in title: title = '滬上阿姨' elif '7分甜' in title: title = '7分甜' elif '古茗' in title: title = '古茗' elif '奈雪' in title: title = '奈雪の茶' elif '悅色' in title: title = '茶顏悅色' else: pass return title df['title'] = df.apply(clean, axis=1)
當小編在製作視覺化圖表的時候,
會發現有些奶茶品牌的名稱極為相似,
讓人有一種傻傻分不清楚的感覺。
從全國12個熱門城市來看奶茶店鋪數量分佈情況,
廣州的店鋪數量是最多的,擁有11419家,
之後是深圳(9367家)、上海(7940家)、成都(7361家)。
有些奶茶店很有自己的地域特色,
如果你想品嚐它們的原版奶茶,
就可能需要跑到別的城市才能喝到,
因為它們大部分分店都只開在本土城市。
接下來介紹一下大眾奶茶中的1點點,CoCo,書亦燒仙草和益禾堂的熱門城市分佈情況,
1點點和CoCo在上海的分店數量都是最多的,而書亦燒仙草在成都和長沙比較普遍,益禾堂則是在廣州和深圳。
這4家奶茶品牌在廣州分店數量均有上百家,也難怪走到哪都能看到這幾家奶茶店。
此次小編只分析了12個熱門城市的奶茶門店資料,
如果將範圍擴充套件到全國進行分析,
或許能得到更多有意思的結果。
到此這篇關於Python爬取奶茶店資料分析哪家最好喝以及價效比的文章就介紹到這了,更多相關Python爬取奶茶店內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45