<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
TransBigData是一個為交通時空巨量資料處理、分析和視覺化而開發的Python包。TransBigData為處理常見的交通時空巨量資料(如計程車GPS資料、共用單車資料和公交車GPS資料等)提供了快速而簡潔的方法。TransBigData為交通時空巨量資料分析的各個階段提供了多種處理方法,程式碼簡潔、高效、靈活、易用,可以用簡潔的程式碼實現複雜的資料任務。
目前,TransBigData主要提供以下方法:
TransBigData可以通過pip或者conda安裝,在命令提示字元中執行下面程式碼即可安裝:
pip install -U transbigdata
注意:這個庫安裝比較麻煩。
安裝完成後,在Python中執行如下程式碼即可匯入TransBigData包。
import transbigdata as tbd
TransBigData
與資料處理中常用的Pandas和GeoPandas包能夠無縫銜接。首先我們引入Pandas包並讀取出租車GPS資料:
import pandas as pd # 讀取資料 data = pd.read_csv('TaxiData-Sample.csv',header = None) data.columns = ['VehicleNum','time','lon','lat','OpenStatus','Speed'] data.head()
結果如圖2所示:
▲圖2 計程車GPS資料
然後,引入GeoPandas包,讀取研究範圍的區域資訊並展示:
import geopandas as gpd # 讀取研究範圍區域資訊 sz = gpd.read_file(r'sz/sz.shp') sz.plot()
結果如圖3所示:
▲圖3 研究範圍的區域資訊
TransBigData包整合了交通時空資料的一些常用預處理方法。其中,tbd.clean_outofshape方法輸入資料和研究範圍區域資訊,能夠剔除研究範圍外的資料。而tbd.clean_taxi_status方法則可以剔除計程車GPS資料中載客狀態瞬間變化的記錄。在使用預處理方法時需要傳入資料表中重要資訊列所對應的列名,程式碼如下:
# 資料預處理 #剔除研究範圍外的資料,計算原理是在方法中先柵格化後柵格匹配研究範圍後實現對應。因此這裡需要同時定義柵格大小,越小則精度越高 data = tbd.clean_outofshape(data, sz, col=['lon', 'lat'], accuracy=500) # 剔除計程車資料中載客狀態瞬間變化的資料 data = tbd.clean_taxi_status(data, col=['VehicleNum', 'time', 'OpenStatus'])
經過上面程式碼的處理,我們就已經將出租車GPS資料中研究範圍以外的資料和載客狀態瞬間變化的資料予以剔除。
柵格形式(地理空間上相同大小的網格)是表達資料分佈最基本的方法,GPS資料經過柵格化後,每個資料點都含有其所在的柵格資訊。採用柵格表達資料的分佈時,其表示的分佈情況與真實情況接近。
TransBigData工具為我們提供了一套完整、快速、便捷的柵格處理體系。用TransBigData進行柵格劃分時,首先需要確定柵格化的引數(可以理解為定義了一個柵格座標系),引數可以幫助我們快速進行柵格化:
# 定義研究範圍邊界 bounds = [113.75, 22.4,114.62, 22.86] # 通過邊界獲取柵格化引數 params = tbd.area_to_params(bounds,accuracy = 1000) params
輸出:
{'slon': 113.75,
'slat': 22.4,
'deltalon': 0.00974336289289822,
'deltalat': 0.008993210412845813,
'theta': 0,
'method': 'rect',
'gridsize': 1000}
此時輸出的柵格化引數params的內容儲存了柵格座標系的原點座標(slon、slat)、單個柵格的經緯度長寬 (deltalon、deltalat)、柵格的旋轉角度(theta)、柵格的形狀(method引數,其值可以是方形rect、三角形tri和六邊形hexa)以及柵格的大小(gridsize引數,單位為米)。
取得柵格化引數後,我們便可以用TransBigData中提供的方法對GPS資料進行柵格匹配、生成等操作。
完整的柵格處理方法體系如圖4所示:
▲圖4 TransBigData所提供的柵格處理體系
使用tbd.GPS_to_grid方法能夠為每一個計程車GPS點生成,該方法會生成編號列LONCOL與 LATCOL,由這兩列共同指定所在的柵格:
# 將GPS資料對應至柵格,將生成的柵格編號列賦值到資料表上作為新的兩列 data['LONCOL'],data['LATCOL']= tbd.GPS_to_grids(data['lon'],data['lat'],params)
下一步,聚合集計每一柵格內的資料量,併為柵格生成地理幾何圖形,構建GeoDataFrame:
# 聚合集計柵格內資料量 grid_agg=data.groupby(['LONCOL','LATCOL'])['VehicleNum'].count().reset_index() # 生成柵格的幾何圖形 grid_agg['geometry']=tbd.grid_to_polygon([grid_agg['LONCOL'],grid_agg['LATCOL']],params) # 轉換為GeoDataFrame grid_agg=gpd.GeoDataFrame(grid_agg) # 繪製柵格 grid_agg.plot(column = 'VehicleNum',cmap = 'autumn_r')
結果如圖5所示:
▲圖5 資料柵格化的結果
對於一個正式的資料視覺化圖來說,我們還需要新增底圖、色條、指北針和比例尺。TransBigData也提供了相應的功能,程式碼如下:
import matplotlib.pyplot as plt fig =plt.figure(1,(8,8),dpi=300) ax =plt.subplot(111) plt.sca(ax) # 新增行政區劃邊界作為底圖 sz.plot(ax=ax,edgecolor=(0,0,0,0),facecolor=(0,0,0,0.1),linewidths=0.5) # 定義色條位置 cax = plt.axes([0.04, 0.33, 0.02, 0.3]) plt.title('Data count') plt.sca(ax) # 繪製資料 grid_agg.plot(column = 'VehicleNum',cmap = 'autumn_r',ax = ax,cax = cax,legend = True) # 新增指北針和比例尺 tbd.plotscale(ax,bounds = bounds,textsize = 10,compasssize = 1,accuracy = 2000,rect = [0.06,0.03],zorder = 10) plt.axis('off') plt.xlim(bounds[0],bounds[2]) plt.ylim(bounds[1],bounds[3]) plt.show()
結果如圖6所示:
▲圖6 tbd包繪製的計程車GPS資料分佈
針對計程車GPS資料,TransBigData提供了直接從資料中提取出計程車訂單起訖點(OD)資訊的方法,程式碼如下:
# 從GPS資料提取OD oddat=tbd.taxigps_to_od(data,col=['VehicleNum','time','Lng','Lat','OpenStatus']) oddata
結果如圖7所示:
▲圖7 tbd包提取的計程車OD
TransBigData包提供的柵格化方法可以讓我們快速地進行柵格化定義,只需要修改accuracy引數,即可快速定義不同大小粒度的柵格。我們重新定義一個2km*2km的柵格座標系,將其引數傳入tbd.odagg_grid方法對OD進行柵格化聚合集計並生成GeoDataFrame:
# 重新定義柵格,獲取柵格化引數 params=tbd.area_to_params(bounds,accuracy = 2000) # 柵格化OD並集計 od_gdf=tbd.odagg_grid(oddata,params) od_gdf.plot(column = 'count')
結果如圖8所示:
▲圖8 tbd集計的柵格OD
新增地圖底圖,色條與比例尺指北針:
# 建立圖框 import matplotlib.pyplot as plt fig =plt.figure(1,(8,8),dpi=300) ax =plt.subplot(111) plt.sca(ax) # 新增行政區劃邊界作為底圖 sz.plot(ax=ax,edgecolor=(0,0,0,1),facecolor=(0,0,0,0),linewidths=0.5) # 繪製colorbar cax=plt.axes([0.05, 0.33, 0.02, 0.3]) plt.title('Data count') plt.sca(ax) # 繪製OD od_gdf.plot(ax = ax,column = 'count',cmap = 'Blues_r',linewidth = 0.5,vmax = 10,cax = cax,legend = True) # 新增比例尺和指北針 tbd.plotscale(ax,bounds=bounds,textsize=10,compasssize=1,accuracy=2000,rect = [0.06,0.03],zorder = 10) plt.axis('off') plt.xlim(bounds[0],bounds[2]) plt.ylim(bounds[1],bounds[3]) plt.show()
結果如圖9所示:
▲ 圖9 TransBigData繪製的柵格OD資料
同時,TransBigData包也提供了將OD直接聚合集計到區域間的方法:
# OD集計到區域 # 方法1:在不傳入柵格化引數時,直接用經緯度匹配 od_gdf = tbd.odagg_shape(oddata,sz,round_accuracy=6) # 方法2:傳入柵格化引數時,程式會先柵格化後匹配以加快運算速度,資料量大時建議使用 od_gdf = tbd.odagg_shape(oddata,sz,params = params) od_gdf.plot(column = 'count')
結果如圖10所示:
▲圖10 tbd集計的小區OD
載入地圖底圖並調整出圖引數:
# 建立圖框 import matplotlib.pyplot as plt import plot_map fig =plt.figure(1,(8,8),dpi=300) ax =plt.subplot(111) plt.sca(ax) # 新增行政區劃邊界作為底圖 sz.plot(ax = ax,edgecolor = (0,0,0,0),facecolor = (0,0,0,0.2),linewidths=0.5) # 繪製colorbar cax = plt.axes([0.05, 0.33, 0.02, 0.3]) plt.title('count') plt.sca(ax) # 繪製OD od_gdf.plot(ax = ax,vmax = 100,column = 'count',cax = cax,cmap = 'autumn_r',linewidth = 1,legend = True) # 新增比例尺和指北針 tbd.plotscale(ax,bounds = bounds,textsize = 10,compasssize = 1,accuracy = 2000,rect = [0.06,0.03],zorder = 10) plt.axis('off') plt.xlim(bounds[0],bounds[2]) plt.ylim(bounds[1],bounds[3]) plt.show()
結果如圖11所示:
▲ 圖11區域間OD視覺化結果
在TransBigData中,我們可以對計程車資料使用簡單的程式碼在jupyter notebook中快速進行互動視覺化。這些視覺化方法底層依託了keplergl包,視覺化的結果不再是靜態的圖片,而是能夠與滑鼠響應互動的地圖應用。
tbd.visualization_data方法可以實現資料分佈的視覺化,將資料傳入該方法後,TransBigData會首先對資料點進行柵格集計,然後生成資料的柵格,並將資料量對映至顏色上。程式碼如下:
# 視覺化資料點分佈 tbd.visualization_data(data,col = ['lon','lat'],accuracy=1000,height = 500)
結果如圖12所示:
▲ 圖12資料分佈的柵格視覺化
對於計程車資料中所提取出的出行OD,也可使用tbd.visualization_od方法實現OD的弧線視覺化。該方法也會對OD資料進行柵格聚合集計,生成OD弧線,並將不同大小的OD出行量對映至不同顏色。程式碼如下:
# 視覺化資料點分佈 tbd.visualization_od(oddata,accuracy=2000,height = 500)
結果如圖13所示:
▲ 圖13 OD分佈的弧線視覺化
對個體級的連續追蹤資料,tbd.visualization_trip方法可以將資料點處理為帶有時間戳的軌跡資訊並動態地展示,程式碼如下:
# 動態視覺化軌跡 tbd.visualization_trip(data,col = ['lon','lat','VehicleNum','time'],height = 500)
結果圖14所示。點選其中的播放鍵,可以看到計程車執行的動態軌跡效果。
▲ 圖14計程車軌跡動態視覺化
到此這篇關於Python實現交通資料視覺化的範例程式碼的文章就介紹到這了,更多相關Python交通資料視覺化內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45