首頁 > 軟體

Python 資料視覺化神器Pyecharts繪製影象練習

2022-02-28 13:00:52

前言:

Echarts 是百度開源的一款資料視覺化 JS 工具,資料視覺化型別十分豐富,但是得通過匯入 js 庫在 Java Web 專案上執行。

作為工作中常用 Python 的選手,不能不知道這款資料視覺化外掛的強大。那麼,能否在 Python 中也能用到 Echarts 的功能呢?尋找中驚喜地發現了 pyecharts,只需在python中安裝該模組即可使用。

安裝:

常用的pip安裝包一鍵安裝pyecharts

 pyecharts安裝命令:

ython -m pip install pyecharts

Python + pyecharts具體應用

結合工作中的專案資料,我選擇了 test 專案需求中 hotel_code_new 為 CNSZVS_002,CWSWS_003 對應2019年12個月指標為 RNs 的資料做視覺化展示與分析。

1.Hive資料庫查詢sql

hive_sql內容如下:

# sql中所使用的部分語法為hive sql中常規的語法,與mysql有所不同,請注意。
select rrrd1.hotel_code_new as hotel_code_new
      ,dda.natural_date as natural_date
      ,nvl(rrrd.room_nights, 0) as room_nights
 from ( select distinct substr(natural_dt,1,7) as natural_date 
    from dws.dws_test_date_calendar
    where dt_year='2019'
        )dda
        left join 
         (select 'CNSZVS_002' hotel_code_new
            UNION all select  'CWSWS_003' hotel_code_new
      )rrrd1
        left join
         (select  hotel_code_new
                    ,substr(stay_date,1,7) as stay_date
                    ,sum(number_of_room_nights) as room_nights
                from dwm.dwm_test_resvs_rom_daily_df
                where dt='2021-10-24'
                and hotel_code_new in(CNSZVS_002', 'CWSWS_003')
                    and resv_status in('CHECKEDSSSIN','CHECKEDSSSOUT')
                    and substr(stay_date,0,4) = '2019' 
                    group by hotel_code_new,substr(stay_date,1,7)
        )rrrd 
        on dda.natural_date = rrrd.stay_date 
        and rrrd1.hotel_code_new=rrrd.hotel_code_new
        order by rrrd.hotel_code_new;

2.Python程式碼實現—柱狀圖

from impala.dbapi import connect
import warnings

#資料倉儲資料獲取準備
def hive_connect(sql):
    warnings.filterwarnings('ignore')
    config_hive_beta = {
        'host': '10.7.0.12',  #hive的host地址
        'port': 10000,    #hive的埠號
        'user': 'hive',    #hive的username
        'password': 'hive',    #hive的password
        'database': 'tmp',     #hive中需要查詢的資料庫名
        'auth_mechanism': 'PLAIN' #hive的hive-site.xml組態檔中獲取
    }
    conn = connect(**config_hive_beta)
    cursor = conn.cursor()
    cursor.execute(sql)
    hive_all_data = cursor.fetchall()
    return hive_all_data


# all_data = hive_connect(hive_sql)
# 通過呼叫hive_connect方法獲取到的資料庫查詢結果資料如all_data列表所示
all_data = [('CNSZVS_002', '2019-01', 0), ('CNSZVS_002', '2019-02', 0), ('CNSZVS_002', '2019-03', 0),
            ('CNSZVS_002', '2019-04', 0), ('CNSZVS_002', '2019-05', 0), ('CNSZVS_002', '2019-06', 2353),
            ('CNSZVS_002', '2019-07', 2939), ('CNSZVS_002', '2019-08', 5148), ('CNSZVS_002', '2019-09', 3850),
            ('CNSZVS_002', '2019-10', 4973), ('CNSZVS_002', '2019-11', 5467), ('CNSZVS_002', '2019-12', 4742),
            ('CWSWS_003', '2019-01', 5914), ('CWSWS_003', '2019-02', 4434), ('CWSWS_003', '2019-03', 6003),
            ('CWSWS_003', '2019-04', 6611), ('CWSWS_003', '2019-05', 6586), ('CWSWS_003', '2019-06', 5840),
            ('CWSWS_003', '2019-07', 6624), ('CWSWS_003', '2019-08', 7001), ('CWSWS_003', '2019-09', 5792),
            ('CWSWS_003', '2019-10', 6898), ('CWSWS_003', '2019-11', 6944), ('CWSWS_003', '2019-12', 5404)]

# 從pyecharts模組匯入柱狀圖-Bar
from pyecharts import Bar
# 設定橫軸行名,這裡使用12個月份的英文簡稱
columns = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]
# 分別新建2個空list用於儲存每個月份對應的RNs的值
CNSZVS_002 = []
CWSWS_003 = []

for i in all_data:
    if i[0] == 'CNSZVS_002':
        CNSZVS_002.append(i[2])
    elif i[0] == 'CWSWS_003':
        CWSWS_003.append(i[2])
    else:
        pass
# 設定柱狀圖的主標題與副標題
bar = Bar("柱狀圖", "Test需求—2019年的RNs")
# 新增柱狀圖的資料及設定項-求平均值、最大值、最小值
bar.add("CNSZVS_002", columns, CNSZVS_002, mark_line=["average"], mark_point=["max", "min"])
bar.add("CWSWS_003", columns, CWSWS_003, mark_line=["average"], mark_point=["max", "min"])
# 在本py檔案同級目錄下生成名為render.html的本地檔案(預設為.html檔案)
bar.render()
# 也可設定成指定的路徑用於儲存html檔案
#bar.render(r"D:bar_render.html")

柱狀效果圖展示:

生成的柱狀效果圖是html格式的,可以在瀏覽器中開啟檢視,在瀏覽器中支援下載成圖片格式到本地,並且點選圖例即可置灰對應的圖例,同時隱藏圖例對應的柱狀圖資料,

如下圖所示:

3.Python程式碼實現—餅狀圖

注意:資料準備部分的程式碼與柱狀圖一樣,這裡只展示餅狀圖特有的程式碼

# 從pyecharts模組中匯入餅圖Pie
from pyecharts import Pie
# 設定主標題與副標題,標題設定居中,設定寬度為1000
pie = Pie("餅狀圖", "Test需求—2019年的RNs", title_pos='left', width=1000)
# 使用add匯入資料,設定座標位置為【20,50】,上方的colums選項取消顯示
pie.add("CNSZVS_002", columns, CNSZVS_002, center=[20, 50], is_legend_show=True)
# 使用add匯入資料,設定座標位置為【75,50】,上方的colums選項正常顯示
pie.add("CWSWS_003", columns, CWSWS_003, center=[75, 50], is_legend_show=False, is_label_show=True)
# 儲存圖表
pie.render()

餅狀效果圖展示——隱藏所佔百分比

餅狀效果圖展示——展示所佔百分比

4.Python程式碼實現—箱型圖

# 從pyecharts模組匯入箱型圖Boxplot
from pyecharts import Boxplot
boxplot = Boxplot("箱型圖", "Test需求—2019年的RNs")
x_axis = ['CNSZVS_002', 'CWSWS_003']
y_axis = [CNSZVS_002, CWSWS_003]
# prepare_data方法可以將資料轉為巢狀的 [min, Q1, median (or Q2), Q3, max]
yaxis = boxplot.prepare_data(y_axis)
boxplot.add("2019年RNs統計", x_axis, yaxis)
boxplot.render()

箱型圖效果展示:

5.Python程式碼實現—折線圖

from pyecharts import Line
line = Line("折線圖", "Test需求—2019年的RNs")
# is_label_show屬性是設定上方資料是否顯示
line.add("CNSZVS_002", columns, CNSZVS_002, is_label_show=True)
line.add("CWSWS_003", columns, CWSWS_003, is_label_show=True)
line.render()

折線圖效果展示:

6.Python程式碼實現—雷達圖

from pyecharts import Radar
radar = Radar("雷達圖", "Test需求—2019年的RNs")
# 由於雷達圖傳入的資料得為多維資料,需要將list再進行list轉換一次
CNSZVS_002 = [CNSZVS_002]
CWSWS_003 = [CWSWS_003]
# 設定column的最大值,為了雷達圖更為直觀,這裡的月份最大值設定依據真實資料的值來設定,因此各個月份有所不同
schema_diff = [
    ("Jan", 7000), ("Feb", 5000), ("Mar", 6500),
    ("Apr", 7000), ("May", 7000), ("Jun", 6200),
    ("Jul", 6800), ("Aug", 7200), ("Sep", 6000),
    ("Oct", 7300), ("Nov", 7500), ("Dec", 6000)
]
# 傳入座標
radar.config(schema_diff)
radar.add("CNSZVS_002", CNSZVS_002)
# 一般預設為同一種顏色,這裡為了便於區分,需要設定item的顏色
radar.add("CWSWS_003", CWSWS_003, item_color="#1C86EE")
radar.render()

雷達效果圖展示:

7.Python程式碼實現—散點圖

from pyecharts import Scatter
scatter = Scatter("散點圖", "Test需求—2019年的RNs")
# xais_name是設定橫座標名稱,這裡由於顯示問題,還需要將y軸名稱與y軸的距離進行設定
scatter.add("CWSWS_003&CNSZVS_002 RNs的散點分佈", CNSZVS_002, CWSWS_003, xaxis_name="CNSZVS_002", yaxis_name="CWSWS_003", yaxis_name_gap=40)
scatter.render()

散點圖效果展示:

總結:

  • 準備符合要求的資料及其格式
  • 匯入對應圖表所使用的包
  • add()方法:主要方法,用於新增圖表的資料和設定各種設定項
  • render()方法:用於儲存生成的圖表

 到此這篇關於Python 資料視覺化神器Pyecharts繪製影象練習的文章就介紹到這了,更多相關Python 資料視覺化神器Pyecharts內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com