首頁 > 科技

後疫情時代,這家老牌資料分析公司想用「好奇心」和分析的力量改變世界

2021-06-01 13:17:08

大資料文摘出品

作者:Mickey

一場突如其來的疫情打破了人類社會運作的原有模式,也在方方面面改變了原有的規則。資料分析領域在這次疫情中也受到了同樣的衝擊。

大波實體經濟因為「封城」原因轉到線上,這一方面加速了傳統行業的資料化程序,另一方面也帶來了巨大的挑戰。

從線下轉到線上是許多受疫情衝擊企業的自救模式,但是這些平時線下業務為主的企業,突然轉到線上,難免會出現「水土不服」的現象。整體資料規模的擴大,讓所有公司的資料量級都更大、更復雜,如何能夠有效做好資料分析,並基於這些資料做好決策,更好的服務客戶,是所有轉型線上+線下模式的公司在後疫情時代面對的最大問題。

如何應對?

專注資料分析40多年、服務全球超過2000家客戶,老牌資料分析公司SAS給出的答案是:依靠正確的技術,用好奇心改變世界。

在2021年SAS Global Forum上,SAS執行長Jim Goodnight表示:「將資料轉化為決策進一步滿足了人們的好奇心,並揭示了新的可能性。與我們的客戶和合作夥伴一起,我們敢問:'如果用另一種方式呢? 作為回報,我們的客戶提高了效率和收益,同時使這個世界更安全,更強大和更有彈性,實現了SAS的承諾。」

SAS執行長Jim Goodnight

十年一劍,SAS Viya始於大規模資料分析

事實上自誕生之日起,SAS一直致力於大規模資料的分析解決,也從不懼變化帶來的問題。

在2021 SAS Global Forum上,Jim Goodnight首次披露了SAS備受好評的AI平臺——SAS Viya的誕生背景及十多年來其隨著時代變更的過程。

「2009年,我們在和一家新加坡銀行合作的過程中瞭解到,他們進行一次業務上的風險計算需要18個小時完成,這對他們的決策產生了很大的影響。因此,我們開始思考如何減少計算處理和處理大資料所需的時間。並設計了一個儲存在記憶體中的系統。」

沒有使用大多數平臺採用的Hadoop方案,SAS選擇自主研發了最新的分散式計算方式,讓資料分析可以分佈在數十個或數百個核心中同時進行。Goodnight在演講中表示:「我們希望消除SAS技術和底層硬體的限制。」

這就是SAS Viya的誕生過程,2009年推出的這一分散式計算引擎將新加坡銀行的18小時風險分析計算壓縮到了15分鐘。十多年來,SAS Viya已經更新了四代,在第三代產品中,它「已成為市場上效能最快的產品」,最新版本4已於2020年11月釋出。

「Viya從一開始就從設計上追求效能、速度和大規模資料。一旦進行了資料分析並創建了模型,就可以立即在生產環境中運行它。市面上其他競爭對手一般需要進行程式語言變更,但我們不需要。」

在最新的產品中,那項最初需要18個小時分析完成的風險技術任務現在只需要15分鐘就可以完成。

應對全球數字化程序,SAS給出兩大對策

回到最開始的問題,如何在後疫情時代解決企業大規模資料分析問題?

在SAS Global Forum前的新聞釋出會上,SAS首席技術官Bryan Harris給出了兩大解決策略。

SAS公司首席技術官Bryan Harris

分析無處不在:收購英國Boemska公司,結合雲原生能力

Harris提出的第一個解決方案是:讓分析無處不在。

為了實現隨時、隨地進行資料分析,SAS做出了一系列努力。今年年初,SAS宣佈收購英國Boemska公司,加速人工智慧在雲端計算方面的努力,進一步將SAS和開源模型移植到移動和企業應用程式中,這結合了下一代雲原生功能,也將低程式碼和無程式碼技術融入產品中,開發和執行模型和決策,以執行特定任務,例如預期欺詐,與醫療事件有關的決策,識別製造缺陷等等;此外,還能同時確保Microsoft Azure等雲上分析更加高效經濟。

SAS Viya在2020年SAS Global Forum上就宣佈了與微軟的戰略聯盟。當時,微軟執行長Satya Nadella在談到與SAS的合作時說:「在後疫情的世界中,客戶,員工等的期望正在發生變化,分析在這裡將變得很重要。」 Nadella稱:「啟用資料使(每位員工)能夠使用預測和分析能力將對業務績效產生直接影響。」 「通過幫助實現這一目標,我們可以加快客戶轉型。」

2020年SAS Global Forum上,微軟執行長Satya Nadella與SAS執行長Jim Goodnight對談

今年,SAS進一步擴大了合作伙伴關係,Harris宣佈將增加AWS和Google Cloud作為雲選項。其還與Red Hat(IBM)合作,在混合雲中運行SAS產品,其Kubernetes版本還將囊括阿里雲、騰訊雲、華為雲等。

「客戶可以靈活地在本地、上雲,混合雲實施技術方案。」 Harris表示。

人人都可以使用分析的力量:低程式碼+無程式碼趨勢

除了隨時隨地進行資料分析,SAS還致力於讓資料分析成為人人都可以使用的工具。

為了實現這一目標,SAS將低程式碼和無程式碼融入了產品中。

其實早在2001年,大資料和資料分析起步之時,SAS就將低程式碼和無程式碼操作融入產品設計中,當時SAS已經從專有程式碼轉向簡易操作平臺,這也是機器學習自動化的最早形式。

在2018年釋出的SAS Viya版本中,已經完成了演算法自動化上的設定,表現了對AI和機器學習自動化程式這一新聚焦點的全面擁抱——AI分析植入和自動化;更加透明的結果輸出;更好地資料治理功能;使用者體驗地提升;更加開放,支援更多分析工具。

在本次峰會後的採訪中,Harris告訴《大資料文摘》,SAS的客戶正在整個企業中部署數十種、數百種甚至數千種模型。低程式碼、無程式碼環境通過增加分析生命週期的參與來提高組織的敏捷性。客戶在新的數字化時代的競爭優勢有多大,取決於公司能夠以多快的速度識別機會、開發模型,並將這些模型合併到決策流中,然後將決策流整合到任何業務流程或任何應用程式中。

針對資料驅動決策的實時和有效,Harris還在採訪中給出了一些SAS產品的使用建議:

制定資料驅動的決策,首先需要及時將實時資料或接近實時的資料納入決策制定過程。在運行時,必須在特定情況下及時做出決策評估。SAS智慧決策支援多種實時資料來源,包括流資料,以確保可以以適當的粒度應用決策邏輯。當與 SAS 資訊目錄結合使用時,系統可以識別潛在的資料異常和分佈不一致,以及不應被共享的潛在私人資訊。

在模型構建過程中,SAS Visual Machine Learning 允許資料科學家在將模型部署到生產中之前識別潛在的偏差區域。無論是多數人群或少數群體,不管是公司還是代理機構,終端使用者不僅能使用,還能夠了解「為什麼」使用某個模型。關於生產中的潛在偏差,SAS 模型管理器允許跨各種指標和維度進行偏差檢測,查詢與總體相比的資料和模型偏差。

部署決策或模型後,好的資料驅動還會持續根據最新資料驗證效能。在SAS Model Manager和SAS Intelligent Decisions中,資料治理可自動應用於模型和業務規則,以跟蹤更新資料,在必要時進行監測、驗證和重新訓練。新的最優模型和修改後的業務規則可以輕鬆部署到生產中。

結語

疫情加速了各類企業的數字化程序,根據SAS在 2021 Global Forum上公佈的資料我們可以看到,在各行各業,資料分析和軟體都在滲透。後疫情時代,SAS也已經做好了全面的準備應對資料化程序的加速。

在採訪中Harris表示,短期內,我相信我們將看到傳統行業對AI的使用會大大增加,以幫助公司跨結構化、非結構化、流式傳輸、影象音訊、視訊等各種資料集做出更好的決策。從長遠來看,我認為我們將看到合成數據的巨大機會,以支援現實世界中客戶環境的複雜模擬。從AI的角度來看,這將大大降低資料獲取成本並進一步加速創新。

不止提升合作伙伴的工作效率,SAS還相信可以通過Viya這款產品用資料分析造福世界,Goodnight今年也線上演示了SAS Viya低程式碼、無程式碼分析的能力。他在演講中公開演示瞭如何使用多種機器學習模型,預測由於新冠疫情患者人數增加而導致的床位緊張,在演示中,該計算機在30分鐘內完成了在Microsoft Azure上的配置,通過並行處理完成了大規模資料分析,並通過簡單的「拖-拽-點選」等無程式碼操作建立了一個機器學習流程。


IT145.com E-mail:sddin#qq.com