首頁 > 科技

百度智慧雲數字人智慧全身屏斬獲2020中國當代好設計獎

2021-06-02 19:54:34

在2020年當代好設計獎評審中,百度智慧雲設計並研發數字人系列產品從國內外眾多硬體產品中脫穎而出,斬獲2020中國當代好設計獎。

當代好設計獎(Contemporary Good Design Award,簡稱CGD)是由德國紅點獎機構主辦的國際化設計大獎,每年吸引包括小米、聯想、戴爾等國內外頂尖品牌的產品參與角逐,當代好設計獎評審流程基於紅點獎60餘年專業評審經驗,由國際資深評審注重每個產品是否達到國際頂尖標準,而不是參賽產品之間的較量。旨在評選出傑出的在創新度、前沿性、實用性兼具的產品。

本次獲獎的數字人云屏是百度數字人技術商業化應用場景下的創新產品。數字人云屏結合了人像建模技術、感知引擎、認知引擎等人工智慧技術,具有對物理世界的感知、認知與表達能力。虛擬數字人以雲屏為載體,在螢幕中以1:1比例呈現,帶來全新的人機互動體驗,在金融、廣電、教育、營銷、醫療、零售、遊戲等行業中,都有著廣泛的應用場景, 成為更溫暖,更有人情味的AI服務觸點。

不同於傳統的大螢幕硬體,數字人云屏的外觀設計與螢幕內的數字人形象需要深度耦合,使數字人云屏能夠為更好地實現數字人的整體體驗而服務。

還原1:1的真實體驗感

數字人的本質是模擬真人互動能力與體驗,代替真人提供服務。雲屏作為使用者與數字人互動的媒介,還原真實人物身高尺寸比例是人機互動體驗的基礎。為了實現這樣的效果,百度設計團隊通過一比一投影對比實驗、服務業身高資料偏好調研,將數字人身高定義在168cm,並反推出適合的螢幕尺寸比例。目前應用在百度數字人云屏上的螢幕是由百度聯合供應鏈資源共同研發定製的特殊尺寸。定製的螢幕尺寸避免當數字人在相同高度的傳統螢幕中顯示時,左右留白過多的空曠感,以及過大的螢幕寬度對後期現場部署的空間限制。

輕薄、自然、科技感

數字人云屏具有纖薄的機身,機身邊框採用了非常獨特的圓弧內凹設計,使得機身側面層次分明,富於光感,同時邊框視覺上也更加輕薄。業界首創的極簡纖細底座,突破了傳統大螢幕厚重的底座設計,使得底座近乎消隱在使用者視野中,使用者的注意力可以完全聚焦在螢幕中的數字人形象上。漸變的喇叭孔設計,使得黑色的孔洞於白色機身過渡自然,弱化視覺的存在感。所有的造型處理都是為了儘可能弱化螢幕硬體本身的視覺存在感,突出數字人本身。

人性化的細節處理

傳統大螢幕基本都採用黑色的螢幕玻璃絲印,然而這種處理方式與競品相比無法形成差異化,且科技感有餘,親和力不足。基於此,百度智慧雲選擇工藝要求更高的白色螢幕玻璃絲印,配合業內通透性最好的玻璃基材,實現了非常純粹的牙白色玻璃效果。舒適內斂的牙白色螢幕玻璃與優雅的數字人形象配合,呈現出完美的整體視覺體驗。同時,螢幕採用防眩光玻璃,保證螢幕在複雜的光線環境下,不會出現干擾數字人顯示的反光。

螢幕的底座除了在造型上極簡纖細之外,整體還採用了磨砂亞光的淺灰色鋁氧化效果,既有高階且低調的金屬質感,也能夠和白色的螢幕有所區隔,進一步強化螢幕的視覺中心地位。

基於使用者不同場景的功能和場地需求,數字人云屏包含有:72寸、65寸、55寸、43寸不同版本和2種不同的安裝固定方式。

百度數字人云屏OS服務於公共場所場景

眾所周知,OS是用於管理硬體和軟體,並提供通用服務的計算機程式,百度數字人云屏作為軟硬一體的智慧產品,其系統是一個內建了固定應用軟體的大型泛用程式,與傳統的嵌入式系統不同,它天生自帶AI基因,在此基礎上可定製豐富多樣的應用功能。

Windows服務於辦公場景,其office辦公三件套至今已超三十年,繼續作為現代社會的生產工具;iOS服務於移動網際網路場景,最大特點是隨時隨地即刻滿足當代人群的各類需求;DuerOS服務於家居場景,小度智慧音箱出貨量千萬臺,走進千家萬戶,為使用者提供生活場景下的貼心服務,還有小度車載OS服務於駕駛場景,百度數字人云屏OS則服務於公共場所場景。

通過對公共場所服務場景(含銀行、醫院、展館、政務大廳、商場與商鋪等)的設計分析,在系統架構上,底層是百度的AI技術,有語音技術、影象識別、NLP、知識圖譜等,中間層是軟硬一體的產品與功能,上層是基於各行業服務場景的解決方案。

在系統的使用場景上劃分三層,分別是「高頻層」、「低頻層」和「定製層」,對應的使用者是「店員」、「運營人員」和「開發人員」。

在現實場景下的服務是會有不可預估的隨機性出現,而往往服務觸點的切入機會也藏在其中,此時恰當的解決方案是「人機協同」,通過「店員」簡單操作讓智慧互動屏擁有「恰逢其時」的服務抓手,對此在雲屏上就能進行使用高頻的功能做配置調整。

3D桌布,不僅能更好的融入場景,還能抓住節假日的時間點提升場景適應性。

(更換桌布GIF圖1)

叫賣播報,主動展示資訊吸引使用者注意,結合數字人的動作、表情、聲音來提升其吸引力。播報內容配置簡單,在裝置上就能實時的操作,可根據自身要求調整播放時段和頻次,做到有的放矢的播報內容。(視訊)

(叫賣播報GIF圖1)

(叫賣播報GIF圖2)

主動迎賓,主動發起歡迎與資訊推薦,當有使用者走來時,數字人能主動進行迎賓接待,以及主動推薦資訊。迎賓內容配置簡單,在裝置上就能實時的操作,可根據接待的來賓,做對應的歡迎詞和推薦資訊的內容配置。

數字人換裝,換套衣服換個髮型,為顧客來賓提供煥然一新的高顏值服務。

(換裝GIF圖1)

在公共場所的服務場景下,問詢服務是一個基礎的通用功能,系統提供一問一答與多輪問答編排的後臺能力,「運營人員」做一次問答內容的錄入,可持續應用於該場景之下。另外還提供營銷工具,在某個時間段內做營銷活動,也屬於低頻的一次配置,相對於一段時間內智慧化使用。

問答後臺一問一答

簡約的標準問與回答,對應UIKit元件

多輪問答編排

流程編排

15項預置技能

預置技能

營銷後臺,全網18類熱門營銷玩法,豐富服務觸點的抓手能力。

營銷活動

對於一些服務場景,需要定製化開發對應的功能,對此百度智慧雲提供完整的開發者工具包,讓AI技術的呼叫變得更簡單。

從看見到使用,都符合人們的自然認知習慣

有賴於AI技術日新月異的發展,在語音互動領域接近做到使用人們日常生活所用的自然語言作為互動媒介,只要會說話就能互動。所以,百度智慧雲基於理想狀態下軟硬一體的技術實現能力,提出百度數字人云屏的設計目標——「符合人們認知習慣的自然互動」。

當人們面對著數字人云屏,可以說絕大多數是第一次接觸這個「新物種」,設計上要做好聯想牽引,引導成這是一個「數字服務員」,為了達成這個認知狀態,設計上需要從接納使用者到銜接真實,在現階段百度智慧雲採取「從現實環境過度到擬物場景」的設計思路,銜接好人們的習慣認知自然落到數字人云屏上,儘可能的降低大眾的認知挑戰,降低產品使用的阻力。

對此百度智慧雲做了多套的3D虛擬場景搭建,力求融入各類服務場景的現實之中。另外還精雕細琢的創建「數字人」,從長相、髮型、妝容、服裝、動作等都符合服務場景下所期待的高顏值數字形象。

3D場景建模

多套髮型

在認知上百度智慧雲解決「歧義問題」,在互動上百度智慧雲要順應人們自然的行為,為此百度智慧雲提出在雲屏所放置的區域存在著人們習慣的互動空間,結合霍爾人機空間理論,以及使用百度智慧雲在HCII發表的論文《Stepped Warm-up--The Progressive Interaction Approach for Human-Robot Interaction in Public》其公共場所下人-機器人的漸進式研究的結論,同時融合數字人云屏智慧感測器的識別能力,搭建百度數字人云屏在公共場所下的互動分區。

播報態,吸引過路使用者的注意力,向公共域的流量做引流。

主動態,服務觸點的切入與轉化的關鍵點,提供主動迎賓與資訊推薦。

互動態,免喚醒詞全雙工語音互動是互動態的核心,通過線型麥克風陣列和單目攝像頭人臉影象的多模動態識別,實現在嘈雜環境下的免喚醒語音互動,這大大提高了使用者與雲屏的語音互動效率和主觀滿意度。

在實現上,百度智慧雲針對近場做語音識別的演算法增強優化,在雲屏朝前45cm-120cm範圍內,實現近場語音互動識別的增益區。另外通過百度實驗室模擬環境做語音互動識別測試,在安靜環境下其總句準率為95.25%,在容噪環境下其總句準率為93.03%。

為了進一步提升使用者與數字人云屏的語音互動體驗,在語音互動細節上深入打磨,劃分四個狀態,分別是不可語音、可以語音、語音輸入中和語音解析中。

另外還提供按鍵式語音互動,防備在極端環境下的裝置可用,同時該按鍵互動相容單擊與長按,對於習慣觸屏互動的人群而言,不管是單擊還是長按都是正確的。


IT145.com E-mail:sddin#qq.com