CVPR 2021開獎！最高獎項無華人身影，首屆黃煦濤紀念獎頒發

2021-06-23 03:02:00

大資料文摘出品

就在剛剛，作為計算機視覺領域三大頂會之一，CVPR公佈了今年最佳論文、最佳學生論文等獎項得主。

可以看到，與去年CVPR最佳論文和最佳學生論文一作均為華人不同，今年華人的表現相對「低調」了許多，在最佳論文、最佳學生論文等獎項中，只有最佳學生論文有華人蔘與。

不過在整個提名名單中，本屆CVPR 2021最佳論文獎的32篇候選論文中，有華人蔘與的論文共18篇，華人一作論文更是高達16篇，佔據半數。

此外，國內機構學者為一作的論文共計6篇。

根據官方報道，今年共收到7015篇有效投稿，其中1663篇論文被接收，接收率為23.7%。

這一資料與去年22%的接收率相比較而言有小幅上升，但可以想見，競爭仍然相當激烈。

接下來，和文摘菌一起來看看具體獎項的得獎情況吧~

最佳論文

今年的最佳論文獎題為GIRAFFE：Representing Scenes as Compositional Generative Neural Feature Fields，作者為馬普智慧系統研究所自主視覺小組（Autonomous Vision Group，AVG）計算機視覺/機器學習領域的博士生Michael Niemeyer，和AVG的領導者、電腦科學教授Andreas Geiger。

論文中，研究人員提出，深度生成模型雖然能在高解析度下合成照片級真實感影象，但是對於許多應用來說遠遠不夠，內容創造還需要做到可控才行。

雖然近年來有研究探討了如何解開資料中潛在的變化因素，但它們只考慮了二維空間。此外，也只有少數研究工作考慮到了場景的組合性質。

因此，研究人員將場景表示為合成生成的神經特徵場，使其能夠從背景中分離出一個或多個目標以及單個目標的形狀和外觀，同時在無需任何額外的監督下從非結構化和未使用的影象集合中進行學習。

這也是本文的關鍵假設是，即把合成的三維場景表示合併到生成模型中會導致更可控的影象合成。

將這種場景表示與神經渲染pipeline結合後，就可以得到一個快速而逼真的影象合成模型。實驗證明，該模型能夠分離單個目標物體，並允許在場景中平移和旋轉它們以及改變相機姿勢。

論文地址：

https://arxiv.org/pdf/2011.12100.pdf

最佳論文榮譽獎：

最佳學生論文

今年的最佳學生論文獎題為Task Programming: Learning Data Efficient Behavior Representations，作者為加州理工大學的Jennifer J. Sun、西北大學的助理教授Ann Kennedy等人。

在論文中，研究人員提出了一種用於行為分析的有效軌跡嵌入方法TREBA，專家可以通過「任務程式設計」來有效地設計任務，同時也可以通過交換資料註釋時間來構造少量程式設計任務，減少工作量。

我們知道，在標註資料集上，要實現準確，除了必要的專業知識外，還需要付出大量的時間和精力，這就無形中為專家們增加了工作負擔。尤其在自動行為分析（automated behavior analysis）中十分明顯，比如從視訊跟蹤資料中檢測智慧體運動或動作等。

因此，為了減少註釋的工作量，研究人員提出了這種基於多工自監督學習的有效軌跡嵌入方法TREBA。

研究人員使用了行為神經科學領域的資料集對該方法進行了評估。通過小鼠和果蠅兩個領域內三個資料集的測試，結果表明，通過使用TREBA的嵌入，註釋負擔減少了10倍。也就是說，任務規劃和自監督是減少領域專家註釋工作量的有效方法。

論文地址：

https://arxiv.org/abs/2011.13917

最佳學生論文榮譽獎：

PAMITC獎

今年PAMI青年研究者獎的兩位獲得者分別是Georgia Gkioxari和Phillip Isola。

Georgia Gkioxari是Facebook FAIR的科學家，博士畢業於加州大學伯克利分校。Gkioxari主要研究領域是計算機視覺，同時也是PyTorch3D的開發者之一、Mask R-CNN的作者之一，目前引用數有16000。

個人主頁：

https://gkioxari.github.io/

Phillip Isola是MIT EECS的助理教授，主要研究計算機視覺、機器學習和人工智慧。博士畢業於MIT的大腦與認知科學專業，也是加州大學伯克利分校EECS系的博士後，曾在OpenAI做了一年的訪問研究科學家。

目前Isola的論文引用數為28056，其中引用最高的論文為「Image-to-image translation with conditional adversarial networks」，這篇論文研究了條件形式的影象到影象轉換，可以說是CycleGAN的前階段工作。

個人主頁：

https://web.mit.edu/phillipi/

今年的經典論文獎（Longuet-Higgins 獎）來自微軟和石溪大學。

微軟的論文題為「Real-Time Human Pose Recognition in Parts from Single Depth Images」，發表於CVPR 2011，引用數4108。

該論文提出了一種可以在不使用時間資訊的情況下，從單張深度影象中快速準確地預測身體關節的3D位置的方法。

論文連結：

https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/BodyPartRecognition.pdf

石溪大學的論文題為Baby Talk: Understanding and Generating Simple Image Descriptions，發表於CVPR 2011，目前引用數1159。

論文中，研究人員基於大量語言資料，提出了一個從影象自動生成自然語言描述的系統。該系統利用從解析大量文字資料和計算機視覺識別演算法中收集的統計資料，在為影象生成相關句子方面非常有效，是早期影象到文字生成的重要工作。

論文連結：

http://acberg.com/papers/baby_talk.pdf

Thomas S. Huang 紀念獎

今年還新增了一個獎項，這就是Thomas S. Huang紀念獎。

去年，為了緬懷了一代CV宗師、84歲華人計算機視覺泰斗 Thomas S. Huang（黃煦濤），CVPR大會成立了 Thomas S. Huang 紀念獎。該獎項的獲獎者將由PAMITC委員會選出。

首屆Thomas S. Huang紀念獎的獲獎者是MIT電子電氣工程與電腦科學教授Antonio Torralba。

Torralba的研究領域包括場景理解和上下文驅動的目標識別、多感官知覺整合、資料集構建以及神經網路表徵的視覺化和解釋。

他目前的論文引用數為78736，h指數為111。

個人主頁：

https://groups.csail.mit.edu/vision/torralbalab/

本屆CVPR中的華人身影

雖然在最終得獎的論文中，並沒有看到華人作者為一作的論文，但仍然無可否認，華人身影越來越多地出現在AI頂會上。

以CVPR 2021為例，在最佳論文獎的候選名單中，32篇候選論文，有18篇有華人蔘與，作者來自國內外高校和研究機構。

華人一作的論文共有16篇，其中不乏陶大程、沈春華、何愷明等知名學者的名字。

除了在論文接收上大放異彩之外，在今年CVPR的評審中，中國科學院院士譚鐵牛教授擔任大會主席，上海科技大學教授虞晶怡、肯塔基大學計算機系終身教授楊睿剛擔任程式主席。

相信在未來，華人身影會成為AI學術界一股重要的影響力量。

CVPR 2021開獎！最高獎項無華人身影，首屆黃煦濤紀念獎頒發

熱門文章