DeepCap:基於弱監督的單目人體動作捕捉
使用嵌入正則化和軟相似度度量的方法對文本分類問題進行處理
頻域圖注意力網絡
CVPR 2020 | 基於多視角自然圖片的弱監督3D人體姿態估計
基於參數無關風格投影的任意風格遷移
論文名稱:DeepCap: Monocular Human Performance Capture Using Weak Supervision
作者:Habermann Marc /Xu Weipeng /Zollhoefer Michael /Pons-Moll Gerard /Theobalt Christian
發表時間:2020/3/18
論文連結:https://arxiv.org/abs/2003.08325
推薦原因
人體動作捕捉是一個非常重要的計算機視覺問題,在電影製作和虛擬/增強現實中有許多應用。
以前的方法要麼需要非常昂貴的多視角裝置或者無法恢復幀與幀之間的密集幾何一致性。本文提出了一種基於深度學習的單目密集人體動作捕捉方法,在訓練階段基於多視角圖像以弱監督的方式進行訓練,網絡架構基於兩個獨立的網絡,以整個任務解耦成姿態估計和表面非剛性形變兩個任務。作者通過定性和定量的比較驗證了文章方法在質量和魯棒性方面都要優於目前最優方法。
論文名稱:Text classification with word embedding regularization and soft similarity measure
作者:Vít Novotný Eniafe Festus Ayetiran Michal Štefánik Petr Sojka
發表時間:2020/3/10
論文連結:https://arxiv.org/abs/2003.05019
推薦原因
作者從詞嵌入的生成、機器學習正則化方法、深度學習正則化方法、針對詞嵌入的正則化方法等角度詳細地介紹了對詞嵌入進行正則化的方法和現狀,同時提出了對現有的正則化方法的優化,並且使用多種文本相似度度量方法在多個文本分類數據集上進行驗證
作者提出了一種基於正交化方法的詞嵌入正則化方法,並且證明了這種方法對於多個文本分類任務均能有效減少訓練時間和內存消耗,並且分類能力還可得到一定的提升。同時,作者驗證了使用正交化的詞嵌入時,使用SCM作為文本相似度度量比當前最優的WMD要快的多
個人看法,這篇文章對於基於預訓練的模型進行調優或是遷移學習,有參考意義。
論文名稱:Spectral Graph Attention Network
作者:Heng Chang /Yu Rong /Tingyang Xu /Wenbing Huang /Somayeh Sojoudi /Junzhou Huang /Wenwu Zhu
發表時間:2020/3/16
論文連結:https://arxiv.org/abs/2003.07450
推薦原因
1 核心問題
用於表示學習的圖神經網絡是在多個領域上有著豐厚的成果,其中,圖注意力網絡使用了自注意力機制,使用時域學習到了每條邊的注意力權重。然而,此機制只注意到了圖的局部信息,極大地增加了參數數目。本文主要則面對的是在頻域引入圖注意力機制的核心問題。
2 創新點
本文提出的頻域圖注意力網絡,主要學習了有關加權過濾器和圖小波基的不同頻率分量的表示,並基於全局視角對圖結構信息進行了顯式編碼。具體來說,本文選擇了圖小波作為基,並將其分解為低頻分量和高頻分量,然後,根據低頻分量和高頻分量構造兩個不同的卷積核,並將注意力機制運用到這兩個卷積核上,使其得以捕捉其重要性。最後,本文應用了池化和激活函數去產生最終輸出。
3 研究意義
本文提出的方法,比起傳統的圖注意網絡,可以使用更少的學習參數,更好的捕捉圖的全局特徵,從而實現了高效性。通過在半監督節點分類任務對本論文提出方法的評估,證明了此機制的高效性。
論文名稱:Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the Wild
作者:Umar Iqbal /Pavlo Molchanov /Jan Kautz
發表時間:2020/3/17
論文連結:https://arxiv.org/abs/2003.07581
推薦原因
本文已被CVPR2020接收。從自然圖片進行3D人體姿態估計是近些年比較火熱的研究課題,但缺乏相應的3D標註是目前面臨的主要難題。本文提出了一種不需要3D標註的弱監督方案來解決這一問題,從比較容易獲得的無標籤的多視角數據預測人體的3D姿態。
作者提出了一種新穎的端到端框架,可以使用多視角圖片的一致性來實現弱監督訓練,作者使用基於2.5D的姿態表示,並提出了一種新穎的目標函數,只有在模型預測的所有視角的姿態合理且一致時才將其最小化。作者最後在兩個大型數據集(Human3.6M和MPII-INF-3DHP)上評估了文章方法,在所有半監督/弱監督方法中,文章方法取得了最優異的表現。
論文名稱:Parameter-Free Style Projection for Arbitrary Style Transfer
作者:Siyu Huang /Haoyi Xiong /Tianyang Wang /Qingzhong Wang /Zeyu Chen /Jun Huan /Dejing Dou
發表時間:2020/3/17
論文連結:https://arxiv.org/abs/2003.07694
推薦原因
圖像風格遷移是近些年比較熱門的研究方向,但任意圖像的風格遷移仍然是一個具有挑戰性的任務,基於任意一張風格圖像來風格化內容圖像是一個比較困難的問題。
本文提出了一種參數無關的算法Style Projection,來進行快速有效的內容-風格轉換。藉助提出的Style Projection模塊,作者進一步提出了一個用於任意風格遷移的實時前饋模型。作者通過定性分析、定量分析和用戶調研驗證了文章方法的有效性和高效性。