今日 Paper | 可視問答模型;神經風格差異轉移;圖像壓縮系統 ;K-SVD圖像去噪等

2020-02-13     AI科技評論

目錄

  • 準確性與複雜性:可視問答模型中的一種權衡

  • 神經風格差異轉移及其在字體生成中的應用

  • 基於GAN的可調整的圖像壓縮系統

  • 基於原始-對偶活動集算法的K-SVD圖像去噪

  • 神經閱讀理解與超越

準確性與複雜性:可視問答模型中的一種權衡

論文名稱:Accuracy vs. Complexity: A Trade-off in Visual Question Answering Models

作者:Farazi Moshiur R. /Khan Salman H. /Barnes Nick

發表時間:2020/1/20

論文連結:https://arxiv.org/abs/2001.07059v1

推薦原因

這篇論文考慮的是視覺問答的問題。

為了驗證AI的推理能力,視覺問答(Visual Question Answering,VQA)被用作一種視覺圖靈測試。現有VQA模型的關鍵是將圖像的視覺特徵與給定問題的語義特徵相結合而學習到聯合嵌入。大量的研究聚焦於利用視覺注意力機制來設計複雜的聯合嵌入策略,以有效捕捉視覺與語義間的交互作用。但是,在高維空間構建視覺與語義特徵計算量極大,模型越來越複雜,對VQA準確率帶來的提升卻很小。這篇論文系統地研究了模型複雜度和性能兩方面的折中策略,並且特別關注了這些模型在多模態融合方面的效果。通過實驗,這篇論文給出了如何優化以降低複雜性和如何優化以實現當前最佳VQA性能的提升這兩個方面的建議。

神經風格差異轉移及其在字體生成中的應用

論文名稱:Neural Style Difference Transfer and Its Application to Font Generation

作者:Atarsaikhan Gantugs /Iwana Brian Kenji /Uchida Seiichi

發表時間:2020/1/21

論文連結:https://arxiv.org/abs/2001.07321v1

推薦原因

這篇論文了介紹一種自動創建字體的方法,找到兩種不同字體之間的字體樣式差異,並使用神經樣式轉移將其轉換為另一種字體。這篇論文提出了一種新的神經風格差異和內容差異損失神經風格轉移方法。根據這些損失,可通過在字體中添加或刪除字體樣式來生成新字體。基於各種輸入字體組合的實驗結果,這篇論文還討論了所提方法的局限性和未來的工作。

基於GAN的可調整的圖像壓縮系統

論文名稱:A GAN-based Tunable Image Compression System

作者:Wu Lirong /Huang Kejie /Shen Haibin

發表時間:2020/1/18

論文連結:https://arxiv.org/abs/2001.06580v1

推薦原因

這篇論文考慮的是圖像壓縮的問題。

在基於深度神經網絡的有損圖像壓縮中,重要性圖方法被廣泛應用,以根據圖像內容的重要性來實現比特分配,然而這種方法容易出現嚴重失真。這篇論文提出使用生成對抗網絡重構非重要區域,將多尺度金字塔分解方法應用於編碼器和判別器,以實現高解析度圖像的全局壓縮。同時這篇論文還提出了一種可調整的壓縮方案,將圖像壓縮為任何特定的壓縮率,而無需重新訓練模型。實驗結果表明,與最新的基於GAN的方法相比,這篇論文提出的方法在MS-SSIM數據集實現了10.3%以上的改進。

基於原始-對偶活動集算法的K-SVD圖像去噪

論文名稱:Image denoising via K-SVD with primal-dual active set algorithm

作者:Xiao Quan /Wen Canhong /Yan Zirui

發表時間:2020/1/19

論文連結:https://arxiv.org/abs/2001.06780v1

推薦原因

這篇論文改進了用於圖像去噪的K-SVD算法。在K-SVD的稀疏編碼步驟中,一旦噪音等級變高,尋找貪心近似解的效果就下降了。這篇論文提出了一種新的名為K-SVD_P的框架,加入了原始對偶有效集(Primal-Dual Active Set,PDAS)算法。K-SVD_P與基於貪心算法的K-SVD不同,發展出一套利用KKT條件的選擇策略,並在稀疏編碼階段產生有效的更新。由於K-SVD_P使用簡單的顯式表達式來疊代地尋找對偶問題的等效解決方案,可以在去噪的速度與質量上取得更好的效果。論文中的實驗也驗證了K-SVD_P的降噪性能。

神經閱讀理解與超越

論文名稱:NEURAL READING COMPREHENSION AND BEYOND

作者:Danqi Chen

發表時間:2019/12/21

論文連結:https://stacks.stanford.edu/file/druid:gd576xb1833/thesis-augmented.pdf

推薦原因

這篇論文是陳丹琦的博士論文,作為nlp領域的大牛,這篇文章很是優秀推薦給大家,這篇論文已經成為了NLP研究者的必讀論文,這篇論文難得可貴的是向nlp研究者們展示了,如何在研究過程中面對挑戰解決問題。

這篇論文可以看作是綜述類文章,裡面既有其它人的研究,也有自己的研究,推薦大家閱讀。

論文作者團隊招募

為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。

我們希望熱愛學術的你,可以加入我們的論文作者團隊。

加入論文作者團隊你可以獲得

1.署著你名字的文章,將你打造成最耀眼的學術明星

2.豐厚的稿酬

3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。

加入論文作者團隊你需要:

1.將你喜歡的論文推薦給廣大的研習社社友

2.撰寫論文解讀

如果你已經準備好加入 AI 研習社的論文兼職作者團隊,可以添加運營小姐姐的微信,備註「論文兼職作者」

文章來源: https://twgreatdaily.com/s75cPHAB3uTiws8KmtbR.html