ACL2020揭曉所有獎項!華人姑娘斬獲最佳論文

2020-07-09     大數據文摘

原標題:ACL2020揭曉所有獎項!華人姑娘斬獲最佳論文

大數據文摘出品

作者:笪潔瓊

由於疫情的原因,全球計算機領域的頂會之一,第58屆國際計算語言學年會ACL2020今年改成了線上會議,會議時間從7月5日持續到7月10日。

本次會議收稿為779篇,投稿論文為3429篇,接受率為25.2%,數量是迄今為止最多的一次。

今天凌晨,本次會議剛剛頒布了最佳論文,加上昨天公布的時間檢驗獎、傑出服務獎以及終身成就獎,大獎就已經全部揭曉啦。

錯過了大會直播的朋友,跟著文摘菌看看這次的幾篇獲獎研究吧。

最佳論文

論文:Beyond Accuracy:Behavioral Testing of NLP Models with Checklist

作者:Marco Tulio Ribeiro, Tongshuang Wu, Carlos Guestrin 等人,分別來自微軟、華盛頓大學等。

摘要:雖然測量測試集精度是評估泛化性的主要方法,但它其實常高估NLP模型的性能,而評估模型的一些替代方法要麼關注單項任務,要麼關注特定行為。受軟體工程中行為測試原則的啟發,我們引入了清單(CHECKLIST)法,這是一種通用的測試NLP模型的方法。該方法包括一個通用語言能力和測試類型矩陣,對模型進行全面測試,還有一個軟體工具,以生成大量的多樣的快速測試用例。我們用三個任務的測試來說明清單法的效用,即在商業模型和最新模型中識別關鍵故障。在一項用戶研究中,一個負責商業情緒分析模型的團隊在一個經過廣泛測試的模型中發現了新的解決的bug。在另一項用戶研究中,使用清單的NLP從業者創建了兩倍多的測試用例,發現的bug幾乎是不用清單用戶的三倍。

論文連結:

https://www.aclweb.org/anthology/2020.acl-main.442/

值得一提的是,最佳論文的作者中中包括一位來自華盛頓大學計算機科學博士生吳彤霜,本科畢業於香港科技大學計算機科學與工程專業。

吳同學表示對交互式機器學習,人機互動和可視化特別感興趣。目前工作集中在以人為本的精神上增強機器學習模型的訓練和評估步驟,以使最終用戶可以更有效和系統地與他們的模型進行交互。

吳同學個人主頁:

https://homes.cs.washington.edu/~wtshuang/

最佳榮譽提名論文

本次的最佳榮譽提名論文總共有兩篇。

論文:Don't Stop Pretraining:Adapt Language Models to Domains and Tasks

本文作者為來自艾倫人工智慧研究院的Suchin Gururangan,和來自華盛頓大學的Ana Marasović, Swabha Swayamdipta等人

摘要:大型神經語言模型在許多NLP任務上的成功令人興奮。然而,我們發現這些成功有時會導致誇大,這些模型被描述為「理解」語言或捕獲「意義」。在這篇論文中,我們認為,一個只接受形式訓練系統的先天無法學習意義。為了與ACL 2020的主題「盤點我們已經做過的和將要做的」保持一致,我們認為,對形式和意義之間的區別的明確理解將有助於引導該領域朝著更好的自然語言理解科學方向發展。

論文連結:

https://www.aclweb.org/anthology/2020.acl-main.463/

ACL官方表示,目前ACL最高被引論文已達到2000多次。

時間檢驗獎

時間檢驗獎頒給了4篇論文,其中有2篇是在1995年發表的,2篇是在2010年已經發表的,

1.Centering:A Framework for Modeling the Local Coherence of Discourse(1995,發表在CL)

摘要:本文探討了語篇中注意焦點、表達方式的選擇和話語的連貫性之間的關係。提出了一個中心的框架和基本理論,用以模擬注意力狀態的局部成分。本文考察了局部連貫與指稱用語選擇之間的相互作用;本文認為,在特定的注意狀態下,相干性的差異在一定程度上對應著不同類型指示的推理要求。結果表明,定心模型的注意狀態特性可以解釋這些差異。

論文連結:

https://www.aclweb.org/anthology/J95-2003.pdf

2.UNSUPERVISED WORD SENSE DISAMBIGUATION RIVALING SUPERVISED METHODS(1995,發表在ACL)

摘要:本文提出了一種無監督的語義消歧學習算法,當在無注釋的英語文本上進行訓練時,該算法的性能可以與需要耗費大量時間的手動注釋的有監督技術相媲美。該算法基於兩個強大的約束——每一篇話語往往有一種含義,每一種搭配往往有一種含義——在疊代自舉過程中加以利用。

測試精度超過96%。

論文連結:

https://www.aclweb.org/anthology/P95-1026.pdf

3.Distributional Memory:A General Framework for Corpus-Based Semantics(2010)(發表在CL)

摘要:通常基於語料庫的語義研究集中在專門模型的開發上,這些模型將單個任務或一組密切相關的任務視為不相關的挑戰,需要通過從語料庫中提取不同種類的分布信息來解決。作為「一項任務,一種模型」方法的替代方案,分布式記憶框架從語料庫中提取分布式信息,其形式是一組權重詞連結詞元組排列成一個三階張量。然後由張量生成不同的矩陣,它們的行和列構成自然空間來處理不同的語義問題。

這樣,相同的分布信息就可以在建模詞語相似度判斷、發現同義詞、概念分類、預測動詞的選擇偏好、解決類比問題、對詞之間的關係進行分類、利用模式或實例對獲取定性結構、預測概念的典型屬性、將動詞分類為交替類等任務之間共享。

在所有這些領域中進行的廣泛的經驗測試表明,對於相同的任務,分布式內存實現與最近文獻中報道的特定任務算法以及我們幾種最先進的方法的實現相比具有競爭力。因此,儘管分布式內存方法的多用途特性帶來了一些限制,但它是可以實現的。

論文連結:

https://www.mitpressjournals.org/doi/pdf/10.1162/coli_a_00016

4.Word representations:A simple and general method for semi-supervised learning(2010)(發表在ACL)

摘要:如果我們以現有的有監督自然語言處理系統為例,一個簡單而普遍的提高準確率的方法是使用無監督的詞語表示作為額外的詞語特徵。我們採用了Brown Clusters,Collobert和Weston(2008)的嵌入,以及HLBL(Mnih&Hinton,2009)在NER和組塊上嵌入的單詞方法,我們使用最先進的監督基線,發現這三個單詞表示中,都提高了這些基線的準確率。

通過組合不同的單詞表示法,我們發現了進一步的改進。

論文連結:

https://www.aclweb.org/anthology/P10-1040.pdf

論文代碼:

http://metaoptimize.com/projects/wordreprs/

傑出服務獎與終身成就獎

今年 acl2020nlp的傑出服務獎(Distinguished Service Award)頒給了多倫多大學的Graeme Hirst教授,表彰他在2008-2017年ACL財務負責人的工作上做出的巨大貢獻。

個人主頁:

http://www.cs.toronto.edu/~gh/

今年 acl2020nlp的終生成就獎頒給了愛丁堡大學榮譽教授Bonnie Webber。Webber教授對篇章分析(discourse analysis)相關研究做出了傑出貢獻,是Penn Discourse Treebank(PTDB)的主要作者。她也是ACL、AAAI和愛丁堡皇家學會的會士。

個人主頁:

http://homepages.inf.ed.ac.uk/bonnie/

相關報道:

https://acl2020.org/blog/ACL-2020-best-papers/

文章來源: https://twgreatdaily.com/JxBYMnMBnkjnB-0z8tKS.html