新手如何寫論文 如何以初學者角度寫好一篇國際學術論文?
一只小狐貍帶你解鎖 煉丹術&NLP秘籍
人工智能頂會論文之爭越來越激烈了,CVPR、AAAI、ICLR等各大會議雖然錄取率逐年降低,但是投稿論文數量卻在逐年增加。
雖說發論文不是衡量一位學者的學術能力的唯一標準,但確是極為重要的標準。一篇好的論文不僅要求主題明確,思路新穎,而且還要求論文寫作本身行文流暢,邏輯清晰。
如何寫出一篇合格的國際學術論文呢?在論文寫作過程,你是否在引文中用到過這樣的句子呢:“因為模型A好使,所以用A做某任務”、“因為任務B沒有人做,所以我做了”、“之前的人做了什么工作,我做了什么工作,我的好”......
以上問題其實是論文寫作中常見的錯誤邏輯,在頂會審稿人審校這些論文的時候,其實是最反感這種寫法。
通過揭露這些常見錯誤,來自中國人民大學趙鑫老師在3月17日「智源Live:論文寫作專題報告會」中專門做了題為《如何以初學者角度寫好一篇國際(頂級)學術論文》分享。
趙鑫,人民大學信息學院副教授、博士生導師。博士師從北京大學李曉明教授,專注于研究面向文本內容的社交用戶話題興趣建模,曾獲2011年谷歌博士獎研金(該年大陸高校共4人獲獎)和2012年微軟亞洲博士獎研金(該年亞太高校共10人獲獎)。近五年內在國內外著名學術期刊與會議上發表論文60余篇,共計被引用2000余次。擔任多個重要的國際會議或者期刊評審。目前擔任計算機系首屆圖靈實驗班班主任。
在報告中,趙老師通過大量的事例,結合報告人的經驗,講述論文寫作過程中注意事項和常用步驟與方法,主要涉及的內容包括引文、模型、實驗以及參考文獻的寫作方法,另外還介紹了初學者應該避免發生的寫作問題新手如何寫論文,最后也介紹了一些國際期刊的投稿經驗。
回放鏈接:
趙鑫:
今天用的兩個例子雖說是信息檢索、數據挖掘、自然語言處理領域的,但方法比較通用。其實回頭看18年的論文,有些地方也沒有特別好,一些常見錯誤,我自己之前也會犯。
比如用到的兩個事例的論文,我都覺得有些地方我好像有語病。語病可能不是寫作的一個最關鍵,重要的是如何寫出來,如何組織。
第 1 篇是發表在上面,目的是為用戶規劃路線,即生成個性化的路線。第2篇是基于知識屬性的序列化推薦算法,基本思路是使用記憶網絡擴展數據存儲,知識存于記憶網絡,隱狀態做結構化解碼。
下面主要是用第1篇論文去講,這次講解希望給大家提供一個八股文,可能比較功利,但是中間會傳遞給大家如何去寫的一些價值點。
引文是論文的“門面”
引文非常關鍵,是你整個論文的門面,摘要基本上是沒啥大用,只要不是寫的太差,審稿人不會因為摘要拒掉論文,但是引文寫不好,卻100%會被拒掉。
原因是審稿人一般不會去看摘要,他們首先要看的是引文。一般來說,引文包括的內容有:要交代研究的任務,闡述現狀以及總結不足,提出新的思路,然后給出的新方案的設計,還有總結貢獻以及實驗結論。
交代研究任務是你必須讓讀者知道你要做的事情,關鍵點在于讓你室友或有計算機理論的人能夠看懂。
那么闡述研究現狀并總結不足部分需要注意的是和論文中的相關工作部分有很大的不同,這部分不需要說清楚一共有多少相關工作,只需寫明目前整體的研究到哪了、當前的挑戰。如果你只是列出了10個人工作,只說清楚了A做了什么,B做了什么,那么這一點都不會幫你加分。
解決新思路部分要引出論文的解決思路,或者idea,然后再較為詳細的介紹一下idea的實現。不需要特別詳細,只需要從方案上介紹idea是什么樣子。
這KDD的這篇論文中,即個性化的路線推薦,我就首先說明了要做的是:給定路網,生成用戶特定的路線的建議。前面我也做了鋪墊:這個任務是重要的。一般來說也說任務也說重要,這還不夠,然后還要說清楚挑戰是什么?
這篇論文中,我提到在大圖和復雜路網上“找路”是很難,然后另外又補充了一些,比如說需要把豐富的背景信息給考慮進去。
所以,一開始你要帶入,讓大家快速的熟悉你的任務。
其次是介紹研究現狀并總結不足,這部分在于給讀者一些研究背景的鋪墊,說清楚現有的研究狀態,以及他們所用方法的優缺點。
在這篇論文中,我提到當前的方法主要分為兩類,第1類就是傳統啟發式搜索,比如A*算法,其優點是在大圖上特別的快,搜索也非常好。第2類就是偏機器學習或者是deep ,它的好處是非常靈活。
分類討論之后,我話鋒一轉介紹就我的思路,即能否把這些方法的優點結合起來,然后就有了我這篇KDD 19的論文。
在Idea設計與實現上,大家可能都不會有太大的問題,但要注意不要寫的太細,能給你的同行評審員看懂就可以了,讓他們清楚你的模型大概是個什么樣子即可。
最后在引文部分要總結一下優勢,說清楚整個論文的整個最新穎的點是在哪里?另外,不要說太多貢獻,說太多會顯得論文很散,一篇論文講明一個貢獻就夠了。不建議寫很長,“貢獻可以列為下面三點,實驗還能證明這個方法的有效性”,這種文字全都可以刪掉。
上面是一些初學者可能犯到的錯誤,我當年初學的時候也犯過?!耙驗槟P虯好使,所以拿A去做某任務”,這個點在剛出來的一兩年,我審論文的時候發現50%的引文都是這么寫的,每當看到的時候,我都想把它拒絕掉。
“這個任務沒人做,所以我做了”,這一點也很霸道,畢竟世上沒人做過的事情有很多。
“之前的人做了什么工作,我做了什么工作,我的好”,這種寫作也非常霸道,沒有給人一丁點兒代入感,會讓非常不爽~
“夸大自己模型的貢獻、忽略別人的工作”極有可能導致論文被拒,千萬不能夸大!
其實有些同學也問:我們是不是在制造一些論文的垃圾?靠一些寫作去把東西包裝的冠冕堂皇。其實不是這樣,科研過程要有一個推進,你現在可能覺得這個技術不怎么樣,但是你可能需要持續的去發力。那么你要發力的一種形式,就是論文,當然其他形式也有。
如果說你不想讓你的論文成為垃圾,一定要把你的貢獻說得很清楚。
其中一個問題就是包裝一定要適度,不要過度包裝,過度包裝是對學術的很大的一個不尊重。有些度可能你自己都沒有注意到,例如隨意給出一些非常主觀的意見,連個引用都不加。還有隨意使用一些特別普遍的詞匯,我審論文基本上都會遇到,一整就是,、。在用這三個詞的時候,問問自己知道是什么意思嗎?能不能用一句話去定義這三個詞?所以,你在用這些詞的時候嗎,基本上是模糊的狀態
另一個很容易犯的錯誤是隨意夸大自己的模型,所以同學在寫的時候一定檢查一下副詞、形容詞,多用一些限定詞,比如說:在什么樣的任務,加上這個東西,效果會好一些。
引文的作用是吸引大家,最重要的是做一些鋪墊,必須是要解釋清楚主要術語。比如說有的同學在做-,但是從頭到尾都沒有解釋過什么叫-,這就非常有問題。
然后一定要解釋清楚模型的主要的設計、思路、技術路線。但也不能太細,一些調參細節就不用介紹了。
最重要的是不要把方法說的云里霧里,要讓你的同行室友能夠看懂模型。所以,最好的方法是把你室友拉過來,然后讓他看一段英文,你問他能不能看懂,他如果看不懂,你趕快把那自己那段話重新寫一下。
最后還要強調一點,突出主要的創新之處,需要寫出一句到兩句非常中肯,學術的話來總結自己的貢獻、創新點。這是非常關鍵的,我發現,包括我自己組里的同學有時候也說不清楚自己的idea,但這個比較繞,這個只能需要大家自己去把握。
然后我說一些八股文的寫作方法,可能對初學者有幫助,第1句話寫什么?寫你的任務介紹和意義;第2句話寫什么?概述,現在研究狀況以及主要的問題;第3句寫什么呢?解決這些問題的研究挑戰;第4句寫什么?當前這個方法的主要出發點和解決思路;第5句話寫什么呢?一些當前方法的主要的技術方案,最后寫總結和強調貢獻。
寫完這6句話之后,你在做什么事情就能很清楚了,如果能把這6句話寫好,其實你基本上已經把引文給寫好了。
還有一些過渡詞,特別建議大家把每一個詞是什么意義,自己去查一下。因為有的時候我也容易搞亂。
寫作是一門講故事的藝術,要讓別人聽懂,這是也是義務,這并不是說包裝。如果你的東西你別人都看不懂,聽不懂,你的東西,再好有什么用呢?因為你沒有辦法給別人帶來收益。
引文的第一個狀態讓讀過的人知道你在做什么。第二個狀態就是讓人覺得你的工作是重要的。第三點是說,讓別人覺得你的思路就是和別人不一樣,如果能給人耳目一新的感覺,那么論文很可能被接收。
最后一境界是讓人讀起來如沐春風,這個狀態我現在也沒有達到。所以在引文里頭,一定要把握節奏,節奏感是達到狀態的靈魂。
總體來說,引文寫作步驟是:首先要交代背景,讓人進入你的工作,緊接著鋪墊包袱,說清楚你要做的事,你要解決的挑戰是什么。然后最后要轉回來,帶入細節的解析,讓讀者知道你是怎么做的。
相關工作要盡可能寫的全面
先關工作的寫法是首先必須覆蓋所有的相關工作,這點其實很重要,在于你平時的積累。一定要分類整理,不要簡單的羅列“A做了什么,B做了什么”,重在總結。除此之外還要突出相關,強調不同。
在寫相關工作的時候,東西一定會很多,所以歸類整理的時候,要配上一些排版的,該加粗的加粗,該黑體的黑體,要讓評審或者其他讀者讀起來很舒適。
在相關工作中還有一個高水平的寫是給某一類方法起簡稱,比如用開頭字母代替。
上面一些錯誤也要堅決避免掉,在介紹相關工作的時候,一定要寫清楚他們與你之間的相關聯系,還有英語時態問題,可以用過去時,也可以用現在完成時,但是別混著來,混著來會給人非常不專業的感覺。
引文寫作錯誤非常常見,我留意了這五六年的審稿情況,一直存在這種錯誤,大家可以看看上面三種寫法都是錯誤的。什么能夠充當主語,什么能夠在人名處加括號,要完全弄清楚。
定義介紹要清晰
在介紹術語的時候,其實就是把概念帶入進去,特別建議所用的符號符合人的直覺,可以用英文單詞的首字母,因為首字母容易聯想。另外,符號和意義不要差距太遠。所以總結起來有三點:好看、好記、成體系。如何讓讀者快速記住你論文中的十幾種符號?建議大家去看看《花書》,然后參考一下標量、矩陣、向量的表示方法。
還有要避免一個字母代表多個不同的意義,比如有時候代表索引,有時候又代表上下標,有時候我也犯了這樣的問題,所以建議大家把論文打印出來之后,一定要反復檢查:是不是有一個符號。另外,頻繁使用一些單詞的縮寫,頻繁使用上下角標都存在的符號都會讓人對你的論文抓狂。
模型寫作邏輯很重要
模型的部分在論文中占比非常多,記住邏輯很重要,常見的方式有這么幾種:總分式、總基礎版本、增強版本??偡衷谟诒砻髂P陀腥舾蓚€部分,分別介紹每個部分,這樣主題比較清楚。建議大家把小標題都好好檢查一下,小標題如果連起來能夠把模型說清楚,是很重要的關鍵因素。
最后要收收尾的話,要寫一些模型分析和模型訓練、模型學習的方法。比如分析一下,總結一下之前方法怎么做的,然后和傳統方法比起來又有不同的地方。
時間復雜度、完整的算法流程、參數匯總、模型可拓展的地方在最后都可以在模型最后討論。如果有一些東西,你覺得可能是別人爭論的地方,可擴展加上去,說明模型有哪些地方沒做好,怎么做就會把這個事情做好。
實驗介紹要用對比
實驗部分的一般流程包括介紹數據集合、評測指標、評測流程,還有主干的實驗分析,還有模型的細致分析,還有定性的分析。
在數據集合部分要講清楚一點:論文中圖表的數據是怎么來的?這個很關鍵,其他步驟可以忽略性或者有選擇性去介紹,如果對當前工作不太重要,就別介紹了。
還有一個注意,就是說數字不要居中!因為當你有多個數據集的時候,居中不好判斷數據集大小,可以靠右對齊新手如何寫論文,靠右對齊的好處是容易看出數據集的大小。當然,也可以用逗號表示法,這樣非常容易幫助大家去認識數據有多少。
在評測指標和評測流程部分,注意新任務的評審指標要完全給出,并且要給得非常詳細,那老任務你可以沿用,可以壓縮。
對比方法是介紹,可以比較簡略,但是重要的參數要給出來。最后要加一些總結,讓讀者有一個整體的了解。
也可以用一個表,清晰的表達出哪些方法是新的,哪些方法是?;钣脠D表,研究人一定要反復要學的,包括以后做PPT,其實寫碩士畢業論文也都是有用的。
主干實驗如何寫?主干實驗一定要特別清楚做實驗的目的,千萬不要流水賬。要強調做實驗的目的是什么?做實驗的目的就是要突出方法好,這點是非常重要。
常見的錯誤寫法是有五種方法,A比B好,B比C好,雖然這能支撐一個句子的長度,但是效果其實并不會很好,因為大家都是知道你所用一些方法的好處、
如果你的模型達不到原始效果,也要好好分析一下,這點在深度學習時代特別常見。如果模型正常,描述不描述問題都不大。但是如果達不到原始論文效果,要解釋一下,不然評審會懷疑是不是沒調好參數?是不是用的方法不對?
最后一定要加上統計性顯著檢驗,確保提升是有效的,如果不加可能是壓死論文的最后一根稻草,因為我有幾次是這個原因被噴的。
在寫主干實驗的時候,最后要強調“我的方法”好,要說清楚我的方法好在哪里,不要籠統的說好10%、20%。這一步也是為后面寫實驗做鋪墊。
所以,前面要有鋪墊,比如寫清楚“我猜測是兩部分造成的”,然后下面才要做這個實驗。一般來說,主實驗完了,還有一個細致性的分析實驗,要檢查貢獻的來源,要調一些參數等等。篇幅不要太長,寫清楚就足夠了。
對于我自己來說,一般用半行或者一行就能介紹清楚一個變種的名字,學會縮寫,給出一個整體的評論。
在用定性的例子的時候,要善用圖表,解釋方法為什么會有效,你可能在論文的前面推到了一堆公式來表明你的模式是有效的,但是讓評審員最快速的理解方法的有用性,還是畫圖。
也要說清楚模型的哪個方面好,模型不可能每個方面都好,要挑選一些例子來輔助解釋。值得注意的是,模型所有的寫作都是在做呼應,因為你引文地方埋下了伏筆,要用實驗部分來驗證伏筆。
第一處呼應引文的地方是實驗結果,而最強的呼應處是例子,而圖就是定性的例子,圖的關鍵是能不能呼應論文的,圖畫好了會讓評審的老師非常舒服~
所以,總結一下就是:定性部分不要探索式的描寫,要有核心驅動進行描寫,也要用好圖的標題,標題一般要介紹各種符號、顏色以及整體場景的設置,不要讓文本描述和圖的標題大部分一樣,要讓雙方各有分工。
怎么寫定性例子的介紹?定性的例子比實驗的介紹難寫多了,實驗寫作基本上有套路,而定性寫作更加考驗科研員的功底。
一段清楚的描述一般有以下幾條:首先寫清楚目的,接著寫清楚當前例子的整體故事,然后分解進關鍵部分,最后一句話帶過,總結發現,然后說一句我的模型好。
摘要、結論最后寫
摘要如何寫呢?對我個人來說,這部分是花費時間最少的,在這無需太多的細節,不需要代入,講清楚任務、方法和創新點就可以了。建議摘要最后寫,已經在論文成型之后,一些句子已經成熟,功利的、暴力的做法是直接拿過來用。
在總結部分,切記英文語法,可以用現在完成時,過去時,但不能混著用。這部分不用再打伏筆,總結一下具體任務,解決方案,實驗結果,未來擴展即可。
最后,介紹一下我改寫論文的流程,我一般先寫相關工作新手如何寫論文,用半天時間來梳理,如果相關工作寫不清,很難說清楚論文的貢獻在哪的。
然后改問題定義、模型。對于作為老師的我來說,必須確保已經了解模型的所有的細節,才能給學生去改論文。
最后全文定稿之后才開始寫摘要、結論,我個人給這兩個部分的時間不會超過半個小時。
我推薦把文件按照p方式切割,使用 命令合并,共享一個main. tex果有多人進行操作,不同人改不同的文件。一定要快速出一版初稿,然后打印出來,多次重寫。我個人對圖非常挑剔了。通常一個圖我會讓學生修改幾十遍。圖相當于論文的門面,圖畫不好就不要投論文了。
強調大段的文字擺上來沒有切割,沒有分段,特別是雙欄布局的,我有的時候會發現有一些論文,一個單欄,從頭到尾沒有出現一個黑體字,沒有出現一個分段。然后一定再讀一讀各部分段落的題目。
小題目之間的關聯性也應該要強,如果關聯性不強要重新寫,如果重寫之后關聯性還不強,那就是論文邏輯的事情了。
另外需要注意是別刻意的刪減,但是,也要避免無意義的過程。不是什么的句子都要在后面加上。另外避免英語詞匯習慣的錯誤用法,學會靈活運用英文動詞?
OMT論文要多改、多寫
在講座的最后,趙老師還給出了一些寫論文、排版的建議,針對學習方法的穩、快、廉價給出的建議如上?
期刊寫作建議?
另外,趙老師針對幾個普遍的問題進行了回答。
問:先寫中文翻譯成英文,還是直接寫成英文?
答:可以先寫一個中文的六句話(就是引文部分的那六句話),因為你中文的六句話已經確保寫清楚了,然后再翻譯可能會好一些。
問:哪些建議可以用于碩士畢業論文。
答:我覺得全部都可以,起碼畫圖、做表這一點是通用的。
問:先寫內容還是先排版?
答:提前一定要做好模板,比如說圖應該怎么放?表示怎么放?然后比如說哪個章節應該怎么寫......
問:畫圖什么軟件更轉行業一些
答:我最近在用PPT畫圖。
問:怎么增強理論基礎呢?
答:先系統地看幾本書,然后做一些筆記,關鍵公式要會推導。
可
能
喜
歡
夕小瑤的賣萌屋
關注&星標小夕,帶你解鎖AI秘籍
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。