最近一直在读paper。结合之前与老师、前辈、朋友讨论的经历,在此总结读paper的一些感想记录。这既是我自己的反思与总结,也可以为大家提供一些经验参考。
读写paper
在开始一个研究项目前,往往需要阅读大量领域内的paper。这一方面是为了快速了解最新研究进展,寻找idea并且避免工作重复;另一方面是为了学习优秀paper的写作风格。毕竟,读者在读你的Intro之前,并不知道你的工作内容是什么。因此在优秀的paper中,作者会让读者在进入正文之前快速了解:1. 本文研究的是什么问题;2. 该问题有什么研究挑战; 3. 我们怎样一一解决这些挑战。一言以蔽之,让读者快速了解研究工作的价值。然而,虽然优秀的paper篇篇相似,不行的paper各有各的缺点,但即便是优秀的paper也浩如烟海。因此,高效地阅读paper是一个重要的能力。为此,我主要总结了以下几点:
- 外语水平:基本语言素养
- 注意力分配:各个章节注意力占比
- 带着问题去读
外语水平
就个人经验而言,在cs领域,绝大部分paper用英文写成。因此高效阅读paper的基本素养便是足够过关的英文水平。
首先,专业paper需要大量的词汇积累,既包括日常常见词汇,也包括领域内的专业词汇。积累词汇能极大减少查词典的时间,因此无疑能提升阅读paper效率。其次,要锻炼阅读长难句、复杂句式的能力(虽然写论文严重不建议用长难句)。如果paper作者来自于英语国家,或者研究领域在教育学、心理学等不那么理工科的专业,那么对应的英文paper常常会出现三四行一句的长难句。遇到这种情况时,我一般会手动将长难句化解为几个简单的短句,然后结合上下文分别阅读。虽然cs领域的论文鲜有长难句,但目前机器学习和其他领域的交叉十分普遍,因此免不了阅读其他领域的论文,故而必须适应阅读这类复杂句式的能力。
整体而言,个人认为六级550+或托福100+是量化的必要水平(废话,国外研究生申请很多是这个bar)。在此之上,还需要大量阅读本领域的文章,从而内化paper的写作风格、积累专业表达。这样在阅读新Paper时便能快速上手。
注意力分配
初读paper时,我往往恨不得一字一句地都读下去,从abstract到intro到model到experiment,每一个部分都打破沙锅问到底。然而,这是一个十分低效的阅读策略。就个人经验和老师前辈们的指导而言,注意力应该多放在intro上——这一章节具体介绍了paper主要的研究方向、研究问题和解决方法。如果阅读过程中能够快速理解问题的价值和研究贡献,那么就考虑读model和experiment部分。能发出来的paper,模型结构基本七七八八,实验效果都不会差。因此没有必要花太多时间在研究模型和实验细节部分。对于个人而言,这两部分的阅读主要起到启发灵感的作用——比如模型的设计有无借鉴;实验的组织安排、性能评测指标能否参考使用等。如某友所言,写paper不是写技术文档,更不是写实验报告。创新永远是第一位的,而这一点一定会在intro中展示。
总结而言,读paper的注意力分配策略实质上是一个自顶向下的层次化(hierarchical)方法。第一层,快速阅读abstract和intro,了解研究问题和创新点。第二层,根据第一层的阅读结果动态选择继续细读或快速浏览或放弃。这一自顶向下、自粗向细的方法能极大提升阅读效率,并将注意力放在与自己研究内容相关的paper上。
带着问题去读
需要明白的是,任何一项研究工作,都需要一个动机(motivation)——每一篇paper都为解决某些专业问题而写成。而paper的创新点,则构成了解决问题的方法。不仅写paper是问题导向的,读paper也是问题导向的。如果不带着问题去读,往往会有头无尾,晕头转向——为什么这里要用LSTM而不是FC?为什么要使用强理论假设?相反,带着问题去读,逻辑便能和作者的思维贯通,也有助于读者达成自己的阅读目的(如研究paper是怎么解决问题的,从而启发灵感)。
在读写论文的问题上,我曾和一位在国际学校学习过的好友聊过——他的课程中包含大量科技写作的训练。友人建议用”5W”法阅读和写作。这里进一步参考百度百科,总结5W2H法的问题提出方法:
5W2H
- WHAT——是什么?目的是什么?做什么工作?
- WHY——为什么要做?可不可以不做?有没有替代方案?
- WHO——谁?由谁来做?
- WHEN——何时?什么时间做?什么时机最适宜?
- WHERE——何处?在哪里做?
- HOW ——怎么做?如何提高效率?如何实施?方法是什么?
- HOW MUCH——多少?做到什么程度?数量如何?质量水平如何?费用产出如何?
在阅读论文中,可以灵活地使用5W2H法提出和跟踪问题。带着问题去读,能帮助理清paper的逻辑和创新点,达到事半功倍的阅读效果。
最后,这里推荐一篇范文——《一种加辣椒的番茄炒蛋》,可以从作者的角度了解一篇paper的逻辑是如何组织的。