研究者花大量的时间读paper, 但是这个技能却没有好好被教授。。这里提供了一个有效的三步阅读研究行paper的方式。我也会讲一讲如何用这个方法来完成文献调研。

介绍

研究者必须读paper的几个原因:

  • 为了会议
  • 为了课程
  • 为了跟随领域内的现在趋势
  • 或者是为了做一个新领域的文献调研。 一个典型的研究者每年会花上百个小时阅读paper。

有效地阅读一篇paper是十分重要的,但是却很少被教授的技能。因此对于研究生新生,必须要自己通过试验和试错学习。学生浪费大量的精力在这个过程,而且经常会遭受挫折。

我使用“three-pass”方法很多年,来防止我自己在获取到bird’s-eye-view(鸟瞰图,全局视野)之前陷入论文的细节。这让我能够估计我复习一组论文需要的时间。更多的情况下,我能够依据我的需求和我的时间来调整论文评价的深度。这篇论文就描述了这个方法以及他在进行文献调研的时候的使用方法。

Three-pass approach

关键的思想就是,你应该阅读一个paper三次,而不是从头开始细细啃到最后,每一遍达到一个确切的目标,并且基于之前那一次的成果:第一次pass给我们这篇paper的general idea。第二次pass让我们抓住paper的主题内容,但不包括细节。第三次就要深度理解paper。

First pass

第一次是非常快的浏览,以获取到一个bird’s - eye-view。你可以决定是否要继续进行阅读。这一次过完应该可以花5-10min,并且有以下几个步骤:

  1. 仔细阅读title,abstract 以及 introduction
  2. 阅读section以及sub-section heading 但是忽略别的东西
  3. 看一眼数学相关的东西,来确定潜在的理论基础
  4. 阅读结论
  5. 看一眼reference,脑海中思考一下你曾经读过的内容。 在第一次读完之后,应该能够回答下面的5个Cs:
  6. Category: What type of paper is this? A measurement paper? An analysis of an existing system? A description of a research prototype?
  7. Context: Which other papers is it related to? Which theoretical bases were used to analyze the problem?
  8. Correctness: Do the assumptions appear to be valid?
  9. Contributions: What are the paper’s main contributions?
  10. Clarity: Is the paper well written?

使用这个信息来决定是否继续阅读。这可能因为这个paper并不吸引你,也可能因为你对这个领域知道的并不够足够来理解这个paper,或者作者的假设是无效的。对于并非自己专业领域,但是某天可能会有相关的paper来说,第一次阅读就足够了。 BTW,当我们写论文的时候,我们应该想大多数reviewer以及reader可能只会看一遍它。所以要谨慎的选择一致的小节标题并且写简洁且易于理解的摘要。如果一个reviewer不能通过一次pass理解主旨,那么论文很可能会被拒绝;如果一个读者不能在5min之后理解论文的亮点,那么这个论文可能永远不会被阅读。所以一个‘graphical abstract’,图像式的摘要,用一个精心挑选的蹄片来总结paper是一个非常好的idea,并且在科学期刊中越来越常见。

Second pass

第二次看的时候要用心一点,但是依然要忽略像是论证之类的细节。在阅读过程中,记下一些关键点或者做一些批注是很有帮助的。Dominik Grusemann建议记下不理解的term或者想要询问作者的问题。如果你是一个paper的referee,这些批注能够帮助你当你在写评论的时候,并且会在项目委员会的时候有所帮助。

  1. 在第二次的时候,要仔细看图片,示意图以及别的illustrations。特别要注意graph。坐标轴标记对了么。结果的bar是否正确。结论是否有统计意义。一些常见的小错误会将匆忙,劣质(rushed, shoddy)的作品和确实优秀的作品区分开。
  2. 记者要标记出相关的没有阅读过的references来作为未来的鱼肚。这个是一个非常好的方式来了解论文的背景

第二次pass应该花1小时左右。对于经验丰富的人来说。在这次pass之后,应该能够把握paper的主旨。能够总结向别人paper主旨,并且有一定的论据。这个级别的细节,对于你比较感兴趣到那时并不是具体的和你一致的研究方向的论文来说应该已经足够了。

有时候,你在第二次阅读之后都可能不理解一篇论文。这可能是因为这个概念对你来说太新了,有很多不熟悉的terminology和acronyms。也可能是作者使用了你不理解的论据或者试验技术,所以导致paper的大部分对你来说都不可理解。也有可能是论文写的很差,用了未经证实的断言以及大量的前向饮用。也可能是你太累了。你现在可以选择:

  1. 将论文放在一边,祈祷这不会影响你职业生涯的成功
  2. 可以在阅读背景材料之后再来阅读这个论文
  3. 坚持,到第三次pass

Third pass

为了完全理解一个paper,特别是当你是一个reviewer的时候,是需要第三次pass的。第三次pass的关键就是尝试virtually re-implement这个paper。就是说,作出和作者一样的假设,复现工作。通过比较你的复现和作者的paper,就可以很容易的辨别出paper的创新点以及隐藏的失败和假设。

这次pass需要注意细节。我们需要辨别并且挑战每一个陈述中的假设。更多的,我们应该考虑自己要如何提出一个特别的idea。这样讲事实和虚拟进行比较可以带来对证据和paper表述技巧的尖锐官邸那,并且能够将这些添加到自己的技能库中。在这次的pass中,我们能够写下未来工作的想法。

这一次pass对于初学者来说会花很多个小时,对有经验的人来说都可能花一两个小时。在第三次pass的最后,我们应该能够从脑海中将整个论文重构,并找到它的优点和缺点。特别的,我们应该能够指出潜在的假设,漏掉的citation,以及实验或者分析技巧的潜在问题。

文献调研

paper阅读技巧会被放入文献调研的测验中。这会要求你阅读数十篇paper,也可能是不熟悉的领域。那么应该阅读哪些paper呢?这是一些使用three-pass方法的技巧:

  1. 使用像是google scholar或者CiteSeer这样的搜索引擎,并使用一些仔细挑选过的关键词来寻找三到五篇最近的高被引paper。对每个paper都做第一次pass,以得到一些感觉。之后阅读他们的相关工作(related work)小节。你将会发现一个对近期工作非常棒的总结,并且如果足够幸运,可以获得到一个到近期调研paper的链接。如果能够找到这样的一个survey,那么就结束工作了。阅读这个survey,祝自己幸运。

否则,第二步,否则,在第二步中,在参考书目(bibliography)中查找共享引用和重复的作者名称。 这些是领域中的关键论文以及研究者。下载关键论文,并把他们放在一边。之后到关键研究者的主页,看看他们最近发表的文章。这将会帮助你辨别领域的顶级会议,因为最好的研究者通常会在顶会发表。

第三步是到顶会的website,并浏览他们的recent proceedings。快速浏览以辨别最近的高质量的相关工作。这些论文,以及刚才下载后放在一边的论文一起构成调查的第一个version。对这些论文做两次passes。如果他们都引用了一个你之前没有找到的关键论文,那么应该读一读它。必要时,重复进行一遍这个工作。