更新于 

信息收集

在信息收集环节,我们的优化目标是尽可能获取与我们的目标高度相关且质量高的学习材料。这里的“高质量”意味着我们可以在最短的时间内从这些学习材料中提取出最多的有用信息。

值得强调的是,信息质量在整个信息收集过程中具有重要意义。一份清晰易懂、简明扼要、思想深刻的学习材料能够让学习的过程事半功倍。尽管获取高价值信息往往需要投入额外的时间和金钱,但在进入信息处理阶段前,花费一些精力和金钱在信息收集上,以获取优质的学习材料,从而在学习的过程中节省更多的精力,无疑是绝对值得的。

在信息收集的领域中,从信息获取的主动性与被动性角度出发,我们可以将其分为主动收集和被动收集两种方式。

被动收集信息

被动收集信息的主要渠道

在被动信息收集过程中,主要的来源通常是订阅的一些公众号、电子邮件以及网页消息。 对于这些收集渠道,我们应该遵循“少而精 ”的原则,主要有两个方面需要注意:控制信息收集渠道的数量调整对待信息的态度,以及确定几个我们需要关注的核心主题。

首先,控制信息收集渠道的数量至关重要。我们每天可用于被动信息收集的时间非常有限,对我来说可能仅占10-20%。据估计,即使我们不停止学习,我们一生可接收的信息量也只有185GB,我们每天可被动处理的信息就更少。因此,从本质上讲,被动信息收集是有限资源的合理分配。如果我们迁就于无关紧要的信息,不仅会浪费宝贵的时间,还可能错过真正有价值的信息。 因此,我们应该毫不犹豫地取消对垃圾公众号和推送源的订阅,打造自己的高质量专属信息源。

控制信息源只是第一步,更关键的是调整对“信息”的态度。因为时间有限,即使经过筛选,仍可能面临无法处理的信息量,此时就应该果断放弃了。理解并接受,没有哪篇文章是非读不可的。如果错过,只要继续关注该话题,你总会再次遇到。错过的信息,也会在其他渠道以更精炼、准确、生动的形式出现。极端情况下,某个知识点再也不出现,其影响微乎其微。阅读并不紧急,重要性相对较低,所以可以被归类为”不重要且不紧急”的任务。因此,无需因大量的”不重要且不紧急”的信息感到焦虑。没有义务阅读所有文章,即便看似重要且不容错过。在判断和执行优先级时,要果断、坚决,大胆开始,也要有放弃的勇气。

最后,确定一些核心关注主题也是非常重要的。构建高质量专属信息源不仅需要剔除低质量的信息源,我们还需要明确哪些主题是我们想要被动收集的信息。只有这样,我们的信息管理系统才能像磁铁一样吸引与核心主题相关的信息。如果没有提前确定主题,我们就无法构建对“信息管理”的敏感度,那么,这样的信息交流对我们而言可能仅仅是无效的时间消耗。

被动收集信息的其他渠道

另外,除了主要的被动收集方式(如订阅等),还有一些杂碎的收集方式,如与朋友们的闲谈或在游玩过程中的灵感启发。这些杂乱的信息收集方式有时候却能带来意外的收获。因此,我们需要打破局限,把握任何可能的信息收集机会。只要你对信息保持足够的敏感度,任何场景都可能是你发现重要信息的关键时刻。但是,对于这些比较杂的方式收集到的信息,往往是转瞬即逝和比较杂碎的,所以往往需要自己勤动笔记录、总结归纳,直到内化到自己的体系里。

采用“稍后读”避免影响当前任务

需要指出的是,对于被动收集的信息,我们并不必立即处理。对于篇幅较长的高质量文本,我们可能当下没有这么多时间阅读,还有更加重要的事情需要我们处理。这时,我们可以采用“稍后阅读”的方式,保存全文,放入待阅列表,等有时间再仔细阅读。 因此,对于被动收集,我们通常可以先快速扫描摘要和标题,筛选出有价值的信息,较短的信息可以立即阅读,较长的信息则可以放入待阅列表。

被动收集信息对于我的意义

对于我来说,被动收集的方式是我了解专业之外其他领域的主要方式。 我通常在平时留意搜索和整理,把感兴趣的其他领域的信息添加到待阅列表里,然后在每周固定的时间内进行阅读和处理。

主动收集信息

对于科研人员来说,因为需要对一个话题进行深入钻研,主动收集信息应该占据主体地位。 我个人的比例大约是80%-90%。对于主动收集,信息的收集渠道和记录方式各式各样,同时我们还需要特别关注信息的转述程度以及信息压缩比例。接下来,我就将从四个方面分别进行探讨:收集渠道、信息记录方式、信息转述和信息压缩比例。

信息的收集渠道

首先来看信息收集渠道。一般而言,主动信息收集主要依靠四种方式——搜索引擎、朋友及同行交流、个人维护的知识库和GPT-4。

在开始信息收集之前,首先需要明确搜索信息或者提出问题。我们需要对它们进行相对清晰的表述。有了明确的目标,我们就可以利用各种收集渠道去寻找信息。

GPT-4

需要指出,现在有很多辅助GPT程序,例如Sider,它使得GPT和浏览器可以紧密结合,进而使得我们可以,在使用浏览器时只要大脑闪现出问题就可以直接通过它询问GPT,节约了切换网页的成本,提升了我们的效率。

Google浏览器边上自带Sider,随时随地向AI提问
Google浏览器边上自带Sider,随时随地向AI提问

对于GPT-4,少数派上还有一份比较好的指南,有需要的读者可以参考。

搜索引擎

对于搜索引擎的高级语法,少数派和CSDIY上各有一份比较好的指南,有需要的读者可以参考。

自己维护的知识库

我自己是利用DevonThink软件管理和维护我过去学习过的知识(DevonThink是一款资料库管理软件,我将在“信息管理”这个部分详细介绍它)。它支持全文搜索和高级搜索语法。总的来说,从个人知识库中提取信息的效率主要和三个因素相关:数据库管理、知识学习和理解程度、记忆程度。当我们对自身的资料库进行检索时,实际上是利用我们的直觉和灵感,依赖于过去的知识进行知识定位。

另外,DevonThink其实也有属于自己的高级搜索语法,有需要的读者可以参考。

有时,我们的知识库不仅维护知识,也保存了很多能快速找到优质学习材料的信息。 例如,CS自学指南和很多编程教程网站,都是查找优质计算机课程资源的好工具;中国科大的基础数学修课指南,是了解基础数学学科体系和自学的优质材料;然而,至今为止,我还没发现任何和科研相关的自学指南,这可能是因为每个学科、每个方向的科研都有所不同,需要具体问题具体分析,但我自己总结了一份《科研的必要知识》供有需要的人参考。

朋友、同行、课题组、导师交流

一般来说,如果有机会,我们应当多和他人交流。当我们寻找学习材料时,我强烈建议首先咨询专业人士,他们对专业领域有更多的阅历和更深刻的理解,因此,他们的眼光往往远胜我们这些初学者。他们的推荐的好的学习资料往往可以让我们学习的过程事半功倍。

如果是解决某个具体问题,通常在初步使用前三种搜索方法并自我尝试和思考一段时间后若仍无结果,此时可以考虑寻求他人的帮助。我们可以通过向他人求助处快速解决问题、获取新的观点和知识。在明确需要查找的信息或提出问题的基础上,剩下的就取决于你的情商和你寻求帮助的人了。

信息的记载方式

在信息的记载方式上,我们主要接触到的有文字(如书籍、论文、官方文档、源代码、个人博客、网页论坛、推送文章)、面对面交流(如朋友、同行、课题组、与导师间的交流)以及视频(如课程和报告)。 这些不同的信息记录形式各自有着不同的优势。

面对面交流

面对面交流的优势在于信息的传递方式多样化,包括文字、音频和图像等。此外,面对面交流通常更注重问题导向,可以针对特定问题给出精准的答案,是一种非常高效的沟通方式。

文字类学习材料

文字记录的信息是我们接触的最广泛的信息源。然而,随着互联网的普及,文章发布、书籍出版的门槛不断降低,以文字形式记录的信息质量良莠不齐。总体来看,出版物(如书籍、论文)的平均质量相对较高,但随着出版书籍门槛的降低,出版物的质量也不一定能得到保证。尽管如此,对于每个领域或学科,都会有一些公认的权威教科书或重要文章,它们的质量通常较高。其次,官方文档和源代码也是重要的信息源,而个人博客、网页论坛和推送文章则在其后。需要指出的是,上面罗列的只是平均而言的顺序,即便在最后一类中,也有很多优质的文章。找到优质的文字信息源的有效方法通常是先找专业人士推荐,然后再用搜索引擎等工具自行搜索。

需要强调的是,以文字为媒介记录的信息并不都适合初学者学习。由于文字记载形式的限制,信息的叙述顺序通常是线性的,导致许多专业书籍和官方文档往往信息丰富,但内容复杂繁杂,为了清晰严谨地解释一个概念,可能需要大量的细节和描述,这导致初学者难以提炼出核心思想和逻辑关系,学习效率较低。这类书籍更适合作为工具书使用,而不适合作为学习资料。相反,那些内容精炼、仅涉及一个领域核心内容、循序渐进的教育类书籍更适合初学者。

视频类学习材料

视频类学习材料主要分为课程和报告两种。视频的优点在于学习过程相对轻松,老师通常会在讲之前有所准备,因而会采用相对高效的讲述方法,这使得通过观看视频理解新知识往往比自己阅读书籍更快。

对于学术报告而言,它通常专注于一个专题,深入探讨采用某种方法解决问题的过程,并主要展示一到两点主要成果。它不会过多关注细枝末节。 大多数情况下,学术报告主要目标是向“小同行”解释清楚你的方法和创新之处,让他们理解你的研究内容,听明白巧妙的地方。对于“大同行”,目标是让他们能够理解你的工作的大概内容,听个热闹。一个优秀的学术报告应该具有明显的层次感。

一个好的学术报告,往往能够让我在半个小时到一个小时的时间内迅速获得一个领域的概览、了解到论文中的核心窍门,这为后续阅读论文提供了很好的铺垫。

对于课程而言,它则要求教师确保所有学生都能理解和掌握所讲授的内容。课程同样需要有层次感,需要确保每个层次的学生都能从中学到东西。 对于理解能力强的学生,教师可以提供一些深层次的思考,撂一句话在那里,让他自己去琢磨,挑战他们的理解和思考能力;对于理解能力稍弱的学生,教师需要确保他们能理解和掌握主要的思想和概念。讲课需要教师有激情,并能够把复杂的思想和概念传达给学生。

教学水平高的老师,他们上课富有激情,课堂生动而有活力。他们能够在上课的时候就叙述清楚知识框架(不同知识之间的链接,有时不止一次)和每个知识背后的灵感和解决问题的方法,让我们可以获得知识点的概览。这样的老师会把重要的东西反复强调,让你印象更加深刻。做得最突出的老师,甚至在课程的最开始会预告大家这堂课会做些什么;在课程讲到那块内容的时候,又会做一个印证;而一堂课快要结束的时候,还会带着大家回顾一遍这堂课的整个历程。有些时候他们还会为未来的学习提供指导,将所学的知识向实际应用、其他学过的知识点和其他有趣的现象扩展。这会让我们再去阅读学习材料的时候,阅读的压力已经大大降低——我们已经知道了思想,只需要慢慢理清楚每一个细节,从而事半功倍。与此同时,这样的课堂是非常能激发学习兴趣的。一方面,因为教员就是这个领域的研究者,因此,他们往往能将整个课程的逻辑和安排看得更加清楚、更加透彻,因此他们选择的讲课方式自然也更有条理,更容易被学生接受;另一方面,教员们上课分享的例子,上课提出的问题,很有可能也就是激发他们研究兴趣的地方、他们所好奇的地方,这些例子和问题能激发他们的研究兴趣,自然往往也能激发学生的学习兴趣。

就我个人而言,如果能够找到比较好的课程视频或者学术报告,我会倾向于先看视频后看书或者论文,互相配合着一起共同消化,课程或者报告上讲的但是学习材料上没有的内容作为补充,相当于学习了两遍,效果会更好。

信息的转述

当作者挥舞他们的笔在文章中记录思想时,他们的理解必然会渗入到内容之中,这我们称之为“转述”。在理工科领域,我个人认为这种转述至关重要且有其独特价值,尤其是名家的转述(譬如,你有想过从朗道的十卷巨作中汲取智慧吗?)。这种转述内含了作者对原始知识的转化——基于某种逻辑的整理(如流程图、思维导图等)或个人的理解(对源知识的抽象、类比、或与其他知识点的联系)。这些转化能够帮助我们更迅速地掌握并巩固知识的核心部分,就像我们在初高中时使用的辅导书那样。

很多时候,通过学习专家的解读、行家的分享,或者从大牛那里获取书本的精华,这种方式比我们自己逐字逐句地阅读原文可能会产生更好的效果。 在我与周围朋友的交流中,我们都有类似的感受:自己看过的书,再听行家解读后,才发现那些最精华的部分自己竟然未曾注意到。幸好听到了解读,否则我们还会自以为是,毫无知觉地错过这些精华。

必须指出,学习过程中与他人的交流是非常重要的,转述的信息也起到了与其他作者交流的作用,使我们能够吸收百家之长。

所以,当我们学习一个知识点时,先尽量选择质量更高的信息源,同时也可以考虑多个信息源,以使我们的理解更加全面和准确。

信息的压缩比例

信息在转述的过程中往往也伴随着压缩。先解释下压缩比例的意思,举一个极端的例子,托尔斯泰的《战争与和平》一共 100 多万字,拍成电影可以用 120 分钟讲完,一篇概要可以用 1000 字概括,甚至一句话也能来总结。

任何信息都可能存在完全不同的压缩比例。在当今时代,许多领域的知识产生速度已经超过了我们按照传统方式缓慢整合和吸收的能力。从另一个角度来看,大多数信息,我们无需在其原始形态下获取,比如如何写一个幽默的段子、如何避免尴尬的对话、如何像程序员一样思考,真的有必要去购买一本《论戏剧》、阅读300多页的《语言逻辑学》、或者从零开始学习一门编程语言吗?

尽管这些都是可行的方式,但完全没有必要,因为这些并非我们的核心领域。对于非核心领域的信息,我们无需走完整的信息压缩和解压过程,更高效的方式是直接享用经过整理和演绎的知识成果。

所以,我们得劝自己接受,甚至适度追求相当一部分内容是被压缩的,而且是高比例压缩的。在权衡投入与产出的基础上,接受一定程度的信息损耗是必要且明智的。

使用工具辅助我们进行信息收集

为什么要使用工具?

在远古时代,人们因为缺乏记录信息的工具,只能依赖大脑来记忆和处理信息。那时,生产效率低下,文明进步的步伐也相对缓慢。纸和笔的出现极大地提升了各领域的生产力,人类终于可以有效地记录下有用的经验和知识。如今,计算机的出现带来了新一轮的生产力工具的革命。现在,我们拥有许多能够方便我们学习过程并提高我们学习效率的软件和工具。

其实,纵观人类文明史,其实就是工具的发展史。新的工具在提高里生产力,带来了新的就业岗位,同时也对身处新时代的人提出了新的要求。例如,ChatGPT的出现,恐怕就意味着,在未来能够给出好用的引导词让AI给出更优质的回答将成为十分重要的一种能力。随着时代的变更,如果不掌握新兴的具有更高效率的工具,很有可能就意味着被时代淘汰。

不要陷入过度优化陷阱

然而,随着软件数量的增多,许多软件的功能过于冗余,这可能导致我们陷入优化效率的陷阱,使我们难以确定自己真正需要什么,反而可能降低我们的效率。 我曾见过许多作者,他们过分专注于软件的使用,我认为这是一种不值得的行为。

我们需要考虑的是如何将这些工具整合起来,形成一个对自己来说完整且高效的学习框架。首先,我们必须明确自己的需求。我们的目标是要掌控工具,让工具更好地为我们服务,而不是变成工具的奴隶。我们不应低估工具的价值,但同时,我们也必须明白,工具本身并不能创造价值。

为了有效地管理和组织你的知识,最佳的策略是进行有意识的探索,建立一个个人化的系统,并尽量减少优化它的尝试。这意味着将更多的注意力放在信息本身,而非工具上。 除非真正出现了革命性的工具,否则过分依赖工具可能会导致拖延,并浪费你的时间和精力。总的来说,应更专注于实际工作和生产,而不是过度关注信息组织和优化。

在这个信息泛滥的时代,学会对生活做减法至关重要。要理解,所有优秀事物的背后都有其代价。管理的成本存在,而我们的目标是最大程度地降低这个成本。努力简化生活,提升效率和专注力是我们的追求。在使用工具的过程中,这意味着我们需要在最大程度地提升工具价值的同时,最小化其使用成本。 这一原则贯穿于我们处理所有信息流的过程中,包括使用工具、管理数据库以及收集信息。唯有如此,我们才能在享受工具带来的便利的同时,将精力最大程度地集中在那些需要我们动脑的信息处理任务上。

我们的工具箱需要满足什么?

对于那些我们不常用的工具,数量当然是越多越好,我们需要它们来满足我们全面的需求。但是,对于那些我们每周都会用到的工具,我们需要确保它们是精简的,快速的,且易于使用。

我们需要将自己打造成一个高效的系统。首先,我们需要使用尽可能少的软件和工具来构建我们的工作流程。特别是对于那些工作流程的核心部分,我们称它为“核心工作流”。对于这部分软件,需要确保它们既精简又快速。

对于计算机的语言来说,其实就是,只有RISC(精简指令集计算)和CISC(复杂指令集计算)结合的方式,才能实现高效的工作。也就是说,我们需要在使用较少指令集的数量与达成目标的步骤之间找到一个平衡,以避免我们的注意力被分散。

如何找到适合自己的核心工作流软件?

为了找到符合我们需求的核心工作流软件,我们可以采取以下步骤:

第一步,确定你的需求。在寻找软件时,首先要了解各种不同类型的软件和它们的功能,然后思考你需要什么样的功能。 这里你只需要考虑你每周和每天都会用到的功能。你可以先下载功能最全的软件试用几周,这样你就可以明白你最需要什么样的功能。

第二步,确定需求后,寻找能以最小的代价(如一键操作、优化最佳)满足你需求的软件。你可以通过查阅软件评测或者亲自试用来找到这款软件。

第三步,因为你选择的软件可能和你以前使用的不同,所以你可能需要重新学习一下。在开始使用新的软件时,你需要先系统地了解这个软件,包括它的所有功能。然后,你需要挑选出对你最有用的功能(这个时候可以稍微扩大选择的范围),并用这些功能构建一个高效的工作流程。在使用一段时间后,你可以找出哪些功能其实并不需要,然后剔除掉。你只需要保留那些对你最有用、使用频率最高的功能。对于那些你可能永远都不会用到的功能,不用去在意它们,因为它们只会增加你的使用成本。

用这种方法找到的核心工作流软件,应该能够满足高效和精简两个需求。

必须指出,要充分发挥软件的价值,系统地了解软件是非常重要的。 因为你可能并不知道软件的某些功能,而这些功能有可能对你非常有用。如果你因为不知道而错过了这些功能,可能会给你带来一些损失。因此,你需要在开始使用软件时,尽可能低的成本了解它的所有功能。

对于那些非核心工作流的辅助软件,我的建议是,不要在开始就系统地学习它们。你可以按需下载和学习,这样可以节省你的精力。 对于那些非核心工作流的软件,一般选择评分高的就可以了,不需要像选择核心工作流软件那样麻烦。

在形成完整的核心工作流之后,除非真的有相关的需求,否则不要轻易改变它。因为一方面改变核心工作流会浪费时间,一旦打破,重新构建一个核心工作流程是非常麻烦的。另一方面,即使增加了新的功能,也不一定能提高你的工作效率,因为你的需求基本上是固定的。而且,核心工作流的改进通常是比较慢的,需要理念的变革。通过以上的方法选择的工具,通常已经非常完善了。 除非有革命性的技术出现(例如AI搜索),否则不太可能有大的改进空间。

软件和工具使用总则

另外,我还制定了如下的软件和工具使用原则辅助管理:

  1. 有在遇到需求时才去下载软件,不要无端制造需求,也不要主动去寻找新的软件。 思考你需要它的场景和使用频率。大多数工具的增值功能实际上很少被用到,我们大多数情况下并不需要使用一个软件的所有功能;对于一些偶尔使用的功能,有无其实并不影响我们的日常工作。我们真正需要关注的是我们经常使用的核心功能是否强大。软件商和很多博主可能会制造需求,诱导你下载和使用一些实际上并不必要的软件,而学习这些软件本身就是一种成本。

  2. 一开始你可以尝试了解和使用一些不同的软件。当你经过尝试后选择了最适合自己的软件,那么你就应该深入理解这个软件的功能,并且专注于使用这个软件,进一步熟悉你的工作流,使自己更加精通。然而,你也需要时常问自己,你真正需要的核心功能是什么。先学习对你真正有用的功能,剩下的等到用到时再去掌握。

  3. 对于核心工作流,每一类软件,最多保留两个(只有在一个软件存在明显缺陷的情况下),在80%的情况下,只保留一个就足够了。过多的工具只会分散你的注意力。工具和资料的价值不在于多,而在于精。

  4. 确认一个软件的好处大于坏处后再进行长期使用。不要仅看到软件的优点和好处就决定下载,你还需要看到它的成本和潜在缺陷。

  5. 软件终究只是工具,只能起到辅助的作用。你的大脑应当是信息处理和加工的主场。

  6. 如果一个软件在半年或更长时间内都没有被使用,那么可以考虑将其卸载。

信息收集的工具

关于学习体系,我找到了一套配套的软件工具,它们分别涵盖信息收集、信息处理、信息管理以及整体的学习流程管理,构成了我自己的“核心工作流”。接下来,我将介绍信息收集部分的核心工作流。

  • 网页浏览:我主要使用Chrome浏览器,偶尔也使用Safari。Chrome的插件系统非常便利,有很多很好用的功能。例如,其中有一个插件就能轻松地爬取网页资源。对于视频的下载,我通常会转向Google的Downie,它可以顺便一起把字幕也下载下来。
  • 通用搜索引擎选择:Google是我的首选搜索引擎,我通常不使用百度,不仅是因为百度的检索结果堪忧,也因为百度热榜会分散我的注意力。如果需要进行中文区搜索,可以考虑使用百度。
  • 特定目标的搜索引擎:
    • Bilibili:获取生活和课程视频、报告视频、科普视频、工具使用教程等。
    • YouTube:内容与Bilibili类似,但英文资源更丰富。
    • 知乎:解答生活和学习中遇到的问题,了解人生体验。
    • 维基百科:理解学术名词。
  • 收藏的知识来源:浏览器书签栏,可以通过HapiGo进行搜索;我维护的知识库可以通过DevonThink进行搜索。
  • GPT-4:用AI来帮助你解答问题。
  • 订阅的知识来源(精而简):使用DevonThink,它支持RSS订阅。

用于捕获各种信息的工具

现在,我们来介绍我是通过哪些工具来捕获不同种类的信息的。

  • 图片和视频:可以通过Chrome浏览器的插件进行下载。
  • 网页:直接抓取网页的HTML格式并进行存档,有两种可以选择的方式。第一种是使用简悦及其同步助手,它可以爬取网页HTML,如果需要,还可以在DevonThink中直接将其转换为PDF;第二种就是用DevonThink直接保存书签。
  • 电子书:使用Calibre电子书管理器,可以将电子书格式转换为PDF。
  • 网页上的多媒体信息:使用Downie下载,也可以直接记笔记,或者在DevonThink中保存书签。通过Google浏览器的插件也能直接下载。但Downie提供的下载选项更多,还可以顺带下载字幕。
  • 听课和同行交流、导师指导:手写笔记或者电脑markdown笔记。手写笔记使用Notability捕捉录音,并通过iCloud直接同步到电脑上。Notability可以录音,录音也可以进行导出。另外,Notability也可以用作草稿本。markdown笔记一般使用Obsidian。
  • 代码:VSCode。
  • 论文、书本等PDF文件:用PDF Expert查阅。如需全文搜索,可以使用DevonThink直接进行OCR。
  • PPT、Word、Excel文件:可以直接在DevonThink内打开并复制文字。如要编辑,这时用Microsoft全家桶;如有需要,可以在DevonThink内部将其转换为PDF。
  • 个人的奇思妙想:使用Agenda进行记录。

以上涵盖了我会接触到的几乎所有类型的信息源,并且我都有相应的工具来完美地捕捉这些信息源的信息。


There is only one true heroism in the world: to see the world as it is, and to love it.
世界上只有一种真正的英雄主义,那就是在认清生活的真相后依然热爱生活。

京ICP备2023000976号-1