如何搭建知识库
2022-5-8
| 2023-9-18
0  |  0 分钟
type
status
date
slug
summary
tags
category
icon
password
platform

如何搭建知识库

本来我想把文章的标题取为「如何从零到一搭建知识库」,但仔细一想,知识库从来都不是从零开始搭建的。
因为想要搭建知识库的人,必然脑中有知识,手中有笔记。这篇文章也是为这样的人准备的,希望能够为你搭建知识库,发挥自己的作用提供一定启发。

一、为什么要搭建知识库?

大脑的强项是思考,而不是记忆。

大脑的注意力和记忆力都非常有限。根据艾宾浩斯曲线的理论,刚学习的知识,在1 天后,66.3%将被遗忘,只有 33.7% 被记住。
notion image
从演化论的视角看,人类的大脑从来都不是为了今天的信息时代而生的。
根据IDC2017年的《数据时代2025》白皮书,到2019年全球的网民数量将达到40亿,其中中国有不到9亿的中国网民。且根据这家机构做的测算,他们估计到2019年,互联网上的信息量将达到40个ZB(1ZB=10^12GB,1GB=2^10bit)。
也就是说,理论上每个网民可以平均分配到1ZB的形成。而实际上,人终其一生在互联网上涉猎信息,其中只有不超过几十个TB的数据量是有用。
所以在信息爆炸的时代,大脑的记忆力早就不够用了,我们需要一个工具来辅助大脑记忆。知识库就是大脑的辅助工具,知识库只负责存储和记录,让大脑可以专注于思考和理解。

知识库是大脑的辅助工具

同样是存储和记录,也许有些人会问,现在搜索引擎这么发达,想要的知道的东西搜一下就有,为什么还要建一个自己的知识库呢?
因为在搜索引擎中搜索到的,只是信息,而不是知识。知识是阅读信息后,经过思考和理解的产物。搜索引擎里搜索到的信息,你依旧需要进行阅读处理,而不能直接使用。
下图描述了从信息到知识的变化过程,信息是零散的点,而知识是经过处理和连接后的产物。
notion image
此外,搜索引擎搜索到的内容,并非为你打造。某种程度上看,知识库是你的第二大脑,我们在知识库里记下的是大脑思考和理解的成果。
在知识库里,过去太长的知识将变得容易追溯,每次读到自己过去的思考,都如同和自己过去的思想对话,思考后,或许又有新的发现。有时会发现自己的进步,修正过去的思想;有时又会惊讶于过去的思考,即便现在也让自己有启发,这种草稿拾遗的感觉很奇妙。

二、了解知识

在开始设计知识库之前,我们先要了解什么是知识,这样才能设计一个存储知识的容器。

01 知识的基本单位

关于知识的基本单位,我比较认同的两种说法。

02 知识的结构

了解完知识的基本单位,进一步地我们要了解知识与知识之间的关系。
回到我们最初的设定上,知识库是大脑的辅助工具,所以我们应该尽量像大脑存储知识的方式一样去构建知识库。所以其实问知识的结构,其实是在问我们的大脑是怎样存储知识的。

长期记忆和短期记忆

记忆可以区分为长期记忆和短期记忆。短期记忆非常有限,人脑最多可以在短期记忆中保存七件左右的事情。短期记忆有两种结局,要么逐渐被遗忘,要么转化为长期记忆。
为了将短期记忆转化为长期记忆,我们有一下一些常见的增强记忆的方式:
① 创造记忆间的关联
和原有的记忆之间创造关联,一个信息与其他信息之间的联系越多,他就越容易被记住。
依赖原有的记忆,可以帮助我们理解新的记忆。例如在只有学习了加法才能够理解乘法,如果上来就直接学习乘法,是要难理解的多的。
环境信息,也可能成为记忆的关联。有时在背过单词后的几天里,在想起这个单词的同时也会想到背这个单词时所处的环境,可能是走到学校教学楼的某一段路程。这种记忆被称为——非自愿记忆:指的是人的大脑在记忆时,会带上很多环境因素,如但是阳光,背景声音等等。
② 简化记忆
将记忆简化,结构化到人脑可以理解的逻辑关系和思维模型中,理解了知识之后才能更好的记忆。
《金字塔原理》中说的人类有且仅有的两种思维方式:归纳和演绎。将知识简化到这两种逻辑关系里,是最好理解的。
《穷查理宝典》中说的思维模型也是如此,例如经济学的供需模型,数学的函数关系等模型,可以帮助我们更好地理解信息
④ 间歇重复
重复也有助于长期记忆的形成,重复有助于增强我们的神经回路,重复知识会让信息变得更熟悉,但更重要的是要理解信息,要能够把知识描述清楚,理解知识后再重复回顾,效果是最好的。

每一次回忆都是重新生成记忆

还有一种观点是:记忆不是直接存储在大脑中的,而是以某种介质。每一次回忆,大脑都会重新编码,生成记忆。这听起来很奇妙,
就会像任何的信息存储在计算机中,都是一长串的0和1一样,每一次在计算机中播放音乐,都需要音乐播放器的帮助。大脑也有自己的存储方式,在调用记忆时也有一样的原理。
尚且相信这种说法,如果从这个论点出发来理解记忆,我们常用的那些增强记忆的方法,似乎也可以得到合理的解释:因为每一次回忆都是重新记忆,所以大脑为了更快地在回忆时找到相关的信息,会将信息尽可能多的和其他信息联系起来。这就好像计算机的数据库,为了加快搜索速度,会建立索引一样。

知识分 网络结构 和 树状结构

因为多个记忆之间存在着联系,知识之间也是如此,想想有若干个知识块,将他们用随机的线条联系在一起,最终形成的是一个网络结构。
notion image
所以在我看来,知识大多数情况下是网络结构的,少部分情况是树状结构的。
  • 网络结构是因为大脑中,信息之间总是存在着联系,各种各样的联系。
  • 树状结构的知识,是需要认为梳理过的,像教科书,像教程,大部分是其他人在学习理解过后,梳理好的结构。如果没有经过梳理,知识本身就是杂乱的,存在的只有知识和知识之间的了联系,是一团网络。只有当在某个领域或主题下的知识量积累到一定程度,知识与知识之间的关系逐渐明朗时,才能梳理成树状结构。
基于此,我们在设计自己的知识库时,要搞清楚,你说拥有的知识是树状结构的,还是网络结构的。
对于大部分人来说,知识是树状结构的
因为大部分人都在学习别人梳理好的知识,我们从接触 K12 教育开始到本科毕业,大部分时间,都是按照着老师或课本的节奏学习知识,所以知识是树状结构的。拿着老师给的提纲和PPT,教科书给的目录循序渐进的学习,是大部分人的学习方式。
很多人的学习在离开学校以后就几乎停滞了,在课程之外,如果你仍有学习的习惯(探索版的学习)。比如在研究生阶段,你要自己不断地读文献,做研究。或者是业余的兴趣爱好者,针对某个领域不断探索和学习。此时你接触到的新知识,很可能是碎片化的,网络结构的。
简单地说,书籍和课程是树状结构的,比较系统,内容完整,学习节奏循序渐进。文献和文章是网络结构的,内容比较碎片化,但实时性更高,需要自己构建网络。
信息爆炸的时代,知识多是碎片化的
也因为上文提到的,如今我们处在一个信息爆炸的时代,大量的信息每天被传到互联网上,还来不及被梳理,所以我们接触的的信息大多是碎片化的。碎片化的信息需要经过链接,才能形成网络结构。

三、搭建知识库

根据上面的信息,我们已经知道了知识的基本单位,是命题+实例。知识存储在大脑中的方式,彼此之间有着若干个联系,最终形成一个网络结构。但有时,经过梳理的知识,会以树状结构的方式存储在大脑中。
基于以上的信息,我们可以开始设计自己的知识库。

01 知识库的结构

既然知识有两种结构,那么知识库应该是怎样的结构呢?
过去流行的知识库分类方法是按照学科分类的方式来存放笔记。我的观点是知识库应该是网络结构的,但我们可以基于网络结构的知识库,整理和表达树状结构的知识。
当然也有很多树状结构是在学习过程中直接记录的,前人已经梳理好了知识的结构,我们可以在前人的结构上继续扩展。

网络结构的笔记——卡片笔记

Zettelkasten 是德国社会学家卢曼使用的一种笔记方法。直接翻译成中文是卡片盒笔记法。方法的概要是将每一个知识做成一个知识卡片,放到卡片盒中。笔记与笔记之间,可以创建联系,或是引用、或是类比。或者用标签将同类的笔记聚类到一起。这个过程和大脑非常相似。
卡片笔记适合用来存储零散的知识点。在读文章、读文献是记录。
notion image

树状结构的笔记——大纲笔记

大纲笔记,顾名思义就是有明确的目录或脉络的笔记,树形结构是经过特定梳理的。 一般产生于阅读书籍或学习课程,这些是其他人梳理好的结构。你也可以自己组织知识之间的关系,梳理成树形结构。
notion image

知识库需不需要按学科、项目、领域分类?

过去流行的知识管理方法里,提倡使用学科分类的方式来给知识库作区分,在使用了这种方式两年后,我觉得的它引导了错误的思考方式,让我们去想笔记存放在哪里?这个思维是错的。
如果按照学科分类,很多笔记并没有明显的学科特点,很多创新都发生在学科和学科之间的交汇处。例如一些分析人类行为的知识,它既有心理学的特质,又有微观经济学的特质,甚至是脑科学的知识,他应该往哪里放呢?
在创建笔记时,我们不应该是这个笔记应该放在那里,而是应该思考这个笔记的内容与原有的笔记之间有怎样的联系。创建关联才有助于理解和记忆。
同样的,你在检索笔记是想的第一个问题,不应该是“这个笔记我放在哪里了?”,因为这个信息和知识本身的关联性不大。别忘了每一次回忆都是重新生成记忆,而如果你耗费了大量的脑力来回忆笔记存放在哪里,而不是回忆笔记本身的内容,将无助于你的记忆。
我们不应该花时间纠结于笔记存放在哪里,而是在创建笔记后,给笔记打上经济学和心理学的标签。
再类比现实世界中的知识库——图书馆,图书馆的存储基本单位是图书,存储的结构是杜威十进制图书分类法。图书馆的分类方法,复杂到本科教育里有一个专门的学科分类来 支撑——档案学。如果按照学科分类的方法去搭建知识库,那么维护的成本会非常高。

02 知识库的功能

知识库是大脑思考的辅助工具。所以我们按照了大脑记忆的方式来搭建知识库的结构。为了帮助大脑更好的思考,知识库应该还有以下的功能:

① 间歇重复

我们将内容记录下来,如果不加以回顾,也容易遗忘。所以知识库应该尽量多地将知识呈现在我们面前。表现为两种方式:
主动重复:当我们需要使用到某个知识时,可以在知识库中检索,查看相关的知识卡片。
例如,这次要写文章时,我在知识库中搜索知识两字,还能看到2年前记录的笔记,再回顾一次,既有利于我写文章,又能增强记忆
notion image
被动重复:将知识按照某种规则编程,定期出现。
我自己是按照每天回顾和随机漫步两种规则,创建了两种视图。一种帮助自己回顾前一段时间学习的知识;一种让自己可以在知识库中随机漫步。
notion image

② 建立连接,产生创新

在知识与知识之间创建关联,上面已经说过了这样有助于记忆。
除此之外,新知识与原有的知识之间创建联系,可能是原有知识的补充论证,也有可能是一个相反的观点或案例,通过案例的补充,可以不断修正我们原有的知识,这也是贝叶斯决策的基本思想——通过后验概率来修正先验概率。
举个我自己的例子,有一个知识卡片是:创业要不要关注竞争对手?
在读《从零到一》时,会发现PayPal的创业过程,始终关注着竞争对手的动态。而在《详谈·左晖》和《零售的哲学》中,则有相似的观点是:不应该过度关注竞争对手,不然容易把结果好坏都归因于竞争对手,归因谬误,迷失自己。
有不同的观点,肯定有更深层次的原因决定了是否要关注竞争对手。目前我想到的是取决于商业竞争中的核心竞争力,PayPal关注竞争对手是因为在那个时代的互联网产品竞争中,功能的更新是最主要的竞争力,所以需要比竞争对手更快地开发出用户需要的功能,并且互联网产品的马太效应极强,一旦形成网络效应,将占有更强的竞争优势。而在零售的竞争中,首先马太效应比较弱,而且真正决定竞争优势的是服务质量,所以企业应该把重点关注放到服务的质量上。
当然这个想法只是目前在只有3个案例的情况下得出的结论,未来通过其他信息的补充,肯定可以不断修正,直到获得更准确的答案。
notion image
除此之外,知识之间的关联还有利于创新的产生。创新发生于知识之间的碰撞,更多地碰撞会产生更多的新知识。所以在外部,能够与更多人讨论,不同的观点碰撞可以促进知识的产生。在内部,通过知识库之间建立更多的联系,也可以加速知识之间的碰撞,产生新的知识。
在具体功能的体现上,创建知识之间的关联。笔记软件里的功能是「双向连接」、「标签」等。当你选择知识库工具时,可以优先选择具有这类功能的笔记软件。
并且记得在每一次添加笔记时,多想想这个知识与原有的知识之间又怎样的关联呢?并创建他们的关联。
notion image

③ 辅助输出

费曼学习法中,核心的观点就是——理解一个知识最简单的方式就是用自己的话把它讲清楚。
只有你能够用自己的话把一个知识讲清楚的时候,才真正算是掌握了他。所以建立知识库,不止是为了记录,更是要为了输出,通过输出来确认自己掌握了知识。
所以知识库应该有助于输出,帮助梳理知识之间的联系。在知识库里,从网络结构的笔记里,梳理出树状结构就是一种表达。像我在写这篇文章时,就是将知识库中很多个知识内容,组合在一起形成的。
思考是网络结构的,而表达是树状的。
网络结构利于思考,树状结构利于表达。思考时我们需要的是逻辑关系、类比、和链接,需要网络结构的笔记。表达时,我们是从网络结构中梳理出知识的关系,并整理成金字塔结构,需要的是树状结构的笔记。
输出时,必要掌握的技能是金字塔原理,用到的工具,有些人习惯用思维导图来梳理思绪,有些人习惯用纸笔,有些人用内容编辑器即可。使用那种工具取决于你,重要的是将不同的知识组织成金字塔结构输出。在输出的过程中如果发现自己在某一块内容的确实,也可以查缺补漏,保证知识的完整性。
金字塔原理的4个基本原则
  • 结论先行
  • 以上统下
  • 归类分组
  • 逻辑递进
金字塔原理的规则
  • 文章中任一层次上的思想必须是对其下一层思想的总结概括
  • 每组中的思想必须属于同一场逻辑范畴
  • 每组中的思想必须按照逻辑顺序组织

03 知识库的流程

学习是一件反人性的事情,持续做一件反人性的事情,并不容易,很多时候会中途放弃。所以我们在设计知识库的时候,也应该保证尽量简单,只有流程尽量简单,才能养成记录和使用知识库的习惯。

① 归于一处

为了在检索时方便,应该尽量将所有的内容放在同一处。所以你的知识库应该只有一个,不要用多个工具来做同一件事。例如今天把笔记记在备忘录里,明天记在纸上,后天记在 Notion 里。这样的记录,不仅无助于记忆,反而让记忆变得更加困难和混乱。

② 借助自动化工具来让流程更简单

在《阅读工作流》中,我将阅读分为了几个步骤,在每个步骤的过程中,一定产生了不同的信息。例如在越多过程中的划线和批注,是笔记的过程产物。
当你有不同的产物存放在不同的工具中,应该借助一些自动化的工具来完成信息的迁移,汇于一处。

04 知识库的激励机制

《游戏改变世界》里讲游戏化设计的4个特点是有明确的目标,规则和良好的反馈系统,并且玩家需自愿参与。
如果从这个角度看的话,知识库正是学习的游戏化设计方案。
知识库要求我们完成某个目标(记录一个知识卡片)时,必要地进行刻意练习,游戏规则明确,就是学习完成后记录笔记。
笔记本身是一种知识的可视化,强化了学习的反馈系统。同时知识具有复利性,你学习到的知识越多,吸收新知识也就越简单,速度也越快。知识的复利效应让我们成功进入大脑和知识库同步成长的双正反馈循环中。

四、总结及笔记工具推荐

这篇文章中知识库的设计思路,就是知识库只是大脑思考的辅助工具。
从这个目的出发,了解了知识库中,存储知识的基本单位是一张张的卡片,也可以理解为是一篇篇的笔记,知识可以分为网络结构和树状结构两种。
并且,我建议在建立知识库时,使用网络结构的笔记,可以帮助我们思考。从网络结构中,可以梳理出树状结构的笔记,这是一个输出的过程。有时我们学习的时前人已经梳理好的树状结构内容,我们可以记录并在前人的树枝上进行扩展。
同时,为了更好地辅助思考,知识库还需要有间歇重复功能来辅助记忆,需要有链接工具来串起知识与知识之间的关系,需要有好的写作工具来辅助输出。
在知识的工作流程上,应该有且只有一处知识库,并且将流程尽量地自动化,只有尽量保持简单才能养成记录笔记的习惯。
最后,知识库只是大脑思考的辅助工具,最重要的思考,还是要有大脑来完成。持续地记录笔记,知识库的作用将会越来越强大,知识之间的网络效应会起作用,知识的复利效应会起作用,思考的价值也会随之放大。

笔记工具推荐

这篇文章在写作过程中,尽量没有提具体的工具。是避免先入为主地陷入某类工具的思维。
工具会影响人的思维习惯。
例如长期使用 word 进行文稿编辑的人,习惯的方式是先写作,再分目录。而习惯使用 Markdown 进行写作的人,则是文章的结构先于内容发生。
再例如习惯使用 Photoshop 的人,习惯将画布拆解成一个一个的图层,所有的处理都基于图层发生。而习惯使用 figma 的人,则是将画面拆分成了画面、矩形、线条几种元素,所有的画面都是由这些元素搭起来的。
在选择知识库时,也要选择符合自己思维的工具。按照本篇文章的要求,我整理出了以下几点
  • 有双向连接和标签功能——用于连接知识
  • 检索方便——好更快地找到知识
  • 可编程——让笔记以某种规则间歇重复
  • 流程简单、自动化——降低使用门槛
可以按照这个思路去找笔记软件,当然选择有很多。
这里我推荐几款市场占有率较高的笔记软件,他们的特点各不相同。
  • Notion:是我正在使用的笔记软件,特点是具有 database 功能,可以实现笔记规则;缺点是内容在线化,国内网络访问较慢,迁移成本高等。
  • Obsidian:可以说是最强大的笔记软件,符合上述的所有需求,有大量的 UGC 插件生态来实现各种功能,但缺点是学习成本很高,有太多值得探索的内容。
  • Roam:第一款让双向链接流行的笔记软件,满足上述的所有需求,缺点是收费是在太高了,适合搞学术的同学。
  • Logseq:这款软件也满足上述的所有需求,他的特点是一切笔记基于大纲结构,而我不太喜欢这样的工具思维,使用的不多,无法评价。
如果你还没有一个知识库工具的话,我的建议是可以试用上述的几款软件,挑选适合你的一款。选择笔记时,应该尽量长远的考虑,因为笔记系统之间的迁移成本非常高,如果使用一段时间后发现现有的工具不满足自己的需求,应该及时提出问题并纠正。
如果你最终选择 Notion 作为笔记软件,可以直接使用我的笔记系统模板,模板的使用方法和设计思路可以阅读本篇文章——《我如何在Notoin中实践Zettelkasten》
如果你过去使用的是类似印象笔记或有道云笔记,那么将知识迁移到新的笔记系统上的成本或许会比较高,网络上有一些现成的迁移方法,你可以了解后评估是否要迁移。
但可以肯定的是,印象笔记过去的那种按照笔记本为本位的模式是已经过时了,也希望这两个平台可以推出新的功能来适应新的时代。目前我们也看到这个过程正在发生,印象笔记正在退出新一代的笔记软件——VERSE,也希望像这样的工具可以帮助印象笔记的用户更好地建立知识库。
以上是文章的全部内容,感谢阅读。
关于知识库的种种问题,个人研究、实践了较长实践,如果你对建立知识库有任何的问题,都欢迎和我讨论。我会给到建立知识库的建议,或者是类似的案例,希望能够对你有启发。
 
notion image
 
自我管理
  • 自我管理
  • 草稿拾遗 026期草稿拾遗025期
    目录