不要去规定世界该是什么样子 | 图式(Schema)

发布时间:2018-08-02 7评论 6756阅读
文章封面
文:Lachel
来源:L先生说(lxianshengmiao)


最近读到一篇十分有意思的论文。


先看看下面这张图:



这是一个任务,要求进入这个游戏的下一关。看上去很简单,对不对?哪怕从不玩游戏的人,看到这个画面,也能猜测出要做什么:


控制画面中间的人,避开右边那只看起来很凶恶的紫色怪兽,跳到右边的台子上,爬上梯子,到右上角拿钥匙,再打开左上角的大门。


这一切都顺理成章,没有任何问题。


实际也是如此。在实验中,参与者们平均花了 1.8 分钟,就解开了这个问题。


原因看起来很简单。我们无需任何说明,也能知道:


台子能够站人,台子之间的空隙掉下去会死,梯子是用来往上(或者往下)爬的,大门需要钥匙才能打开,那只紫色的小家伙看上去不好惹,我们得避开它。


但是,且慢,你能够想象,这一切在电脑眼中,是什么样的状态吗?


不妨思考一下。




这个实验团队,给出了他们的答案。


请看下面的图:



你一定会问「这是什么鬼?!」—— 但是,在电脑(AI)眼中,这个简单至极的游戏,就是这个样子。


为什么呢?


我们之所以会知道「要跳到台子上」,是因为我们知道:


黑色的是背景,白色的横条是承载物;


踏上横条之间的空隙会掉下去,因为有重力作用;


竖直的、白色的、一级一级的东西是梯子,因为它跟我们生活中的梯子长得很像。


我们事先知道:梯子长什么样子,这个世界存在重力作用,等等。


这就是「语义」


我们所认知的世界,并不是它原本的样子,而是被我们赋予了「语义」,被我们重新构筑在心灵中的「认知世界」。从认知心理学上说,这个功能,就叫做「先验知识」,也称为「图式」(Schema)


但是这很不公平,因为电脑是不具备这些「先验知识」的。所以,在电脑眼中,台子,背景,梯子,都是一些杂乱无章的色块,只是它们之间颜色和对比度不同而已。


这就是这个团队的目的:


如果我们对世界的认知,失去了「先验知识」,会变成什么样子?


放到数字上,就是这么一个结果:解开问题的时间,从 1.8 分钟增加到了 4.7 分钟。


不仅如此,这个团队还丧心病狂地做了各种版本:



解释一下:


a:原始游戏;

b:把物体抽象成了色块;

c:把物体的「语义」反向,比如梯子变成了火柱,紫色怪物变成了金币,门变成了怪物(但它们的功能保持不变),让我们反抗「先验知识」;

d:混淆物体特征。把物体和周围的环境都变成色块,让你不知道物体是什么、在哪里。

e:混淆场景。把场景变成色块。

f:混淆场景和平台。让你不知道哪里可以立足。

g:改变梯子的交互。按「上」不能往上爬,必须按「上上下下左右左右BA」(后半句是开玩笑)。

h:游戏画面逆时针转90度,将重力的方向变成左右。


当然,这些版本都是没有说明的,纯靠参与者自己摸索。


相对应的,下图是这8个版本,参与者们解开问题(通关)所消耗的时间、死亡次数和状态数量:


(h的图放在下面,就不单独截了)


这篇论文是由加州大学伯克利分校的一个团队,发布在 ICLR 2018 会议上的。虽然评分不高(5.3,因为没啥技术含量),但我觉得很有意思:它向我们展示了「先验知识」是什么,以及如何影响我们对世界的认知。


其实,读这篇论文时,我也运用了「先验知识」—— 先读摘要和介绍,因为我知道它们会告诉我主要内容。然后下拉看图,看到8张界面截图加注解,再看到下面的时间对比,我就立即知道:他们做了8个版本,来分别检验参与者所花费的时间。


包括你阅读这篇文章时,也无时无刻不在利用先验知识。


你能想象一个「没有先验知识」的世界吗?回想一下我们的童年,接触到陌生物体(收音机、玩具车、电脑……)时,那种激动、困惑和无从下手 —— 你希望一直如此吗?


很有意思,但是也会令我们寸步难行。



回到我们对世界的认知。


我们是如何认识周围的物体,如何识别和理解它们的?


这么一个简单的问题,却是认知心理学研究了很久的主题。有两种完全相反的观点。


第一种认为:我们是先分辨出一个物体的各种属性,比如形状、材质、特征……再把它们组合起来,构建成一个整体,找到它跟我们心灵中所对应的「形象」,去揣摩它的定义和功能。


但这种说法明显并不完全。举个例子:无论在多么嘈杂的环境中,你总能一下子听到别人在叫你的名字。如果采用这种说法,就解释不通。因为你的名字的波形并不特别,振幅不大、音调也不高,它是如何突破我们感受器的过滤,进入意识系统的呢?


所以就有了第二种说法:


我们是先通过情景和自己的经验,判断「可能会有什么东西?它可能是什么功能?」先在心里勾勒出一个大概的模型,再把物体「套」进去。


第一种说法,叫做自下而上的认知模式。第二种说法,则叫做自上而下。


当然,现在的研究成果是:我们的认知过程不是单一的,会交错组合、运用这两种认知模式。


自上而下的认知模式,大多数情况下,能够提高我们解决问题的效率。


举个简单的例子。如果找不到钥匙,我们一般会怎么做呢?到「最可能」的地方去找 —— 比如衣服口袋里,抽屉底层,等等。


这种根据经验法则而行动的做法,就称为「启发式」,它就是一种最典型的自上而下的加工过程。


而相对的,另一种模式是什么呢?到家里每一个房间、每一个位置,逐一地进行查找,找完一处再去下一处。


这种方法就叫做「算法式」。它能确保100%找到钥匙,但很多时候,它的效率不如启发式高。


要注意的是:算法式并不属于简单的自上而下,而是一种复杂的、糅合了自下而上和自上而下的加工。


再举一个例子,我们的情绪,其实也是一种「启发式」。


当我们遇到一个场景时,比如「有人在前面械斗」,杏仁核会立刻行动。它会将这个场景跟记忆中的情绪场景做对比,如果确认它跟某种危险、威胁联系在一起的话,就会立刻向大脑传递消息,让我们分泌肾上腺素,进入「战或逃」反应,立即避开危险。


所以,之前有同学问过「能不能切除杏仁核?」不要有这种奇怪的想法。历史上,确实有一位女性患者切除过杏仁核,结果是什么呢?她对一切威胁都无动于衷。面对前方的械斗,她没有任何反应,就像在家里一样,泰然自若地走过去。


同样,启发式另一种最活跃的应用是在哪里呢?阅读的时候。


无论什么文体、什么语言,结构,逻辑,行文,都具备一定的法则,按照这套法则去识别和理解信息,就能大大降低我们的成本,提高对信息的阅读和接收效率。


比起市面上广为流传的「快速眼动法」,这才是更科学的阅读法。



但是,启发式是不是一定都是好的呢?也不是。


同样讲阅读。我们在阅读时,最常犯的一个错误,就是用我们的思维,去「套」作者。


我们常常是先有了自己的一个观点,再去把作者的内容生搬硬套「放进来」。能放得进,就高呼「写得好」「说出了心里话」,放不进来,要么就直接关掉,要么就留一句「呵呵,胡扯」。


这就是一种「启发式」。


当我们看到一个标题、一个选题时,内心往往已经有了某种立场。我们接下去的阅读,很多时候,只是为了证明这个立场,以及观察「作者跟我是不是一路人?」


在这个过程中,能够真正去思考,找出逻辑,去寻求「合」,将各种信息融为一炉、纳入知识体系的,有多少呢?


所以,我一直说:大多数人阅读,只是在寻求认同。这种现象发展到极致,就是站队。


我不管你写什么内容,不管你引用什么数据,不管你举出什么论据,我只看你是为谁说话,批判什么,支持什么。


所以,前十年什么写法能火呢?「都是体制的错。」现在呢?「都是资本家的错。」


这是没有任何意义的。这样下去,只会让舆论成为群体的狂欢。


为什么「女权」会成为一个略带负面色彩的词语?就是因为,太多人藉「女权」之名,去抒发自己的观点和立场(俗话叫做「夹带私货」),甚至是借此攫取道德利益 —— 他们把这些统统称为「女权」。


但在这些人中,具备思辨能力、真正在为女权奔走呼号的,发出的声音又太小,很难被大众听到。


前阵子看过一个视频。一位英国电视主持人,采访一位心理学家,两个人就「女权」进行对话。主持人一直在抛出一些头脑简单的问题。比如:


「这不是男性欺压女性的证据吗?」

「你不觉得女性正在受到歧视吗?」

「这不是一种物化女性的行为吗?」

  ……


还好对面的心理学家能言善辩,虽然逻辑上不够严谨,存在不少问题,但还是将这些问题一一化解。(这位心理学家叫做Jordan Peterson,感兴趣的同学可以搜搜这个视频)


当我们对这个世界建立了一个认知,我们就会下意识地,把符合这个认知的信息放进去,支撑它。而把其他的信息,解释(读作歪曲)成符合它的样子。


「如果我看到的东西不符合我的认知,那一定是他们错了。」


这是一件很可怕的事情。你正在试图规定,世界必须是什么样子。



说回阅读。


偶尔会有同学对我说:L先生,读了您的很多文章,发现一个问题:您的观点总是很一致,就是那么几个观点。


每每听到这样的话,我总有点啼笑皆非。


我对他说:你想一下,一个人的三观基本是稳定的,那他的观点必然也是稳定的,只会有一些小波动,不会常常改变。


如果我今天写「从来就没什么自律,只有内在的驱动力」,明天就告诉你「要自律,高度自律才能带来自由」;


今天写「碎片化阅读正在摧毁我们」,明天鼓吹「要多阅读碎片信息」—— 你不会觉得我很分裂吗?


我以后写的东西,你还敢相信吗?


这就是很多人的弊病:一篇文章读下来,问你记住了什么,回答:作者的观点是xxxx。


这样是没有任何意义的。


如果只在意观点的话,那大家还写文章干嘛,不如这样:所有公众号每天就发一句话:针对某某主题,我的观点是xxxx。


然后我们来统计,看是支持正方的多,还是支持反方的多。


这样多简洁方便啊。


我们之所以会如此重视「观点」,其实本质还是一样的:我们急于去知道「你是什么立场」,是跟我站在一起呢,还是相反。


说白了,还是在寻求认同:


我们始终在以「自己」为核心,对其他信息进行「评判」,以自己为主体去「期望」和看待事物。


很少有人能真的这样去思考:我不支持你的观点,但我认为你说得有道理。


或者:你的观点很平常,但你的思考非常有意思。


所以,我读书、读文章,接收信息,从来不会在意「观点」。我更在意的是,你是如何得出这个观点的?是人云亦云,还是有你自己的一整套思维逻辑?


这就是我极少看公众号的原因:大多数公众号,去除了观点,基本就不剩什么了。他们所做的,只是在迎合粉丝的期望,讨好他们的粉丝。


更重要的是什么呢?你如何去讲观点,你站在什么角度、用什么视角,去看待和分析,你写出了什么知识点,有什么是可以吸收的。


这也是我在上一篇文章中提到的「跟作者做思维博弈」的本义。


这是一个复杂的世界。任何贴标签、简单归因的行为,都是危险的。


我们更应该关注的,是它底层的原理和运转机制。




讲了这么多,我们可以如何去反思这种思维,更好地认知世界呢?


一个原则,就是保持空杯和平衡,去看待和思考周围的事物。


我前几天写过一段话:


在被自己筛选出来的信息所构成的「信息茧房」中待太久,会误以为自己代表着真理。

但其实,你只是看到了那些,你希望看到的东西而已。


所以,我有一个小习惯,我很少会去「反驳」别人的看法。我会把别人的异议和批评收集起来,有空就翻看。提醒自己:


我所看到的事物,我所持的立场,很有可能只是「部分」而已。要跳脱出来,才能看到更大的整体。


如果别人的想法与我相左,我会去思考:他为什么会这样想?我的看法是否不够全面?我们之间可以如何更好地抵达「合」?


只有这样,才能消解对于事物的固有认知,也就是「先验知识」,更好地去认识这个世界的本来面目。


这里举一个例子:现代艺术。


很多同学不理解现代艺术,其实,它所做的,也是一样的事情。


以这个作品为例。



这不就是一个自行车轮吗?为什么它能够成为艺术?


其实,你应该这样思考:为什么它就是一个自行车轮,而不能是一个「由皮革和铁丝所组成的精妙结构」?


这就叫做「解构」。


我们要去做的,也是「解构」—— 一段信息,一个事物,一种认知,如果去除了我们所赋予它的「启发式」,去除了我们的期望,我们可以如何去看待和理解?


分享三个简单的做法。我会这样去思考:


1. 思考事物的本质和逻辑支撑。


它是什么?它不是什么?


它为什么是?我可以如何去理解它?


2. 从正反两面去看待事物。


把正反两面的支撑,看作两股互相颉颃的力量。去思考:


它们哪些地方能互相抵消?


哪一方更占优势?


这两种力量的合力,能将这个事物本身,推离中点至多大的幅度?


3. 区分事物本身和主观感受。


我很少会去评判一个事情「对」「不对」,我只会去区分清楚:


它为什么是这样?以及,我如何去看待它?


前者是客观存在,事实判断;后者是主观感受,价值判断。我们认知事物时,往往会把这两者混合在一起。这是需要警惕的。


只有这样,我们才能离这个世界的本质,更近一点。


思考是为了更好地理解世界,而不是限定它。


作者简介:Lachel,20万关注的高效思维达人知识管理、时间管理专家,领英洞察、36氪特约作家,帮助你更高效地思考、学习、工作。

责任编辑:Spencer  郑锦燕


0

回复

作者头像

Lachel

TA在等你的回复~

(不超过200字)

提交回复
向下加载更多

私信

Lachel一条私信

取消

问题反馈