特辑:浅析人的学习、思考模式
总体来讲,分为 supervised learning and reinforcement learning
具体:
你看见火山爆发就跑,这不是自然形成的,而是你之前见过别人不跑,死了。
你记住了这个常识、这个链式法则,所以你照着它做。
我们人生中会积累无数的常识,有的是别人给的,有的是自己试出来的。
在我们做决定时,各种常识会跳出来指导你行动,有的常识说你该做这件事,有的常识又说你不该做这件事。
你到底做不做呢?我们实际的决定还是取决于各个常识的权重。
根据你个人的经验,跟着有些常识做事你获得了收益和回报,所以这些常识的权重高。
而根据另一些常识做事,你获得的收益少,或者它们根本就不符合事实,用这些常识预测事物根本不准,所以这些常识权重低。
基于这样一种行为决策机制,怎样才能让自己每次选择的常识、做的决策都是正确的呢?那就是不断尝试。
你失败得越多,遇到的挫折越多,而你又没倒下,反而去总结经验,你就会越明白哪些常识是错的,哪些常识或直觉是对的。
从而利用这些逻辑链条帮助你成功地预测未来和你行动之间的联系,进而获得回报、获得收益、获得成功。
其中自己去试属于reinforcement learning, 听信别人讲的知识 称为supervised learning。
reinforcement learning可以让你超越老师、超越人体极限
而supervised learning不能,它只能让你的知识 < = 你老师