监督学习类似于智力复制转移,基于现有labeled data,资源越多、越好,习得的智慧越多
监督学习
智力复制转移
labeled data
而强化学习基于经验的积累,属于无中生有,即使没有好data,只要处于一个有规律的世界或者环境,就能通过不断地实验获得智力
强化学习
data
有规律的世界或者环境
不断地实验
改变世界的科技创新,都是无中生有,靠实验出来的