一文搞懂所谓Al机器学习——监督学习,无监督学习和强化学习

我们都在说Al模型,怎么好怎么好,有人说的好:人工智能是先有人工才有智能。

模型需要喂给他知识才会变得强大。

想象一下,我们有一个非常非常聪明,但一开始什么都不会的“机器人小宝宝”,它的名字叫“小机”。机器学习,就是我们教“小机”学习知识、认识世界的过程。

它学习的方式,特别像我们小朋友学东西,主要有三种方法:

方法一:像学认水果一样——“有老师教”(监督学习

我们来教“小机”认识苹果和橘子。

第一步:我们当老师

我们拿一个苹果给它看,并告诉它:“这是苹果,你看它是红色的、圆圆的。”

我们再拿一个橘子给它看,说:“这是橘子,你看它是橙色的、有点软。”

第二步:小机自己找规律

我们给它看了成百上千次后,聪明的小机自己就开始琢磨了:“哦~ 原来红色+圆圆的很大可能就是苹果,橙色+软软的很大可能就是橘子。”

第三步:小机来考试

最后,我们拿出一个它从来没见过的水果,比如一个青苹果。小机看了看说:“嗯,它虽然颜色和之前的不一样,但形状圆圆的,我猜它也是个苹果!”

这就叫“有老师教的学习”。我们提前告诉它答案(这是什么),它自己总结出规律,最后就能认识新东西了! 比如认图片、听声音,都是这么学的。

方法二:像自己整理玩具——“自己摸索”(无监督学习

这次我们不告诉小机哪个是苹果、哪个是橘子了。我们直接把一堆混合的水果(苹果、橘子、香蕉)倒在它面前,然后说:“小机,你自己看看这些有什么不一样,把它们分分类吧!”

小机就会自己观察:“咦,有些是红色的,有些是橙色的,有些是黄色的;有些大,有些小。”

然后它就会根据颜色、大小等特征,自己把水果分成好几堆。虽然它不知道每一堆叫什么名字,但它知道“这几样看起来差不多是一类的”。

这就叫“自己摸索的学习”。没有人给答案,机器自己发现数据中的规律和模式。

方法三:像学骑车一样——“从表扬批评中学习”(强化学习

现在我们要教“小机”学骑自行车。

它一开始什么都不会,可能会摔跤,也可能会歪歪扭扭地骑出去一点。

如果它骑得稳,没有摔倒,我们就表扬它(给它一个“奖励分”):“太棒了!就这样做!”

如果它摔倒了,我们就说“这样不对哦”(给它一个“惩罚”)。

小机为了得到更多的“奖励分”,就会拼命地尝试和调整:“刚才我身子往左歪就摔了,下次我试试把身子往右平衡一下?”

就这样,通过无数次尝试,从表扬和批评中,它终于学会了熟练地骑自行车!

这就叫“从表扬批评中学习”。通过不断的试错和奖励,自己找到最好的做法。 下围棋的就是这样打败世界冠军的!

总结一下

所以你看,机器学习一点也不神秘。

“有老师教” → (监督学习):先学答案,再找规律。

“自己摸索” → (无监督学习):没有答案,自己分类。

“从表扬批评中学习” → (强化学习):不断试错,追求奖励。

我们身边的很多“AI小助手”都是这样变得越来越聪明的:

手机里的语音助手(比如Siri)是怎么听懂你说话的?——是用第一种方法,好多人教过它。

视频网站为什么总能推荐你爱看的节目?——是用第二种方法,它自己摸索出你喜欢看哪一类。

无人驾驶汽车怎么会自己开车?——是用第三种方法,它在模拟世界里“撞”了无数次才学会的。

机器学习,就是让电脑像我们人类一样,通过观察、学习和实践,变得越来越厉害的过程! 你现在明白了吗?

以上内容含有Al生成内容,请仔细甄别。

© 版权声明

相关文章

暂无评论

none
暂无评论...