一文搞懂所谓Al机器学习——监督学习，无监督学习和强化学习

生活百科6个月前发布星尘导航

78 0 0

我们都在说Al模型，怎么好怎么好，有人说的好:人工智能是先有人工才有智能。

模型需要喂给他知识才会变得强大。

想象一下，我们有一个非常非常聪明，但一开始什么都不会的“机器人小宝宝”，它的名字叫“小机”。机器学习，就是我们教“小机”学习知识、认识世界的过程。

它学习的方式，特别像我们小朋友学东西，主要有三种方法：

方法一：像学认水果一样——“有老师教”（监督学习）

我们来教“小机”认识苹果和橘子。

第一步：我们当老师

我们拿一个苹果给它看，并告诉它：“这是苹果，你看它是红色的、圆圆的。”

我们再拿一个橘子给它看，说：“这是橘子，你看它是橙色的、有点软。”

第二步：小机自己找规律

我们给它看了成百上千次后，聪明的小机自己就开始琢磨了：“哦~ 原来红色+圆圆的很大可能就是苹果，橙色+软软的很大可能就是橘子。”

第三步：小机来考试

最后，我们拿出一个它从来没见过的水果，比如一个青苹果。小机看了看说：“嗯，它虽然颜色和之前的不一样，但形状圆圆的，我猜它也是个苹果！”

这就叫“有老师教的学习”。我们提前告诉它答案（这是什么），它自己总结出规律，最后就能认识新东西了！比如认图片、听声音，都是这么学的。

方法二：像自己整理玩具——“自己摸索”（无监督学习）

这次我们不告诉小机哪个是苹果、哪个是橘子了。我们直接把一堆混合的水果（苹果、橘子、香蕉）倒在它面前，然后说：“小机，你自己看看这些有什么不一样，把它们分分类吧！”

小机就会自己观察：“咦，有些是红色的，有些是橙色的，有些是黄色的；有些大，有些小。”

然后它就会根据颜色、大小等特征，自己把水果分成好几堆。虽然它不知道每一堆叫什么名字，但它知道“这几样看起来差不多是一类的”。

这就叫“自己摸索的学习”。没有人给答案，机器自己发现数据中的规律和模式。

方法三：像学骑车一样——“从表扬批评中学习”（强化学习）

现在我们要教“小机”学骑自行车。

它一开始什么都不会，可能会摔跤，也可能会歪歪扭扭地骑出去一点。

如果它骑得稳，没有摔倒，我们就表扬它（给它一个“奖励分”）：“太棒了！就这样做！”

如果它摔倒了，我们就说“这样不对哦”（给它一个“惩罚”）。

小机为了得到更多的“奖励分”，就会拼命地尝试和调整：“刚才我身子往左歪就摔了，下次我试试把身子往右平衡一下？”

就这样，通过无数次尝试，从表扬和批评中，它终于学会了熟练地骑自行车！

这就叫“从表扬批评中学习”。通过不断的试错和奖励，自己找到最好的做法。下围棋的就是这样打败世界冠军的！

总结一下

所以你看，机器学习一点也不神秘。

“有老师教” → (监督学习)：先学答案，再找规律。

“自己摸索” → (无监督学习)：没有答案，自己分类。

“从表扬批评中学习” → (强化学习)：不断试错，追求奖励。

我们身边的很多“AI小助手”都是这样变得越来越聪明的：

手机里的语音助手（比如Siri）是怎么听懂你说话的？——是用第一种方法，好多人教过它。

视频网站为什么总能推荐你爱看的节目？——是用第二种方法，它自己摸索出你喜欢看哪一类。

无人驾驶汽车怎么会自己开车？——是用第三种方法，它在模拟世界里“撞”了无数次才学会的。

机器学习，就是让电脑像我们人类一样，通过观察、学习和实践，变得越来越厉害的过程！你现在明白了吗？

以上内容含有Al生成内容，请仔细甄别。

文章版权归作者所有，未经允许请勿转载。

在线AI设计工具：2D草图转3D设计图，还原率极高！

生活百科 # 2D草图转3D # 一键抠图 # 免费工具

5个月前

0800

跨境电商到底怎么玩，有英国VAT税号还被封杀？

生活百科 # 低申报 # 海关扣留 # 税务申报

6个月前

0600

美国支付巨头PayPal正式进军中国市场，收购国付宝70%股份已获批

生活百科 # PayPal # 中国市场 # 国付宝

5个月前

0530

亚马逊澳洲站迎来爆发，销售额将突破55亿美元

生活百科 # Prime会员 # 亚马逊 # 澳大利亚

5个月前

0630

暂无评论

暂无评论...