我们都在说Al模型,怎么好怎么好,有人说的好:人工智能是先有人工才有智能。
模型需要喂给他知识才会变得强大。
想象一下,我们有一个非常非常聪明,但一开始什么都不会的“机器人小宝宝”,它的名字叫“小机”。机器学习,就是我们教“小机”学习知识、认识世界的过程。
它学习的方式,特别像我们小朋友学东西,主要有三种方法:
方法一:像学认水果一样——“有老师教”(监督学习)
我们来教“小机”认识苹果和橘子。
第一步:我们当老师
我们拿一个苹果给它看,并告诉它:“这是苹果,你看它是红色的、圆圆的。”
我们再拿一个橘子给它看,说:“这是橘子,你看它是橙色的、有点软。”
第二步:小机自己找规律
我们给它看了成百上千次后,聪明的小机自己就开始琢磨了:“哦~ 原来红色+圆圆的很大可能就是苹果,橙色+软软的很大可能就是橘子。”
第三步:小机来考试
最后,我们拿出一个它从来没见过的水果,比如一个青苹果。小机看了看说:“嗯,它虽然颜色和之前的不一样,但形状圆圆的,我猜它也是个苹果!”
这就叫“有老师教的学习”。我们提前告诉它答案(这是什么),它自己总结出规律,最后就能认识新东西了! 比如认图片、听声音,都是这么学的。
方法二:像自己整理玩具——“自己摸索”(无监督学习)
这次我们不告诉小机哪个是苹果、哪个是橘子了。我们直接把一堆混合的水果(苹果、橘子、香蕉)倒在它面前,然后说:“小机,你自己看看这些有什么不一样,把它们分分类吧!”
小机就会自己观察:“咦,有些是红色的,有些是橙色的,有些是黄色的;有些大,有些小。”
然后它就会根据颜色、大小等特征,自己把水果分成好几堆。虽然它不知道每一堆叫什么名字,但它知道“这几样看起来差不多是一类的”。
这就叫“自己摸索的学习”。没有人给答案,机器自己发现数据中的规律和模式。
方法三:像学骑车一样——“从表扬批评中学习”(强化学习)
现在我们要教“小机”学骑自行车。
它一开始什么都不会,可能会摔跤,也可能会歪歪扭扭地骑出去一点。
如果它骑得稳,没有摔倒,我们就表扬它(给它一个“奖励分”):“太棒了!就这样做!”
如果它摔倒了,我们就说“这样不对哦”(给它一个“惩罚”)。
小机为了得到更多的“奖励分”,就会拼命地尝试和调整:“刚才我身子往左歪就摔了,下次我试试把身子往右平衡一下?”
就这样,通过无数次尝试,从表扬和批评中,它终于学会了熟练地骑自行车!
这就叫“从表扬批评中学习”。通过不断的试错和奖励,自己找到最好的做法。 下围棋的就是这样打败世界冠军的!
总结一下
所以你看,机器学习一点也不神秘。
“有老师教” → (监督学习):先学答案,再找规律。
“自己摸索” → (无监督学习):没有答案,自己分类。
“从表扬批评中学习” → (强化学习):不断试错,追求奖励。
我们身边的很多“AI小助手”都是这样变得越来越聪明的:
手机里的语音助手(比如Siri)是怎么听懂你说话的?——是用第一种方法,好多人教过它。
视频网站为什么总能推荐你爱看的节目?——是用第二种方法,它自己摸索出你喜欢看哪一类。
无人驾驶汽车怎么会自己开车?——是用第三种方法,它在模拟世界里“撞”了无数次才学会的。
机器学习,就是让电脑像我们人类一样,通过观察、学习和实践,变得越来越厉害的过程! 你现在明白了吗?
以上内容含有Al生成内容,请仔细甄别。