【评测指标系列】1. 初始困惑度Perplexity 评测指标系列主要绍大语言模型评估中常用的评测指标与方法。困惑度指标是NLP和LM评估领域最基本、应用最广泛的评估指标之一。今天我们先来快速了解困惑度的意义以及公式定义。 生活百科# NLP# 交叉熵# 困惑度 7个月前880
科研人员提出长视频中多尺度检测微表情片段的卷积神经网络 与常见的普通表情相比,微表情有三个显著特征,即持续时间短、强度低和局部运动。相关研究结果在线发表在IEEE Transactions on Image Processing上。 生活百科# MESNet# 卷积神经网络# 微表情检测 7个月前870
马尔可夫决策过程(MDP):马尔可夫奖励(MRP) + 智能体动作因素 本文接前面文章:入门强化学习所需掌握的基本概念MDP的前置知识:随机过程、马尔可夫过程、马尔可夫奖励根据上文 生活百科# MDP# MRP# 价值函数 7个月前790
清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持 83% 性能 划重点: 清华大学和哈尔滨工业大学联合发布论文,将大模型压缩到1bit,保持83% 性能; OneBit 方法首次尝试1bit 量化 生活百科# 1bit量化# OneBit方法# 哈尔滨工业大学 7个月前880
R-sq越高代表模型拟合越好? 在统计建模中,究竟R-sq应该取多大? 我们经常听到这个疑问。以前,我们分享过如何解释R-Sq,我们还纠正了一个统计上的误区,即较低的R-sq不一定差,较高的R-sq不一定好。 生活百科# R-sq# 模型拟合# 欠拟合 7个月前830
从模仿到自学:DeepMind如何让机器人自己学会新技能 我们总说“机器人越来越聪明”,可背后真相是,大多数机器人依然只能“照猫画虎”——靠人类演示来模仿操作,一旦遇到没见过的场景,就“傻眼”。想让机器人真正具备像人一样的学习能力 生活百科# DeepMind# 机器人# 机器学习 7个月前820