让机器狗学完真狗子的运动数据,真有二哈那感觉了!
它轻松跨个栏,后面“主人”差点没跟上:
钻个“狗洞”倒是轻车熟路:
【资料图】
还能两只狗一起撒欢儿,它追、它逃……
这就是鹅厂机器狗的最新进展。
利用预训练模型喂给机器狗真狗子的运动数据、并通过强化学习,机器狗Max不仅在行为上更灵动,而且还能根据已经掌握的技能“举一反三”,去适应更加复杂的环境。
总结来说,就是里里外外都“更狗”了一些。
有策略地追逐撒欢儿
这次机器狗学习的新技能里,最强的一项还是玩游戏。
机器狗不仅能遵守规则,还能自己想出策略赢比赛,可能比真狗子还要聪明些。
具体来看,这是一个障碍追逐比赛,受到“World Chase Tag”启发,规则如下:
研究人员设置了不同游戏难度,最简单的就是空旷场地:
玩游戏过程里,机器狗很明显是有策略的。
比如,一般等到躲避者离棋旗子较远时,追击者才会发起猛攻,把它逼到死角,游戏结束。
如果追击者发现躲避者离旗子很近,自己根本没机会追上它时,它会先放弃追逐,等待下一个旗子出现:
有障碍物干扰也没关系,俩狗子一样玩得很6:
而能够有如此表现,并不是机器狗从一开始就拿这个游戏训练。
它其实是基于自己已经学到的一些动作、知识和技能,来应对这个游戏场景。
具体怎么实现?往下看。
学了真狗的数据
研究一共分为三个阶段。
学习动物运编程客栈动姿态
将运动姿态和外界感知联系起来
附加网络获取和复杂任务有关信息
第一阶段,是通过游戏中常用的动作捕捉系统,通过收集真狗的姿态数据,包括走、跑、跳、站立等动作,在仿真器中构建一个模仿学习任务。
然后将这些数据中的信息抽象并压缩到深度神经网络模型中,使其在涵盖运动姿态信息的同时,还具有一定可解释性。
腾讯RoboticsX机器人实验室和腾讯游戏合作,用游戏技术提高了仿真引擎的准确性和高效性,同时游戏制作和研发过程中积累了多元的动捕素材。
这些技术以及数据android对基于物理仿真的智能体训练以及真实世界机器人策略部署也起到了一定的辅助作用。
在模仿学习的过程中,神经网络仅接受机器狗的本体感知信息作为输入,例如机器人身上电机的状态等。
再下一步,模型引入周边环境的感知数据,例如通过其他传感器“看到”的脚下的障碍物。
第二阶段,通过额外的网络参数,将第一阶段掌握的动物姿态和外界感知联系在一起。
这样机器狗就能通过已经学会的动作,来应对外界环境。
当机器人能够适应多种复杂的环境后,这些将动物姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。
然后机器狗就能自如上楼梯了。
或者在不连续、不平整地面上奔跑:
然后就到了最后一阶段,让机器狗根据上面学会的技能,去解决实际问题
也就是上面提到的做游戏环节。
据介绍,游戏中机器狗的所有控制策略都是神经网络策略。
在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器人上。
比如在预训练模型中学会了躲避障碍物的知识,那么在游戏里设置障碍,机器狗也能轻松应对。
本次研究新进展由腾讯Robotics X机器js人实验室带来。
该实验成立于2018年,目前推出的机器人项目包括机器狗Max一代/二代、机器狗Jamoca、轮式机器人Ollie、自平衡自动驾驶摩托车等。
OnephpMore Thing
值得一提的是,之前UC伯克利的学者也将一种“真狗子”的训练方法,用在了机器狗上。
吴恩达开山大弟子Pieter Abbeel等,让机器狗自己在地上打滚一个小时,学会了走路。
而去年腾讯发布机器狗Max二代时,一段小花絮里,这狗会“扑脚”、“撒欢跑”,确实有家里毛孩子那味儿。
(当然,如果想让它成为一只听主人话的狗, 通过指令即可对其发号施令。)
咱就是说,现在机器狗的发展方向,不朝着翻跟头卷,反倒是要和真狗子“抢饭碗”了吗?
-
金都城:黄金开启三浪下跌反弹仍是高空,原油将继续走强在一系列强势经济数据支持下,9月8日,也就是本周周五ICE美元指数
-
阿根廷tini(史蒂芬说:阿根廷70万人请愿)阿根廷球迷杀人诛心了,哈哈!不甘心的法国人,20万人在网上签名请愿,
-
突发!日媒:日本外相访问乌克兰,系俄乌冲突爆发以来首次日本外相首次访乌克兰,支持其抵御俄罗斯入侵。
-
西安多区通知:9月9日10点开始预约HPV疫苗新一波的HPV疫苗预约来了!9月9日(星期六)上午10:00,雁塔区、新城区、
-
坤鹏论:读《形而上学》 学习亚里士多德的第一哲学(16)真正有本事的是疏,而非堵与禁。——坤鹏论第一卷第六章(二)原文:而
-
茶和咖啡(关于茶和咖啡简述),你们好,今天0471房产来聊聊一篇和咖啡,和咖啡简述的文章,网友们对
-
如何下载豆丁网(豆丁下载器)来为大家解答以上问题,如何下载豆丁网,豆丁下载器很多人还不知道,现
-
逾5千家上市公司披露年报,235家公司被出具非标审计意见逾5千家上市公司披露年报,235家公司被出具非标审计意见,年报,非标,证
-
“讲好山东政法故事”创意传播大赛暨“我的政法故事”征文优秀作品展示举行海报新闻记者丛萍济南报道9月8日下午,忠诚的力量——“讲好山东政法故
-
因控股股东非经营性资金占用触及违规 ST天顺及控股股东、实控人等相关责任人遭深交所通报批评深交所9月8日向ST天顺及控股股东舟山天顺股权投资有限公司,控股股东关
-
曼联女足首任主帅是曾入狱的恋童癖,但曼联仍邀他参加俱乐部活动曼联女足首任主帅是曾入狱的恋童癖,但曼联仍邀他参加俱乐部活动,英超,
-
房地产收并购市场热度回升 八月交易额明显增长房地产收并购市场8月热度回升显著,企业正在加快处置资产回笼资金。根
-
合肥一中学班主任向学生推销教辅材料 校方:行为错误,已纠正合肥一中学班主任向学生推销教辅材料 【合肥一中学班主任向学生推销40
-
五根手指各叫什么名字_五根手指分别叫什么1、拇指、食指、中指、无名指、小指。本文到此讲解完毕了,希望对大家
-
幸福蓝海9月8日快速反弹以下是幸福蓝海在北京时间9月8日13:41分盘口异动快照:  9月
-
2开双控开关接线图解(2开)1、2开纸的尺寸是:530mm×760mm不过既然是学校发的就可以就用那个啊。
-
南通向全市教育工作者发放“江海尊师卡”本报讯(记者王艳芳)为弘扬尊师重教的传统美德,充分凸显对广大教师群
-
深入分布式一致性:Raft 和 etcdRaft分布式一致性是构建可靠的分布式系统的关键要素之一。为了确保数据的一
-
北交所总经理隋强:打造资本市场改革试验田 北交所进入高质量建设2.0版本9月7日,北交所联合北京市地方金融监管局、市科委中关村管委会、市经信
-
阿维塔12重磅来袭!比极氪001更酷炫由长安汽车、华为科技以及宁德时代三家巨头共同鼎力打造的阿维塔,在市
-
厚普股份(300471)8月31日主力资金净买入1221.10万元截至2023年8月31日收盘,厚普股份(300471)报收于13 47元,上涨2 51%,
-
文昌航天发射场规划建设新一代载人登月火箭发射工位记者8月31日从文昌航天发射场获悉,目前该发射场正在规划建设新一代载
-
西安警方捣毁特大“网络水军”团伙 125人被采取刑事强制措施虚假信息、诽谤攻击、非法推广、恶评去势、操控扰乱网上舆论秩序,“网
-
广西自贸试验区加快构建面向东盟跨境产业链供应链【东盟专线】广西自贸试验区加快构建面向东盟跨境产业链供应链中新社南
-
福晟国际上半年收入1.88亿元 筹集新借贷0元观点网讯:8月31日,福晟国际控股集团有限公司发布了截至2023年6月30日
-
2023暑期档票房206.08亿2023暑期档票房206 08亿:格隆汇8月31日|据灯塔专业版,截至8月31日21
-
婚礼现场布置设计(婚礼现场布置)精选小编来为大家解答以上问题。婚礼现场布置设计,婚礼现场布置很多人
-
福州楼市限购再松绑 “本地户籍+市区”成为政策亮点为更好满足居民刚性和改善性住房需求,促进房地产市场平稳健康发展,8
-
NH4CL的电子式和结构式(nh4cl的电子式)1、nh4+中的n的其中一对孤对电子也h形成配位键,表示为n→h,其他的就
-
镇江67个乡镇(街道)全部建立应急办 将应急管理的触角延伸到基层末梢“本次培训会议,住宿3人及以上的‘三合一’场所要通知到位、派人参加