切换到宽版
  • 38阅读
  • 2回复

[智能应用]人形机器人上麻将桌!北京创企攻克30分钟自主对战难题,翻牌碰杠比人还流畅 [6P] [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
130925
金币
140515
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 14163(小时)
注册时间: 2012-06-21
最后登录: 2025-04-29
只看楼主 倒序阅读 使用道具 楼主  发表于: 昨天 08:42

机器人前瞻(公众号:robot_pro)
作者许丽思
编辑漠影
机器人前瞻4月27日报道,今天,灵初智能发布了分层端到端VLA+强化学习算法模型Psi-R1。R1能够让机器人基于Chain of Action Thought(CoAT)框架的自主推理系统,在开放环境下进行自主推理决策,完成长程复杂操作。
R1以麻将为场景,展现了机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,还验证了三重复合交互能力,即人-机交互、机-机交互、机-环境交互。
机器人要学会打麻将,难在哪?

  • 机器人需要理解麻将的规则,确保行为符合游戏规则。
  • 机器人还需要制定合理的策略,如根据手牌状态、牌局演变以及对手行为来完成动态策略生成,决定出牌、吃碰杠等操作,涉及大量人机交互、机机交互等动作。
  • 机器人操作需要完成毫米级精度的抓牌、出牌、理牌等灵巧精细动作,这对机器人的长程任务规划、灵巧操作能力提出了巨大挑战。

在视频中,R1让机器人具备了翻牌、碰杠、算牌、协作等核心能力。可以看到,机器人灵巧手攻克了触觉-视觉模态对齐难题,实现100%准确翻起麻将牌。

机器人能够根据牌友的出牌,构建牌局状态机,自主构建碰、杠等策略链,并丝滑地完成碰杠动作。

在长程规划上,机器人能够记得所有人打过的所有的牌,并根据牌桌状况动态规划要打的牌。

两台机器人甚至还会相互配合,不仅仅信息共享,互相“看牌”,还能多机配合递牌,提升胜率。

不同于Pi,Figure等「动作单向决策」机制的VLA模型(仅能完成视觉-语言层面的CoT),灵初智能的R1模型的慢脑输入包括行动Token,构建了首个支持「动作感知-环境反馈-动态决策」全闭环的VLA模型,实现机器人操作的视觉-语言-动作多模态协同的CoAT思维链,且已首度成功验证VLA Test-Time Scaling。
快脑S1专注于操作,涵盖了物体的遮掩抓、物体轨迹约束的操作如拉拉链,工作使用技能泛化如扫码、打电钻,高动态操作如抛接球等。
慢脑S2专注于推理规划S1的操作经过tokenize后,作为S2慢脑的输入,和语言、视觉模态融合,基于Causal VLM自回归架构,实现多模态融合的推理和任务规划。
快慢脑通过Action Tokenizer隐式连接,端到端训练,协同完成长程任务的灵巧操作。

灵初智能R1可以应用于多个场景中,例如泛工业中来料仓检测、成品包装等场景,零售物流中拣选、分拨、补货、打包等场景,以及家庭服务与协作场景
目前,该公司已与制造业、商超零售、跨境物流等行业龙头企业展开合作,梯次布局高价值商业化场景,从泛工业向泛零售物流,再最终迈向家庭应用。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
130925
金币
140515
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 14163(小时)
注册时间: 2012-06-21
最后登录: 2025-04-29
只看该作者 沙发  发表于: 昨天 08:44
关于北京灵初智能研发的人形机器人R1在麻将场景中实现30分钟自主对战的技术突破,结合最新进展与行业意义,整理如下:

一、技术突破与核心框架
CoAT(Chain of Action Thought)自主推理系统
R1基于CoAT框架,首次实现视觉-语言-动作多模态协同的闭环思维链。与传统的单向决策模型(如Pi、Figure仅支持视觉-语言推理)不同,R1通过慢脑输入的行动Token,融合「动作感知-环境反馈-动态决策」全流程,支持动态策略生成。

分层端到端VLA+强化学习算法模型(Psi-R1)
该模型结合视觉语言动作(VLA)与强化学习,攻克了开放环境下的长程任务规划难题,例如麻将牌局的持续30分钟以上自主操作,并首次验证VLATest-Time Scaling技术。

二、能力展示:麻将场景中的表现
复杂交互能力

人-机交互:通过高清摄像头与触觉传感器,实现毫米级抓牌、理牌动作(100%准确翻牌)。
机-机交互:多台R1可共享牌局信息,协同递牌、制定策略链,提升胜率。
机-环境交互:动态构建牌局状态机,实时分析对手出牌并调整策略(如碰杠、算牌)
长程任务规划与操作精度
机器人需同时满足规则理解、策略生成(动态出牌/碰杠)、灵巧操作三大挑战,例如记忆所有已出牌、预测牌局演变并规划最优出牌顺序。

三、行业意义与未来潜力
技术验证价值
麻将场景综合考验了机器人的感知、决策与执行能力,为家庭服务、工业协作等复杂场景(如物体遮掩抓取、高动态抛接球)提供技术迁移基础。

市场应用前景
人形机器人正加速从实验室走向实际应用,中国预计2030年市场规模达8700亿元。R1的突破显示国内企业在AI算法与硬件集成上的领先优势,或推动服务型机器人商业化进程。

四、与其他技术的对比
与早期智能麻将机器人相比,R1的突破在于:

闭环决策:传统模型仅完成视觉-语言推理,R1通过动作Token实现操作闭环。
多机协作:首次验证机-机交互的协作策略,而非单机单向操作。
总结
灵初智能R1通过CoAT框架与VLA+强化学习模型,攻克了人形机器人在开放环境中的长程复杂操作难题。其麻将场景的成功应用,标志着国内在人机交互、动态决策等领域的技术突破,为未来服务型机器人普及奠定基础

如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
147721
金币
112194
道行
1994
原创
2396
奖券
2610
斑龄
33
道券
936
获奖
0
座驾
设备
摄影级
在线时间: 34298(小时)
注册时间: 2008-10-01
最后登录: 2025-04-29
只看该作者 板凳  发表于: 昨天 11:43
  灵初智能发布的分层端到端VLA+强化学习算法模型Psi-R1,展示了机器人在复杂环境中进行自主推理和决策的能力,尤其是在麻将这一具有挑战性的场景中。以下是对机器人学会打麻将难点的分析:

  1. 理解规则:机器人需要理解麻将的复杂规则,并确保其行为符合游戏规则。这要求机器人具备一定的逻辑推理和规则学习的能力。

  2. 动态策略生成:机器人需要根据手牌状态、牌局演变以及对手行为来制定合理的策略,决定出牌、吃碰杠等操作。这涉及大量的人机交互、机机交互等动作,对机器人的决策能力提出了挑战。

  3. 灵巧精细操作:机器人操作需要完成毫米级精度的抓牌、出牌、理牌等灵巧精细动作,这对机器人的长程任务规划、灵巧操作能力提出了巨大挑战。

  4. 触觉-视觉模态对齐:机器人灵巧手需要攻克触觉-视觉模态对齐难题,实现100%准确翻起麻将牌。这对机器人的感知和控制能力提出了高要求。

  5. 构建牌局状态机:机器人能够根据牌友的出牌,构建牌局状态机,自主构建碰、杠等策略链,并丝滑地完成碰杠动作。这要求机器人具备实时分析和响应牌局变化的能力。

  6. 长程规划:机器人能够记得所有人打过的所有牌,并根据牌桌状况动态规划要打的牌。这需要机器人具备长程记忆和规划的能力。

  7. 多机配合:两台机器人甚至还会相互配合,不仅仅信息共享,互相"看牌",还能多机配合递牌,提升胜率。这要求机器人具备协同合作的能力。

  灵初智能的R1模型通过快慢脑协同工作,实现了视觉-语言-动作多模态协同的CoAT思维链,成功验证了VLA Test-Time Scaling。快脑S1专注于操作,慢脑S2专注于推理规划,两者通过Action Tokenizer隐式连接,端到端训练,协同完成长程任务的灵巧操作。

  R1模型的应用场景广泛,包括泛工业、零售物流以及家庭服务与协作等。灵初智能已与多个行业的龙头企业展开合作,梯次布局高价值商业化场景,从泛工业向泛零售物流,再最终迈向家庭应用。这表明R1模型具有巨大的商业潜力和应用前景。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个