📢 Gate广场专属 #WXTM创作大赛# 正式开启!
聚焦 CandyDrop 第59期 —— MinoTari (WXTM),总奖池 70,000 枚 WXTM 等你赢!
🎯 关于 MinoTari (WXTM)
Tari 是一个以数字资产为核心的区块链协议,由 Rust 构建,致力于为创作者提供设计全新数字体验的平台。
通过 Tari,数字稀缺资产(如收藏品、游戏资产等)将成为创作者拓展商业价值的新方式。
🎨 活动时间:
2025年8月7日 17:00 - 8月12日 24:00(UTC+8)
📌 参与方式:
在 Gate广场发布与 WXTM 或相关活动(充值 / 交易 / CandyDrop)相关的原创内容
内容不少于 100 字,形式不限(观点分析、教程分享、图文创意等)
添加标签: #WXTM创作大赛# 和 #WXTM#
附本人活动截图(如充值记录、交易页面或 CandyDrop 报名图)
🏆 奖励设置(共计 70,000 枚 WXTM):
一等奖(1名):20,000 枚 WXTM
二等奖(3名):10,000 枚 WXTM
三等奖(10名):2,000 枚 WXTM
📋 评选标准:
内容质量(主题相关、逻辑清晰、有深度)
用户互动热度(点赞、评论)
附带参与截图者优先
📄 活动说明:
内容必须原创,禁止抄袭和小号刷量行为
获奖用户需完成 Gate广场实名
OpenAI联合创始人:自动驾驶和VR都是“歧途” AI智能体才是未来
作者:葛佳明
在黄仁勋和马斯克接连看到了AI智能体的发展潜力后,OpenAI联合创始人,特斯拉前人工智能总监Andrej Karpathy也在最近高呼,AI智能体代表着一个疯狂的未来。
Andrej Karpathy直言,自己在特斯拉的工作时“被自动驾驶分了心”,钻研自动驾驶和VR都不是发展AI智能体的正确道路。此刻正是回归神经科学,从中寻求灵感的时刻。
另一方面,Andrej Karpathy认为每个人在构建AI智能体的方面都比OpenAI这样的公司更有优势,大家目前处于平等竞争的状态,因此他很期待看到这方面的成果:
谷歌旗下AI团队DeepMind的最新论文介绍了一种能够进行自我改进的AI智能体——RoboCat,本质上是由AI赋能的软件程序,相当于机器人的“大脑”。由其加持的机器人与传统机器人不同之处在于,RoboCat更具“通用性”,并可实现自我改进、自我提升。
具身智能比人形机器人更有价值
具身智能相当于AI的大脑,而这个大脑的载体可以是任何形式。可以是一个机械臂,一只机器狗,更或者是一辆小汽车。
而反观人形机器人,当下为何被看做是一个不太聪明的钢铁巨人,核心还是因为缺少AI大脑+不太灵活的躯体。
简单来说,类似GPT-4这样的大模型,对物理世界并不能真的产生影响,而具身智能则多了一个身体,通过传感器收集环境信息,利用机械执行器进行物理操作,或者通过机器人等具体实体与人类和环境进行实时互动。
马斯克曾说,虽然未来有一天人人可能会拥有一个人形机器人,但是目前展现的Optimus人形机器人产品也就只能执行重复性的简单劳动。
具身智能的目标是使机器能够更好地理解和适应复杂的环境,更高效地解决问题,并具备更灵活的行为能力。通过融合感知、决策和执行的过程,具身智能使机器能够更接近人类智能的表现,从而在机器人技术、自动驾驶、智能制造等领域发挥重要作用。
Karpathy直言,在7年前,研究AI智能体的时机还不成熟,因技术所限做出来的效果不好,于是他和OpenAI就改变了方向,开始研究大语言模型。
而现在有了全新的技术手段来研究AI智能体,情况和2016年完全不同了:
AI下一个浪潮?
大语言模型的出现,给构建具身智能体带来了全新的可能性。因为基于LLM的智能体可以利用预训练模型中蕴含的世界知识,生成一致的行动计划或可执行策略,这就非常适合应用于游戏和机器人之类的任务。
DeepMind的RoboCat只是AI赋能机器人的主要案例之一。
今年以来,已经有数家公司将语言模型运用到了机器人上:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月,阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月,英伟达发布全新自主移动机器人平台。
得益于此,人工智能加持的机器人化身具身智能吸引了全球的广泛关注。
马斯克在特斯拉2023年股东大会上便表示,人形机器人将是今后特斯拉主要的长期价值来源:
英伟达创始人黄仁勋在ITF World 2023半导体大会上也表示,AI下一个浪潮将是“具身智能”。华尔街见闻此前指出,国盛证券分析师认为,具身智能有着物理反馈、物理输出的特性,可以成为成为通信、计算和存储的新载体:
AI的躯体其实并非是最重要的,核心应该是发展AI大脑,打通人机交互方式,让AI能够主动感知物理世界,拟人化的思维路径才能做到人类期待的行为反馈。机器视觉和多模态大模型正是开启这个世界的两把钥匙。