星期五, 27 6 月, 2025
Google search engine

田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索

0
AI也有量子叠加态了?连续思维链的并行搜索类似于量子叠加,比离散型思维链更具优势。这是AI大牛田渊栋团队的最新研究成果。传统LLM通过生成 “思维token”(如文本形式的中间步骤)进行推理(即离散思维链),但在处理复杂任务(如判断有向图

美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练

0
只需要动动嘴就可以驱动GUI代理?由美团和浙江大学联合推出的GUIRoboTron-Speech——让用户解放双手,直接对计算机“发号施令”。这是首个能够直接利用语音指令和设备屏幕截图进行端到端(End-to-End)决策的自主GUI智能

能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

0
剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文,直接挑战了当前Agent开发的核心假设:我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mihaela van der Schaar

AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

0
这不是段子,而是正在发生的现象。大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。斯坦福大学、UC伯克利、MIT等机构联合发布研究论文《Solving Inequality Proof

何恺明CVPR最新讲座PPT上线:走向端到端生成建模

0
生成模型会重现识别模型的历史吗?今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友,很多参会者还参加了个非常有意思的项目 —— 追星。这个「星」自然是学术明星。从前方发来的实况来看,MIT 副教授何恺明可能是人气

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

0
近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。如今,这股 RL 的浪潮也涌向了图像生成领域。当

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

0
人人都绕不开的推荐系统,如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力,开始重塑各领域的传统技术栈。作为互联网流量

Agent全自动搭建代码运行环境,实时更新解决评测过拟合/数据污染问题|微软

0
长期以来主流的代码修复评测基准SWE-bench面临数据过时、覆盖面窄、手动维护成本高等问题,严重制约了AI模型真实能力的展现。微软发布全新代码修复评测基准SWE-bench-Live,不仅引入了来自GitHub最新的Issue,显著提升

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

0
预训练模型能否作为探索新架构设计的“底座” ?最新答案是:yes!简单来说,按照研究人员设计好的架构方案从头训练模型,往往是检验一个架构是否有效的重要手段。但问题在于,从头训练模型的成本也太高了!对此,包括李飞飞团队在内的研究人员提出了一

人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration

0
6 月 16 日,腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型,专注解决音乐 AIGC 中音质、音乐性与生成速度这三大共性难题,基于 LLM-DiT 的融合架构,模型在保持生成速度的同时,显著提升了音质表现
- Advertisement -
Google search engine

AI每日快报

谷歌发布本地具身智能模型!全程无联网执行精细操作,从人形机器人到工业机器人全覆盖

0
机器人终于有了自己的“离线大脑”。Google DeepMind团队首个可以完全在机器人本地运行的视觉-语言-动作(VLA)模型Gemini Robotics On-Device发布。这个模型不仅能离线运行,还保持了相当强悍的操作能力,能

热门内容