港科广等发布首个医学世界模型!精准模拟肿瘤演化,规划治疗方案
医学世界模型(MeWM)是一种创新的AI系统,能够模拟疾病演变并预测不同治疗方案下的肿瘤变化。通过生成术后肿瘤图像,可以帮助医生在术前评估治疗效果,优化治疗方案,显著提升临床决策的准确性,为精准医疗提供了有力支持。《黄帝内经》的这句「上医
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题
AI字幕总是慢半拍,质量和延迟难以平衡是业界老问题了。为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simu
斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配
2025年1月到5月间,斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家,评估了104个职业中的844项具体任务。这项由经济学家Erik Brynjolfsson和Yijia S
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
视频生成模型太贵太慢怎么办?普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和
ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告
AI上瘾堪比「吸毒」!MIT最新研究惊人发现:长期依赖大模型,学习能力下降、大脑受损,神经连接减少47%。AI提高效率的说法,或许根本就是误解!ChatGPT正在「吸干」你的大脑!刚刚,麻省理工学院完成了针对ChatGPT用户的首次大脑扫
田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索
AI也有量子叠加态了?连续思维链的并行搜索类似于量子叠加,比离散型思维链更具优势。这是AI大牛田渊栋团队的最新研究成果。传统LLM通过生成 “思维token”(如文本形式的中间步骤)进行推理(即离散思维链),但在处理复杂任务(如判断有向图
美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练
只需要动动嘴就可以驱动GUI代理?由美团和浙江大学联合推出的GUIRoboTron-Speech——让用户解放双手,直接对计算机“发号施令”。这是首个能够直接利用语音指令和设备屏幕截图进行端到端(End-to-End)决策的自主GUI智能
能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新
剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文,直接挑战了当前Agent开发的核心假设:我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mihaela van der Schaar
AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT
这不是段子,而是正在发生的现象。大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。斯坦福大学、UC伯克利、MIT等机构联合发布研究论文《Solving Inequality Proof
何恺明CVPR最新讲座PPT上线:走向端到端生成建模
生成模型会重现识别模型的历史吗?今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友,很多参会者还参加了个非常有意思的项目 —— 追星。这个「星」自然是学术明星。从前方发来的实况来看,MIT 副教授何恺明可能是人气

























