国产芯片比英伟达整体效率更高!?华为 CloudMatrix384 超节点首曝论文,跑 DeepSeek 效率超越英伟达
今年 4 月,围绕“华为芯片效率是否超越国际主流 AI 芯片和架构”的问题,网上曾引发一场激烈争论。争论的起点源于一条网友评论:“虽然华为芯片单颗比起用英伟达还是有落差,但是组成系统后,效率明显就高了。” 这条评论迅速引来大量围观,其中不
√N并行+84倍计算加速!英伟达港大全新图像注意力:空间结构都保留
GSPN是一种新型视觉注意力机制,通过线性扫描和稳定性-上下文条件,高效处理图像空间结构,显著降低计算复杂度。通过线性扫描方法建立像素间的密集连接,并利用稳定性-上下文条件确保稳定的长距离上下文传播,将计算复杂度显著降低至√N量级。Tra
10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!
扩散模型在视频合成任务中取得了显著成果,但其依赖迭代去噪过程,带来了巨大的计算开销。尽管一致性模型(Consistency Models)在加速扩散模型方面取得了重要进展,直接将其应用于视频扩散模型却常常导致时序一致性和外观细节的明显退化
美7000万人或被取代,Agent光速卷入职场!北大校友、杨笛一新作
AI想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!1769年,瓦特改进了蒸汽机。1945年,计算机诞生。2001年,3G移动网络开始部署。这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。
20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考
GRIT能让多模态大语言模型(MLLM)通过生成自然语言和图像框坐标结合的推理链进行「图像思维」,仅需20个训练样本即可实现优越性能!现有开源多模态推理模型(Multimodal Reasoning Model)生成的推理链几乎都是纯自然
港科广等发布首个医学世界模型!精准模拟肿瘤演化,规划治疗方案
医学世界模型(MeWM)是一种创新的AI系统,能够模拟疾病演变并预测不同治疗方案下的肿瘤变化。通过生成术后肿瘤图像,可以帮助医生在术前评估治疗效果,优化治疗方案,显著提升临床决策的准确性,为精准医疗提供了有力支持。《黄帝内经》的这句「上医
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题
AI字幕总是慢半拍,质量和延迟难以平衡是业界老问题了。为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simu
斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配
2025年1月到5月间,斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家,评估了104个职业中的844项具体任务。这项由经济学家Erik Brynjolfsson和Yijia S
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
视频生成模型太贵太慢怎么办?普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和
ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告
AI上瘾堪比「吸毒」!MIT最新研究惊人发现:长期依赖大模型,学习能力下降、大脑受损,神经连接减少47%。AI提高效率的说法,或许根本就是误解!ChatGPT正在「吸干」你的大脑!刚刚,麻省理工学院完成了针对ChatGPT用户的首次大脑扫