星期二, 16 12 月, 2025
Google search engine

打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA

0
在信息爆炸的时代,推荐系统已成为我们获取资讯、商品和服务的核心入口。无论是电商平台的 “猜你喜欢”,还是内容应用的信息流,背后都离不开推荐算法的默默耕耘。然而,传统的推荐系统普遍采用多阶段范式(如召回、排序),这种设计虽然在工程上实现了效

逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse

0
原生并行生成不仅仅是加速,它是我们对 LLM 推理思考方式的根本转变。众所周知,大语言模型的参数量越来越大,算力需求也越来越可怕,然而因为「祖宗之法」,推理只能一个一个 token 按顺序来。对此,卡耐基梅隆大学(CMU)Infini-A

想知道你的LLM API被过度收费了吗?隐藏的Tokens终于可以被审计了

0
研究背景:在商业保护与用户知情间寻求平衡论文标题:Invisible Tokens, Visible Bills: The Urgent Need to Audit Hidden Operations in Opaque LLM Serv

大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%

0
大模型学习不仅要正确知识,还需要一个“错题本”?上海AI Lab提出了一种新的学习方式,构建了“错误-反思-修正”数据,让大模型仿照人类的学习模式,从错误中学习、反思。结果,在Llama3-8B上,数学题的解题准确率平均提升了13.3%。

告别玄学选LLM!弗吉尼亚理工选型框架入选ICML 2025

0
还在靠“开盲盒”选择大模型?来自弗吉尼亚理工大学的研究人员推出了个选型框架LensLLM——大幅提升选型效果的同时,成本却降低近90%。众所周知,在大模型如雨后春笋般爆发的时代,选型成了AI工程师和研究员最大的痛点之一:模型多如牛毛,怎么

国产芯片比英伟达整体效率更高!?华为 CloudMatrix384 超节点首曝论文,跑 DeepSeek 效率超越英伟达

0
今年 4 月,围绕“华为芯片效率是否超越国际主流 AI 芯片和架构”的问题,网上曾引发一场激烈争论。争论的起点源于一条网友评论:“虽然华为芯片单颗比起用英伟达还是有落差,但是组成系统后,效率明显就高了。” 这条评论迅速引来大量围观,其中不

√N并行+84倍计算加速!英伟达港大全新图像注意力:空间结构都保留

0
GSPN是一种新型视觉注意力机制,通过线性扫描和稳定性-上下文条件,高效处理图像空间结构,显著降低计算复杂度。通过线性扫描方法建立像素间的密集连接,并利用稳定性-上下文条件确保稳定的长距离上下文传播,将计算复杂度显著降低至√N量级。Tra

10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!

0
扩散模型在视频合成任务中取得了显著成果,但其依赖迭代去噪过程,带来了巨大的计算开销。尽管一致性模型(Consistency Models)在加速扩散模型方面取得了重要进展,直接将其应用于视频扩散模型却常常导致时序一致性和外观细节的明显退化

美7000万人或被取代,Agent光速卷入职场!北大校友、杨笛一新作

0
AI想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!1769年,瓦特改进了蒸汽机。1945年,计算机诞生。2001年,3G移动网络开始部署。这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。

20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考

0
GRIT能让多模态大语言模型(MLLM)通过生成自然语言和图像框坐标结合的推理链进行「图像思维」,仅需20个训练样本即可实现优越性能!现有开源多模态推理模型(Multimodal Reasoning Model)生成的推理链几乎都是纯自然
- Advertisement -
Google search engine

AI每日快报

多模态内容生成的机会,为什么属于中国公司?

0
2025 年多模态技术快速发展,中国创业团队在内容生成领域正在形成领先优势。与美国在大语言模型领域的领先不同,中国企业在视频生成、3D 创作等多模态细分领域已跻身全球第一梯队。像 Pixverse 的视频生成产品用户规模超过许多美国知名产

热门内容