星期五, 27 6 月, 2025
Google search engine

Poe平台上线即梦3. 0 图像模型与Seedance 1.0 Lite视频模型

0
Poe平台正式上线由字节跳动(ByteDance)研发的即梦3.0图像生成模型(Seedream3.0)与Seedance1.0Lite视频生成模型,为全球用户带来更高效、更高质量的多模态内容创作体验。这一更新标志着Poe在图像与视频生成领域的进一步突破,为创作者提供了从静态图像到动态视频的无缝创作流程。 即梦3.0:图像生成新标杆 即梦3.0(Seedream3.0)作为字节跳动旗下火山引擎的最新图像生成模型,以其出色的画质与语义理解能力引发行业关注。据悉,该模型在4月已短暂登顶文生图榜单(Artificial Analysis),展现了强大的中英文双语生成能力。相比前代,即梦3.0在生成清晰度、色彩鲜艳度以及细节表现力上均有显著提升,支持用户通过文本描述生成高分辨率、风格多样的图像。 即梦3.0的优势在于其深度语义解析与多风格适配能力。无论是生成国漫风格插画、写实摄影效果,还是水彩、油画等艺术风格,该模型都能精准响应用户指令,输出令人惊艳的视觉内容。此外,即梦3.0优化了生成速度与资源消耗,适合快速迭代的创作场景,如社交媒体内容设计、电商广告素材制作等。 Seedance1.0Lite:轻量高效的视频创作利器 与此同时,Poe平台同步上线的Seedance1.0Lite视频生成模型为用户带来了文本转视频与图像转视频的双模态生成体验。作为火山引擎豆包视频模型的轻量版本,Seedance1.0Lite支持生成5秒或10秒、480p或720p分辨率的视频,帧率达24fps,能够精细控制人物外貌、衣着、表情动作等细节,同时支持360度环绕、航拍、变焦等多种影视级运镜技术。 Seedance1.0Lite主打高效性与高性价比,生成的视频画质细腻、动态流畅,广泛适用于电商广告、娱乐特效、影视预演以及动态壁纸等场景。得益于其**生成对抗网络(GAN)**技术与多维数据集的训练优化,模型在运动连贯性与画面稳定性上表现优异,为中小型创作者提供了低成本、高质量的视频生产方案。 Poe平台的多模态创作闭环 Poe平台的此次更新不仅引入了即梦3.0与Seedance1.0Lite,还通过其独特的一站式交互设计实现了图像与视频创作的无缝衔接。用户可以在Poe聊天界面中通过@Seedance指令,将即梦3.0生成的图像直接转化为动态视频,极大简化了创作流程。这种图像-视频联动**功能为内容创作者提供了全新的生产力工具,尤其适合短视频平台、营销推广与教育内容制作等场景。 值得一提的是,Seedance1.0Lite的开放性与易用性使其成为初学者与专业用户的理想选择。用户只需通过简单的文本描述或上传静态图像,即可快速生成具有电影质感的视频内容。此外,Poe平台支持多语言指令输入,进一步降低了全球用户的创作门槛。 行业影响与未来展望 即梦3.0与Seedance1.0Lite的推出,不仅巩固了字节跳动在AI多模态生成领域的领先地位,也为Poe平台吸引了更多创作者与企业用户。根据AIbase观察,字节跳动通过持续迭代AI模型(从1月豆包1.5到6月Seedance1.0Pro的密集更新),展现了其在全球AI竞争中的雄心。Seedance1.0系列已在文生视频与图生视频评测中超越Google Veo3、快手可灵2.0等竞品,位列中英文双榜第一,彰显了国产AI模型的崛起。 然而,AIbase编辑部也注意到,Seedance1.0Lite在长镜头稳定性与复杂场景切换方面仍有优化空间。未来,字节跳动或将进一步提升模型性能,推出支持更长视频生成与更高分辨率的版本,以满足专业影视创作需求。 Poe平台上线的即梦3.0与Seedance1.0Lite为AI创作领域注入了新的活力。无论是图像生成的精细化表达,还是视频生成的影视级质感,这两大模型都为用户提供了高效、便捷的创作工具。AIbase编辑部认为,随着多模态AI技术的持续发展,Poe平台有望成为全球创作者的首选平台,助力更多人实现从灵感构思到内容落地的无缝创作体验。

好莱坞巨头向AI行业发起法律战

0
参考消息网6月17日报道据德国《南德意志报》网站6月15日报道,电影、剧集和主题乐园巨头迪士尼与规模稍逊但同样强势的全国广播公司环球媒体公司(NBC环球),已共同向美国加利福尼亚州联邦法院提起诉讼。 这两家制片公司指控人工智能(AI)初创企业米德朱尼实验室(Midjourney)存在“系统性”“蓄意”且“持续”的“大规模”侵犯著作权及邻接权行为。 迪士尼等起诉Midjourney一案可能成为好莱坞对抗AI企业的首场重大诉讼。电影工业虽姗姗来迟,却直接派出两大代表加入这场关于“AI企业行为边界”的论战。其他权利方如出版社、唱片公司等早已对美国开放人工智能研究中心等AI企业提起诉讼。 Midjourney程序提供的是一种特殊的AI服务,即根据简短指令(即所谓“提示词”)生成全新图像。 其出色表现源于在训练程序时使用了海量数据——AI接收的训练图像越多,就越能精准理解用户需求。用户要求Midjourney画一座桥,就会得到一张桥梁图片;要求展示动画片《辛普森一家》中的角色霍默·辛普森,也会如愿——但这正是迪士尼与NBC环球的痛点。 原因在于,不仅特定影视作品受版权保护,霍默·辛普森等角色形象同样属于知识产权范畴。随着迪士尼收购二十世纪福克斯公司,辛普森家族已成为其品牌资产。 诉状指出,Midjourney的AI持续应用户要求复制、发布影视角色并提供相关下载,有时用户模糊搜索“超级英雄”,就能得到迪士尼旗下形象。 迪士尼与NBC环球律师提交的诉状通过对比大量的AI生成图像与影视剧照证明了这一点。原作与AI版本并列呈现——几乎难以区分真伪。 这份诉状的耐人寻味之处在于,它不仅是对Midjourney的攻击,更是向整个AI行业宣战。 这份长达110页的诉状同时揭示:面对AI日益精进的能力,就连影视行业巨头也难掩惶惑。(编译/焦宇)

全球AI大会东京站落幕,千人齐聚探讨AI落地

0
潮新闻客户端 记者 张云山 近日,为期两天的“全球AI大会东京站”(Global AI Conference Tokyo)在东京樱美林大学新宿校区圆满落幕。本次大会吸引了来自全球各地的超过1000名企业家、创业者、投资人、开发者和AI爱好者参与,现场设置了16个品牌展位,邀请了100余位行业嘉宾进行分享。 全球AI大会东京站成功举办(受访者供图) 大会的核心议程聚焦于AI技术的最新进展及其在各行各业的应用潜力。嘉宾演讲环节爆满,观众反响热烈。知名创作者汗青分享了《AI驱动的个体叙事和IP衍生》,通过生动的数字人案例展示了AI在个人品牌塑造中的强大力量。大会还汇聚了国际顶尖AI创作者。法国知名AI影像创作者Yves Dalbiez(曾制作Snoop Dogg AI音乐视频,获Project Odyssey全球AI创作赛冠军)现场分享了其在音乐影像与视觉叙事中的前沿探索。日本动画行业传奇人物、AiHUB高级制片人井上博明(曾参与《铁臂阿童木》制作),带来了主题演讲。 本次大会主办方WaytoAGI作为国内知名的AI开源知识社区,WaytoAGI在飞书的开源知识库累计访问量已超过3000万。通过定期组织视频挑战赛、模型创作大赛等活动,WaytoAGI通往AGI之路鼓励成员在实践中学习和交流,推动AI技术的创新与应用,为AI行业培养了大量优秀人才。其创始人AJ表示,本次大会充分展现了全球AI社群的活力与创造力,以更有效地助力中国企业“出海”日本市场。

AI赛道卷土重来 这次炒作思路有点儿不同

0
英伟达作为全球AI产业链“芯片+生态”龙头企业,其一举一动对A股AI板块运行具有方向性指引作用。近期,英伟达公布了超预期的一季度财报,A股AI板块也随之活跃。但与上一轮主要炒AI应用有所不同,这波行情领跑的分支是影响数据传输速度的CPO,也就是说,市场关注的焦点从AI商用的广阔前景,回归到AI应用拉动算力基建的现实需求。 这个投资思路的变化,其实从英伟达的一季报中有迹可循。英伟达一季报营收441亿美元,同比增长69%,超出市场预期的431亿美元;净利润187.75亿美元,略低于市场预期的207.67亿美元。分业务看,数据中心业务持续强劲,报告期营收达391.1亿美元,同比增长73%。基于Blackwell架构的多节点液冷机架级扩展系统NVL72出货量持续增长,有券商调研报告显示主流超大规模云厂商平均每周部署近1,000个该类型机柜。 此外,得益于Blackwell架构深度融合游戏生态,英伟达RTX 50系显卡热销,游戏显卡业务营收达38亿美元,同比增长42%,超出市场预期的28.5亿美元。 1 市场重新聚焦成长的确定性 反观AI应用,虽然DeepSeek、豆包等大模型得到广泛应用,但一直没有出现稳定的商业模式,AI应用概念的上市公司也没有让市场看到业绩的确定性增长。一边是未来的想象空间,另一边是眼前确定的报表业绩,市场重新选边站,再次聚焦算力基建也就不难理解了。 算力基建的主要分支包括CPO、数据中心、液冷服务器等,其中中国CPO企业具有国际竞争力。 CPO即共封装光学,是一种将多个光学元件(如激光器、调制器、分束器等)集成在同一个封装中的技术。该技术可以提高数据传输速度,提高系统性能。根据Yole分析预测,2022年全球CPO的市场规模为600万美元,预计到2033年市场规模为2.87亿美元。 在CPO赛道上,A股龙头公司是具备真实力的,如天孚通信是英伟达CPO交换机的合作伙伴,它在2025美国光纤通讯展览会及研讨会(OFC)上,展示了CPO和高速光模块应用的产品及相关封装方案。 2 光模块三巨头报表打消市场担忧 硅光模块是另一个关系AI算力的关键部件,这是基于硅光子技术的新一代光通信模块,具有低成本、低功耗、高集成度等优势,能够满足AIGC大规模应用对高算力和高性价比方案的要求。 根据全球半导体巨头博通的研究,硅光方案能够节省30%的器件成本。根据Yole的数据,2023年全球硅光芯片市场价值为9500万美元,预计到2029年将达到8.63亿美元,6年复合增长率达到45%。A股光模块三巨头中际旭创、新易盛、光迅科技在硅光模块上都有比较深厚的技术储备,并开始向海外AI巨头企业供货。 受益于全球AI算力市场的持续增长,光模块三巨头今年一季报表现出色。中际旭创报告期实现营收66.7亿元,同比、环比分别提升37.8%、1.9%;实现归母净利润15.8亿元,同比、环比分别提升56.8%、11.6%。同时,受益于高端产品占比加大,净利润率环比提升了2个百分点。新易盛报告期实现营收40.5亿元,同比增长264.1%;归母净利润15.7亿元,同比增长384.5%。同时,毛利率为48.66%,同比增加了6.66个百分点。光迅科技报告期实现营业收入22.22亿元,同比增长72.14%;实现归母净利润1.50亿元,同比增长95.02%。根据Omdia的最新统计数据,该公司在全球光模块市场占比约为5%,排名第五位。 此前,市场一度担心国际巨头公司会减少云计算资本开支,导致光模块三巨头股价下行,但一季报数据表明市场需求强劲,同时企业产品升级,盈利能力提升。近期,谷歌在Google I/O 2025开发者大会上披露,在过去一年中,每月处理的token数量从9.7万亿增长到480万亿,增长了约50倍,AI算力需求仍然旺盛。 这波以光模块三巨头为核心的AI算力基建行情,虽然少了些大模型改变生活方式的魔幻色彩,但能够看到切实业绩的增长,这样的上涨更令人放心。 (提示:投资有风险,观点仅供参考,不作为决策依据。) 来源:老狼财经

RAGFlow震撼来袭!开源RAG引擎解锁深度文档理解,引爆企业AI新革命!

0
近日,一款名为RAGFlow的开源RAG(检索增强生成)引擎引发了业界广泛关注。这款基于深度文档理解的企业级AI工具,以其强大的多模态数据处理能力和高效的工作流程,为企业处理复杂文档和实现精准问答提供了全新解决方案。

商汤科技牵头打造智能油气未来 将建石化AI大模型联合实验室

0
近日,人工智能领军企业商汤科技与山东东明石化集团、北京好雅创新科技有限公司正式签署战略合作协议。此举旨在共同推动人工智能在石化产业的创新与发展,并将共建石化AI大模型联合实验室,助力石油和天然气行业实现全面智能化转型。

豆包大模型再进化!全球领先,AI Agent 应用加速落地!

0
近日,豆包大模型迎来了全新1.6版本,标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域,豆包1.6实现了显著的性能提升,同时大幅降低了用户使用的门槛,推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。

荣耀CEO李健:AI正在完成从“思考”到“行动”的关键跨越

0
6月19日上午,荣耀CEO李健在上海世界移动通信大会上发表《开放共生,众木成林 让AI走进生活》主题演讲时表示,AGI是一个长期演进的过程,当前处于从推理者到行动者发展的过渡阶段,AI正在完成从“思考”到“行动”的关键跨越,当务之急是要“让AI能解决问题”,只有让AI落地生根,让用户日常使用起来,才能真正释放AI的潜力。 本文源自:金融界
- Advertisement -
Google search engine

AI每日快报

商汤科技牵头打造智能油气未来 将建石化AI大模型联合实验室

0
近日,人工智能领军企业商汤科技与山东东明石化集团、北京好雅创新科技有限公司正式签署战略合作协议。此举旨在共同推动人工智能在石化产业的创新与发展,并将共建石化AI大模型联合实验室,助力石油和天然气行业实现全面智能化转型。

热门内容