ai人工智能
351
2025-03-27
参数仅需12万分之一,训练只需2块GPU,MIT、哈佛推出生物序列建模新方法Lyra
编辑 | 白菜叶卷积神经网络(CNN)和 Transformer 等深度学习架构通过捕捉局部和长距离依赖关系,显著推进了生物序列建模。然而,它们在生物学环境中的应用受到高计算需求和对大数据集的需求的限制。麻省理工学院、哈佛大学和卡内基梅隆大...
341
2025-03-27
把MLA和稀疏激活带到端侧!港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM
本文由 PLM 团队撰写,PLM 团队是由香港科技大学(广州)的校长倪明选教授,伦敦大学学院(UCL)AI 中心汪军教授,香港科技大学(广州)信息枢纽院长陈雷教授联合指导。第一作者邓程是香港科技大学(广州)的研究助理,研究方向为端侧大模型和...
346
2025-03-27
阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。从此...
348
2025-03-27
清华稀疏Attention,无需训练加速一切模型!
在当今各类大语言模型以及视频模型中,长序列场景越来越普遍,而 Attention 的计算复杂度随着序列长度呈平方增长,成为长序列任务下的主要计算瓶颈。此前,清华大学陈键飞团队提出的即插即用量化的 SageAttention 系列工作已实现 ...
343
2025-03-26
魔法原子举办2025场景战略发布会:人形机器人与四足机器人正式亮相
3月26日,魔法原子举办“「原子双生」2025场景战略发布会” ,人形机器人小麦担任主持人。小麦现场介绍了自己的成长历程,还介绍了四足机器人的全新应用场景。作为本次发布会的亮点之一,小麦带领观众沉浸式探访其“生活空间”,呈现了魔法原子在机器...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |
网址: | ai.tmqcjr.com |