ai人工智能
589
2025-02-17
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
592
2025-02-17
首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
648
2025-02-17
超强DNA大模型「GENERator」问世!解锁生命密码设计新范式
编辑 | ScienceAI在基因组学研究领域,DNA 序列的解码与预测一直是科学家们面临的核心挑战。随着测序技术的飞速发展,我们能够以前所未有的速度获取海量基因组数据,但如何高效解读这些复杂的遗传信息,仍是一个亟待解决的难题。近年来,大语...
571
2025-02-16
真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中
一觉醒来,AI 应用的天变了!微信终于反应过来,接入了 DeepSeek!而且据腾讯回应消息,接入的还是满血版 DeepSeek R1!微信正在灰度测试该模型,部分灰度到的用户可以内测相关的 AI 搜索功能。此次 DeepSeek R1 的...
572
2025-02-16
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
近年来,大型语言模型(LLMs)的进展彻底改变了自然语言处理领域,并因此成为各种现实应用中的核心技术,例如代码助手、搜索引擎和个人 AI 助手。这些突破的核心在于对「下一个 token 预测」的范式。然而,自然语言 token 代表的意思通...
文章分类
联系我们
| 联系人: | 透明七彩巨人 |
|---|---|
| Email: | weok168@gmail.com |
| 网址: | ai.tmqcjr.com |