ai人工智能

783 2025-03-18

DeepSeek-R1 问世后，我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习（RL）在文本上的突破，AI 应用势必会将更多领域推入新的范式。毫无疑问，这也是众多科技公司正在探索的方向。3 月 ...

753 2025-03-18

多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。小模型正在变得越来越好，而且越来越便宜。刚刚，法国 AI 创企 Mistral AI 开源了一个 24B 的多模态小模型，该模...

760 2025-03-18

今年年初，OpenAI 上线 Deep Research，开启了智能体又一新阶段，其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据，并最终为用户提供全面深入的解答。此后，Grok 3 及 Perplexity 等，它们都推出...

715 2025-03-18

本文作者来自香港科技大学、香港科技大学（广州）、香港城市大学以及UIUC等机构。其中，港科大在读博士生陈巍昱、港城大在读博士生张霄远和港科广在读博士生林百炅为共同第一作者；林熙博士目前担任港城大博士后研究员；UIUC赵晗助理教授、港城大张青...

787 2025-03-18

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。近日，清华 AIR 和字节联合 SIA Lab 发布了他们的第一项研究成果：DAPO，...

文章分类

联系我们