ai人工智能

978 2025-03-31

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learnin...

766 2025-03-31

CycleResearcher 研究团队成员包括：张岳教授，西湖大学人工智能系教授，工学院副院长，其指导的博士生朱敏郡、张鸿博、鲍光胜、访问学生翁诣轩；UCL 访问研究员杨林易博士，25 Fall 入职南方科技大学拟任独立 PI，博士生导师...

783 2025-03-30

这几天，你要说 AI 圈最火的是哪个模型？OpenAI 的 GPT-4o 当仁不让。吉卜力风格的图像和视频在社交圈疯传，被玩出了花。之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。除了一些口型和神情还有出入，人物形象...

758 2025-03-30

现阶段，微调大型语言模型（LLMs）的难点在于，人们通常没有高质量的标注数据。最近，AI 公司 Databricks 推出了一种新的调优方法 TAO，只需要输入数据，无需标注数据即可完成。更令人惊喜的是，TAO 在性能上甚至超过了基于标注数...

717 2025-03-30

作者是香港大学俞益洲教授与博士生娄蒙。你是否注意过人类观察世界的独特方式？当面对复杂场景时，我们往往先快速获得整体印象，再聚焦关键细节。这种「纵观全局 - 聚焦细节（Overview-first-Look-Closely-next）」的双阶...

文章分类

联系我们