ai人工智能
584
2025-03-31
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
由于 DeepSeek R1 和 OpenAI o1 等推理模型(LRM,Large Reasoning Model)带来了新的 post-training scaling law,强化学习(RL,Reinforcement Learnin...
343
2025-03-31
ICLR 2025 | 真正「Deep」的「Research」,通过强化学习实现可自主进化的科研智能体来了!
CycleResearcher 研究团队成员包括:张岳教授,西湖大学人工智能系教授,工学院副院长,其指导的博士生朱敏郡、张鸿博、鲍光胜、访问学生翁诣轩;UCL 访问研究员杨林易博士,25 Fall 入职南方科技大学拟任独立 PI,博士生导师...
359
2025-03-30
吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。吉卜力风格的图像和视频在社交圈疯传,被玩出了花。之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。除了一些口型和神情还有出入,人物形象...
357
2025-03-30
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
现阶段,微调大型语言模型(LLMs)的难点在于,人们通常没有高质量的标注数据。最近,AI 公司 Databricks 推出了一种新的调优方法 TAO,只需要输入数据,无需标注数据即可完成。更令人惊喜的是,TAO 在性能上甚至超过了基于标注数...
340
2025-03-30
卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型
作者是香港大学俞益洲教授与博士生娄蒙。你是否注意过人类观察世界的独特方式?当面对复杂场景时,我们往往先快速获得整体印象,再聚焦关键细节。这种「纵观全局 - 聚焦细节(Overview-first-Look-Closely-next)」的双阶...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |
网址: | ai.tmqcjr.com |