🔥51CTO热榜:2025-02-18

强化学习训练数据越多,模型推理能力就越强?新研究提出LIM方法,揭示提升推理能力的关键在于优化数据质量,而不是数据规模。该方法在小模型上优势尽显。从此,强化学习Scaling Law可能要被改写了!
马斯克口中全世界最聪明大模型Grok-3,终于震撼登场!20万块GPU训出的模型,实属全球首次。果然,Grok-3已火速屠榜多个排行榜,击败o3-mini(high)和DeepSeek-R1。
设计思想 是将调度行为抽象形成 调度中心 平台,平台本身不承担业务逻辑,而是负责发起 调度请求 后,由 执行器 接收调度请求并执行 任务,这里的 任务 抽象为 分散的 JobHandler。通过这种方式即可实现 调度 与 任务 相互解耦,从而提高系统整体的稳定性和拓展性。
刚刚,中国首个AI短剧视频生成模型——SkyReels-V1正式开源,千万级好莱坞数据训练微调。更震撼的是,首个SOTA级表情动作可控算法同时开源,每一个表情,每一个肢体动作,AI精准掌控。
在全球人工智能的舞台上,DeepSeek的崛起如同一颗耀眼的新星,引发了美日欧等科技巨头和专家的高度关注。这些来自不同地域的AI大佬们,对DeepSeek的技术实力和行业影响力做出了截然不同的评价,非常耐人寻味。
在两款大模型的研发过程中,双方在算力算法、场景训练等领域优势互补,“显著增强了多模态大模型的性能表现”。
人大高瓴人工智能研究院、蚂蚁共同提出LLaDA(a Large Language Diffusion with mAsking)。
对于大模型来说,许多现有的基准已经没有任何挑战性,也失去了作为衡量大模型真实视觉理解能力标准的价值。ZeroBench 的出现,显然打破了这个局面。
奥特曼这条推文就是向大家征集,OpenAI的下一个开源项目,到底是做啥更好。方案1,做一个非常小,仍需要在GPU上运行的O3-mini级模型。方案2,做一个最好的端侧模型。
我们提出了 Ola,这是一款功能全面且强大的全模态语言模型,在图像、视频和音频理解任务中展现出颇具竞争力的性能。
展望2025年,随着各企业在GenAI的应用上日益自信、创新与创造,我们将见证前所未有的进步,但与此同时,错误与挑战也将如影随形。