🔥51CTO热榜：2025-02-18

强化学习训练数据越多，模型推理能力就越强？新研究提出LIM方法，揭示提升推理能力的关键在于优化数据质量，而不是数据规模。该方法在小模型上优势尽显。从此，强化学习Scaling Law可能要被改写了！

马斯克口中全世界最聪明大模型Grok-3，终于震撼登场！20万块GPU训出的模型，实属全球首次。果然，Grok-3已火速屠榜多个排行榜，击败o3-mini（high）和DeepSeek-R1。

设计思想是将调度行为抽象形成调度中心平台，平台本身不承担业务逻辑，而是负责发起调度请求后，由执行器接收调度请求并执行任务，这里的任务抽象为分散的 JobHandler。通过这种方式即可实现调度与任务相互解耦，从而提高系统整体的稳定性和拓展性。

刚刚，中国首个AI短剧视频生成模型——SkyReels-V1正式开源，千万级好莱坞数据训练微调。更震撼的是，首个SOTA级表情动作可控算法同时开源，每一个表情，每一个肢体动作，AI精准掌控。

在全球人工智能的舞台上，DeepSeek的崛起如同一颗耀眼的新星，引发了美日欧等科技巨头和专家的高度关注。这些来自不同地域的AI大佬们，对DeepSeek的技术实力和行业影响力做出了截然不同的评价，非常耐人寻味。

在两款大模型的研发过程中，双方在算力算法、场景训练等领域优势互补，“显著增强了多模态大模型的性能表现”。

人大高瓴人工智能研究院、蚂蚁共同提出LLaDA（a Large Language Diffusion with mAsking）。

对于大模型来说，许多现有的基准已经没有任何挑战性，也失去了作为衡量大模型真实视觉理解能力标准的价值。ZeroBench 的出现，显然打破了这个局面。

奥特曼这条推文就是向大家征集，OpenAI的下一个开源项目，到底是做啥更好。方案1，做一个非常小，仍需要在GPU上运行的O3-mini级模型。方案2，做一个最好的端侧模型。

我们提出了 Ola，这是一款功能全面且强大的全模态语言模型，在图像、视频和音频理解任务中展现出颇具竞争力的性能。

展望2025年，随着各企业在GenAI的应用上日益自信、创新与创造，我们将见证前所未有的进步，但与此同时，错误与挑战也将如影随形。

历史热榜