🔥51CTO热榜：2025-02-07

16:26 51CTO DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法

RTX 3080 移动版能训练哪种大模型？本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。

16:26 51CTO 微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

2025年，软件工程要彻底变天了。先有奥特曼预言，后有微软下场All in智能体。刚刚，首个自主SWE智能体面世，不仅会主动改bug修复错误，还能自主提交PR评论。

16:26 51CTO DeepSeek R1 集成难题完美解决：Deepseek4j 已开源

随着 DeepSeek R1 模型的发布，其强大的思维链能力让开发者为之兴奋。然而，Spring AI 等主流框架对其支持不足，导致很多开发者无法充分发挥模型潜力。本文将为您带来一个完美的解决方案 - deepseek4j。

16:26 51CTO Java Stream魔法：List秒变Map，重复键值巧应对

在 Java 编程的广阔世界里，将 List 转换为 Map 是一项极为常见且基础的操作，而 Java Stream API 的出现，为这一操作注入了新的活力，使其变得更加简洁高效。通过使用Collectors.toMap()方法，我们能够轻松地实现 List 到 Map 的转换，满足各种业务场景的需求。

17:26 51CTO EvalPlanner：基于“计划-执行”双阶段的大语言模型评估框架

大语言模型(LLM)评估系统在生成思维链(Chain-of-Thought, CoT)序列时，需要系统地捕捉评估过程中的推理步骤。

17:26 51CTO AI成本革命：DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式

DeepSeek-R1以OpenAI模型1 30的成本实现同等推理能力，揭开AI平民化时代的序幕。

17:26 51CTO SQL案例分析：移动平均值与累计求和

许多常见的聚合函数也可以作为窗口函数使用，包括AVG()、SUM()、COUNT()、MAX()以及MIN()函数等。

17:26 51CTO DeepSeek被禁！最高判刑20年，外交部回应！

DeepSeek的遭遇并非孤例。从华为5G到TikTok，中国科技企业屡屡成为地缘政治的“风暴眼”。然而，历史证明，以封锁遏制技术进步终将徒劳——唯有通过对话建立互信、通过合作完善规则，才能实现科技发展的共赢。

17:26 51CTO 随着越来越多的受害者拒绝支付，勒索软件支付额度大幅下降

Chainalysis的最新报告显示，2024年勒索软件受害者支付赎金的总额和频率均有所下降，部分原因是全球执法机构的打击行动以及网络卫生和韧性的改善，同时，报告指出了勒索软件操作的新趋势，包括攻击速度加快、潜伏时间延长以及威胁行为者要求多次付款等。

17:26 51CTO 特朗普清算“深层政府”，数字霸权走到“岔路口”

2025年1月，特朗普登上总统宝座的第一天就展开了一场“大清洗“，以雷霆手段整肃美国联邦政府治理结构，全盘否定拜登的”安全战略和政策遗产“，开启了一场前所未有的数字治理和政治改革风暴。