🔥51CTO热榜:2025-03-13

来自网易有道的14B翻译小模型,测试达行业第一,翻译质量超越一众国内外主流通用大模型。
MLLM的回复质量下降可能是因为经过了多模态数据训练之后,LLM本身的能力退化。
去噪方法结合哈密顿神经网络,让AI更懂物理。
我们来实现couponChecker、discountChecker、vipChecker 三个具体的流程步骤的处理类,他们各自要处理的逻辑都封装在自己实现的Check方法中。
研究团队坦言,尽管付出了很多的算力,和大量的精力来分析相关的实验。但是很多子 Topic 分析仍然是值得深究的。
Sakana AI刚刚官宣,第二代「AI科学家」独立完成论文,通过了ICLR 2025 Workshop的同行评审。这是首次完全由AI端到端生成的科学论文,获得了学术高度认可。
就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。
刚刚,陈立武正式接任英特尔CEO,3月18日正式生效。细数当今芯片界三大掌门人:英伟达黄仁勋、AMD苏姿丰,再到英特尔陈立武,形成了华人大佬一统芯片江湖的新格局。
“为啥不是 Rust?为啥不选 C#?”毕竟,TS 的灵魂人物 Anders Hejlsberg 可是 C# 的缔造者,而 Rust 在 JS/TS 生态中早已是“性能先锋”的代名词。这到底是怎么回事?让我们一探究竟!
海外支付的接入涉及复杂的流程和细致的状态管理,通过合理的系统设计和流程优化,可以有效解决掉单和账单对账的问题,确保用户权益得到保障。​
得物Android端的Crash监控体系得到显著增强,使得历史Crash数据的完整捕获能力得到系统性改善,相应Crash指标也有所上升,经过架构以及各团队的共同努力下,崩溃率已从最高的万2降至目前的万1.1到万1.5,其中疑难问题占比约90%、因系统bug导致的Crash占比约40%,在本文中将简要介绍一些较典型的系统Crash的治理过程。
在进行异步编程优化前,使用性能分析工具(如Visual Studio的性能探查器)准确找出性能瓶颈。对于核心异步操作,采用合适的优化策略,如减少不必要的上下文切换、优化I/O操作等。
在ChatBot Arena Imarena大模型竞技场中,Gemma 3也跻身Top 10,不仅在同等参数量模型中达到SOTA,开源模型里也仅次于R1。
LLM推理中的延迟问题常被忽视,而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链(CoD)技术,仅用7.6%的token,就能在保持准确率的同时,大幅降低推理成本和延迟。
DeepSeek 开源 DualPipe 的同一天,还开源了 EPLB。今天来简单聊聊 EPLB,包懂。
今天凌晨,奥特曼按捺不住激动地自曝,OpenAI已经在训练一个创意写作模型,看完它写的元小说后,他第一次真正为AI的创作感到震撼。但很多网友表示:要是人写的可以看一下,AI写的坚决不看。
近年来,大模型时代的多模态生成与理解技术取得了飞跃式发展。然而,如何让AI真正“看懂”世界,并更好地对齐人类偏好,仍是一个核心挑战。
对CISO来说,倦怠不仅是个人问题,更是一种业务风险。那么,CISO该如何保护团队和自己免受倦怠的困扰呢?以下是一些结构化建议。
今天,我们将揭秘一款名为DataGear的Java开源神器——它不仅免费,还能用“万能兼容”和“无限定制”重新定义数据可视化!
我们构建了等效交互理论体系,发表了几十篇论文,在一定程度上证明并成功实现了对大部分神经网络的符号化解释。