首页
热榜
诗歌
博客
美图
分享
好物
牛股
友站
互动
登录
注册
🔥热榜:2025-03-05
09:49
51CTO
NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究
给DeepSeek-R1推理指导,它的数学推理能力就开始暴涨。更令人吃惊是,Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例!而人类为此耗费了27年。研究者预言:LLM离破解NP-hard问题,已经又近了一步。
09:49
51CTO
Warp vs. Ghostty:哪个终端应用更符合你的开发需求?
Ghostty必须与许多优秀的终端应用程序(例如,Kitty)竞争,但目前它已经相当稳定。作为一名开发者,你应该重视任何可在任何平台上使用的终端应用程序,以便能够快速在新环境中启动新项目。
09:49
51CTO
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。
09:49
51CTO
如何使用 Redis 完成 PV,UV 统计?
本文我们分析了如何使用 Redis 统计 PV 和 UV,通过 Redis 的 INCR 和 HyperLogLog 数据结构,可以高效地实现 PV 和 UV 的统计。
09:49
51CTO
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
近日,字节跳动豆包大模型团队联合 M-A-P 开源社区,推出了全新评测基准 SuperGPQA。
09:49
51CTO
实测字节免费AI编程,还让不让Cursor活了
不管是20美元一个月的cursor,还是10美元一个月的copilot,在能免费用R1这种高级模型的Trae面前,都显得黯然失色。
09:49
51CTO
开源神器 NocoDB:零代码玩转数据库,替代 Airtable 的新选择!
今天给大家介绍一款颠覆传统数据库管理的开源利器——NocoDB,让Excel表格都能成为企业级数据库!
09:49
51CTO
经网络的每一层都是干嘛的?这才是神经网络结构的核心
而不同神经网络模型之间最主要的区别就是神经网络结构的异同,当然最相似的地方也是神经网络结构。
09:49
51CTO
智能数据如何使企业渡过供应链危机
随着供应链日益复杂,有效利用数据来预测和预防中断不再是便利或奢侈——而是生存的必需品。应对中断最成功的企业并不总是那些拥有最先进技术的企业。
09:49
51CTO
基于DaemonSet的Process Exporter监控实践指南
本文将带你掌握 Process Exporter 的完整使用链路,涵盖基础部署、Prometheus集成、Grafana可视化及告警规则配置,即使是新手也能轻松上手!
09:49
51CTO
MySQL 升级后查询性能跳水,排序竟成“罪魁祸首”?
原来是 MySQL 8.0 对某些 ORDER BY 相关的参数修改,导致了优化器不生效。下面我们进入本次的 SQL 优化分析,也建议升级后有类似情况的读者自检。
09:49
51CTO
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法
基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向。按照思考方法收集训练数据集,通过有监督学习微调大语言模型;训练一个一致性奖励模型,并将该模型用作奖励函数,以使用强化学习来微调大语言模型。结果大语言模型的推理能力和计划能力,以及执行计划的能力得到了增强。
09:49
51CTO
如何高效使用DeepSeek-R1:推理大模型调优指南
掌握深度推理模型的交互范式,本质上是构建精准的需求映射关系。建议开发者建立自己的提示模板库,通过持续实验优化交互策略。随着模型迭代升级,建议定期更新最佳实践指南。
09:49
51CTO
彻底理解推理模型和通用模型
能够处理多种任务的模型,如文本生成、问答、翻译、摘要等,通常基于大规模预训练(如GPT系列、PaLM等)。
09:49
51CTO
量子战争:谷歌、微软和亚马逊在容错量子比特方面的竞争之路
短短三个月内,三家不同的量子制造商相继推出三款新型量子芯片,这是一个惊人的进展。它们都试图解决量子计算的基本问题:量子态的脆弱性很容易受到最轻微的环境干扰的破坏。结果就是处理错误达到令人无法容忍的程度。
09:49
51CTO
GPU 云服务器的软件系统设计和实践
大模型推理需求的爆发,将使得成本的关注变得非常敏感。相比算力的提高,大模型推理对 GPU 显存的大小和互联带宽有着更高的需求,从 DeepSeek R1/V3 可见一斑。
09:49
51CTO
面试官:Next.js 的 API 路由与传统的 Express.js 路由有什么区别?
Next.js 14/15 版本的 API 路由与传统的 Express.js 路由 在架构、运行环境和使用方式上有所不同。
09:49
51CTO
这才是真正的用户分层,而不是看平均数
用户分层看起来简单,可深入探讨的话,需要牵扯的业务细节非常多。很多同学做起来很困扰,都是困扰在:领导让我分高端用户,到底是8000算高端,10000算高端,还是12000算高端呢?
09:49
51CTO
B站文生视频模型工程实践
Deepspeed 的 zero-3:是一种用于深度学习优化的技术。在分布式训练框架下,zero-3 将训练状态(包括权重、梯度和优化器状态)分布到不同的显卡上,以优化显存利用。
09:49
51CTO
2025 前端五个顶级通用拖拽库
gridstack.js 是一个专门用于 拖拽式网格布局 的 JavaScript 库,适用于仪表盘、低代码平台、拖拽式页面构建器等场景。它提供了一套 网格化布局系统,支持拖拽、调整大小、自适应排列,使用户可以像拼积木一样自由调整组件布局。
<
1
46
47
48
49
50
51
52
187
>
历史热榜
2025-03-04
2025-03-03
2025-03-02
2025-03-01
2025-02-28
2025-02-27
2025-02-26
2025-02-25
2025-02-24
2025-02-23
2025-02-22
2025-02-21
2025-02-20
2025-02-19
2025-02-18
2025-02-17
2025-02-16
2025-02-15
2025-02-14
2025-02-13
2025-02-12
2025-02-11
2025-02-10
2025-02-09
2025-02-08
2025-02-07
2025-02-06
2025-02-05
2025-02-04
2025-02-03
2025-02-02
2025-02-01
2025-01-31
2025-01-30
2025-01-29
2025-01-28
2025-01-27
2025-01-26
2025-01-25
2025-01-24
2025-01-23
2025-01-22
2025-01-21
2025-01-20
2025-01-19
2025-01-18
2025-01-17
2025-01-16
2025-01-15