首页
热榜
诗歌
博客
美图
分享
好物
牛股
友站
互动
登录
注册
🔥热榜:2025-02-10
14:43
51CTO
推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等
提出推理时偏好优化(TPO)方法,通过在推理过程中与奖励模型交互,将奖励模型信号转化为”文本损失”和”文本梯度”,以此迭代优化模型输出。
14:43
51CTO
如何优化测试时计算?解决「元强化学习」问题
在这篇文章中,我们将讨论这样一种方法:通过改变 LLM 训练目标,我们可以重用现有数据以及更多的测试时计算来训练模型以做得更好。
14:43
51CTO
Nature:离 “量子互联网” 又近一步!牛津大学证实分布式量子计算可行性
这项研究给各种物理平台的大规模量子计算提供了可行的途径,并为量子互联网打下了基础。
14:43
51CTO
DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配
DeepSeek的影响力已不仅限于AI和互联网,正在往产业更深层进发。
14:43
51CTO
AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害
以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类,但能否像人类一样有痛苦、快乐这样的感知呢?近日,谷歌团队和LSE发表了一项研究,他们发现,LLM能够做出避免痛苦的权衡选择,这也许是实现「有意识AI」的第一步。
14:43
51CTO
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
VideoJAM在处理运动场景时,不仅视觉上效果更好,也更加贴合物理规律。
14:43
51CTO
LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
本研究提出了一种创新的自回归搜索方法,通过两阶段训练框架,小规模格式调优和大规模自我优化,开发出了Satori,一个在数学推理和跨领域任务中均表现优异的7B参数模型。Satori通过自我反思和探索策略,展现了强大的迁移能力和自我纠错能力。
14:43
51CTO
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步
xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑,认为其并未带来实质性的科学突破。AI大佬纷纷泼冷水,到底是技术讨论还是各怀目的?
14:43
51CTO
紧急呼叫号码可视化报警,到底采用了什么通信技术?
今天这篇文章,小枣君就和大家深度解读一下,报警电话背后的技术原理。那么,你知道这些号码的背后,是什么样的通信技术在提供支持吗?拨打这些号码,和拨打普通的电话号码,又有什么区别呢?
14:43
CSDN
深度探索云教程 | 蓝耘元生代智算云VSCode使用教程
14:43
CSDN
数据库高安全—数据保护:数据动态脱敏
14:43
CSDN
阿里云百炼初探DeepSeek模型调用
14:43
CSDN
[免费]Springboot+Vue(带推荐算法)网上购物商城系统【论文+源码+SQL脚本】
14:43
博客园
本地搭建DeepSeek和知识库 Dify做智能体Agent(推荐)
14:44
百度贴吧
索尼针对PSN宕机出补偿措施
14:44
虎扑
哪吒2之魔童闹海里面敖闰造型,这波什么水平?
14:44
虎扑
一分钟教会你部署deepseek到office,WPS也适用。
14:44
虎扑
安徽一县委书记吴忠梅:觉得公务员很安稳是吧?
14:44
抖音
张国伟复出夺冠
14:44
抖音
中老铁路跨境客货运输实现开门红
<
1
93
94
95
96
97
98
99
173
>
历史热榜
2025-02-09
2025-02-08
2025-02-07
2025-02-06
2025-02-05
2025-02-04
2025-02-03
2025-02-02
2025-02-01
2025-01-31
2025-01-30
2025-01-29
2025-01-28
2025-01-27
2025-01-26
2025-01-25
2025-01-24
2025-01-23
2025-01-22
2025-01-21
2025-01-20
2025-01-19
2025-01-18
2025-01-17
2025-01-16
2025-01-15
2025-01-14
2025-01-13
2025-01-12
2025-01-11