🔥热榜:2025-01-21

DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通过纯粹的强化学习(RL)训练的模型,展现出了惊人的推理能力。
特朗普2.0政府即将开启,科学界又将迎来「几家欢喜几家忧」的变动局面。AI与太空探索成最大赢家,环境气候科学或将再次被特朗普抛弃。
10:16  虎扑  分享图片
10:16  微博  麦琳回应补录
10:16  微博  特朗普币暴涨
10:16  微博  巴黎协定