首页
热榜
诗歌
博客
美图
分享
好物
牛股
友站
互动
登录
注册
🔥热词:模型
今日头条
模型测算台湾被封锁能撑多久
钛媒体
中国首款全自研高性能RISC-V服务器芯片发布,专为DeepSeek等模型推理优化|钛媒体AGI
钛媒体
从大模型到智能体,组织需要关注什么?丨ToB产业观察
爱范
OpenAI 将推出新语言模型
昨日凌晨,OpenAI CEO Sam Altman 正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。 据 Altman 透露,这是自 GPT-2 以来 OpenAI 首次计划发布开放权重语言模型。他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位 ……
IT之家
苹果 iPhone 17 / Pro 系列模型机曝光:Air 之薄一目了然,全系支持 MagSafe
人人都是产品经理
地表最强,Gemini 2.5Pro发布!多模型对比实测到底如何?请看文章
Google近期发布的Gemini 2.5 Pro Experimental模型,以其卓越的性能和多模态处理能力,引发了业界的广泛关注。本文将详细介绍Gemini 2.5 Pro的关键特性,并通过与多个主流模型的对比实测,深入分析其在不同任务中的表现,探讨其是否真的能够成为“地表最强”的AI模型。
人人都是产品经理
推理大模型与普通大模型的区别是什么?
随着人工智能技术的飞速发展,大模型已经成为推动行业变革的重要力量。然而,普通大模型和推理大模型在设计目标、架构、训练方式以及应用场景上存在显著差异。本文将深入探讨这两种大模型的区别,分析它们在处理复杂问题时的不同表现,并展望未来可能出现的融合趋势,帮助读者更好地理解大模型技术的多样性和发展潜力。
人人都是产品经理
Tokens是啥?为啥大模型要按Tokens收费?
随着大模型的兴起,Token这种收费模式也逐渐被大家所接受。那么,为什么是这样收费呢?本文将深入解析Tokens的本质,探讨其在大模型中的作用,以及按Tokens收费的合理性、优势和未来趋势,供大家参考。
咖啡日报
万字长文 | 十个模型,总结产品经理沟通方法论
“大家好,我是阿境,人称产品界的吴彦祖,一个沉稳又不沉闷的男人。” 先问个问题 “作为一名产品经理,你真的懂得沟通吗?” 诶,先别急着回答,看完文章,再重新思考下这个问题。 产品经理在日常工作当中, 不夸张地说,沟通几乎是占据了40%的工作内容 ,与运营沟通,与开发沟通,与用户沟通,与领导沟通等。 学会如何更高效率地沟通,能够使事情事半功倍,也能够有效地推动产品项目的运转。 同时,我
掘金
在失业的这一个多月里,我写了一个3D模型场景编辑器
掘金
MCP:大模型落地的关键路径 —— 程序员的新机会
InfoQ
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线
InfoQ
端侧大模型的安全建设:如何在算力与保障之间找到平衡|QCon北京
InfoQ
拿20年前的苹果“古董”笔记本跑模型推理:九分之一现代CPU速度,但成功了!
51CTO
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
作者提出了CalibQuant,一种简单却高效的视觉KV cache量化策略,能够大幅降低显存和计算开销。
51CTO
2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
注于评估大模型数学能力的 MathArena 平台的研究人员,首次全面评估了模型解决复杂数学问题的完整推理和证明构建能力。
51CTO
震惊!用 Redis+AI 模型实现秒级实时风控,这波操作太秀了
兄弟们,有没有遇到过这种情况:凌晨三点在某东抢购显卡,刚提交订单就提示"系统繁忙",转头发现黄牛已经在海鲜市场挂出同款;扫码支付时突然弹出风险提示,非要验证人脸识别;更绝的是某银行APP,刚输完密码就收到短信提醒:"检测到您的账户存在异常操作"——但此时您根本没动过手机。
51CTO
大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
腾讯&苏州大学团队提出新框架RLVR,将强化学习训练扩展到医学、化学、法律、心理学、经济学等多学科。
51CTO
DAPO:面向开源大语言模型的解耦裁剪与动态采样策略优化系统
DAPO(解耦裁剪和动态采样策略优化,Decoupled Clip and Dynamic Sampling Policy Optimization)作为一个突破性的开源大语言模型强化学习系统应运而生,为该领域带来了技术变革。本文将系统分析DAPO的技术架构、算法创新及其对人工智能研究发展的长期影响。
51CTO
AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响
本文关注如何通过优化训练数据的数量、质量、语言分布等因素,以及改进评估方法,来提高开源语言模型在中文任务中的表现。
51CTO
深度解析:通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型
本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。
51CTO
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭
在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。
CSDN
数据挖掘实战-基于卷积神经网络CNN的口罩检测识别模型|91%准确率
CSDN
【AI 大模型】3D 生成大模型 ( 3D 模型建模 | 3D 生成大模型 | 多模态输入、输出 | 从 Hugging Face 中查找 3D 生成大模型 | openai/shap-e 大模型 )
博客园
ESP32-S3接入大模型API,对话AI
热榜热词
ai
关税
中国
2025
模型
特朗普
美国
产品
设计