🔥热词:ai

4.8万亿美元,联合国预计2033年AI市场规模将比肩德国经济。

据央视,当地时间4月3日,联合国贸发会议发布《2025年技术与创新报告》。报告指出,2033年人工智能市场规模预计将达到4.8万亿美元,大约相当于德国经济的规模,其收益仍然高度集中,人工智能成为数字化转型的重要力量。

报告称,人工智能基础设施和专业知识的获取仍然集中在少数几个经济体,仅100家公司(主要在美国和中国)就占了全球企业研发支出的40%。人工智能可以成为推动进步的有力工具。但目前不到三分之一的发展中国家制定了人工智能战略,各国应立即采取行动,通过投资数字基础设施、建设能力和加强人工智能治理,以利用人工智能潜力实现可持续发展。
前段时间上手了全新的三星 Galaxy S25,主编们让我着重体验一下这台手机著名的 AI 功能,于是我把它当作主力机来使用,换掉了手上这台和 AI 毫无关系的 iPhone 15。 先不谈 Galaxy AI 好用与否,在体验的过程中,另一个想法也渐渐在我内心成型:目前用户和手机的交互,似乎还没有一个能很好容纳 AI 的 ……
OpenAI CEO:因算力容量问题,新产品或推迟 昨晚,OpenAI CEO Sam Altman 发文透露,近期因 GPT-4o 的图像生成器爆火,导致公司的算力容量不足,从而或将影响新产品发布的节奏,而 Altman 并未在文中明确新产品是什么;其还表示,目前 ChatGPT 的服务有时会产生速度变慢的情况。 Altman 还表示,团队 ……
昨日凌晨,OpenAI CEO Sam Altman 正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。 据 Altman 透露,这是自 GPT-2 以来 OpenAI 首次计划发布开放权重语言模型。他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位 ……
苹果「AI 医生」曝光:Apple Watch 问诊,iPhone 摄像头当私教 彭博社最新爆料,苹果正在大改旗下的健康 App,并且正在开发一个「AI 医生」。#苹果开发AI医生# 这个计划代号 Project Mulberry,主要的想法如下:健康 App 将继续从用户的各种设备,包括 iPhone、Apple Watch、耳机中收集健康数据, ……
AI 已经大大降低了编程的门槛,它不再是遥不可及的技能,而是一座通往创意实现的桥梁。如果你有想法,那就勇敢去实践吧!
「哲学家只是以不同的方式解释世界。但关键是要改变它。」跑马灯再一次出现在我们的视野中,或许预示着属于新地球的黄金时代。在我们的睡梦中,跳动的 0 和 1 就是改变的开始。
Matrix首页推荐Matrix是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选Matrix最优质的文章,展示来自用户的最真实的体验和观点。文章代表作者个人观点 ...
AI热潮席卷全球,中国AI市场的商业模式正逐渐浮出水面。其中,AI卖课这一看似不起眼的领域,却意外地成为了AI行业中最赚钱的生意之一。本文将深入剖析AI卖课的商业模式,探讨其背后的盈利逻辑、营销套路,以及这一现象背后反映出的用户焦虑和行业乱象,带你一窥AI卖课背后的真相。
朱啸虎近期提出“AI应用没有壁垒”的观点,引发了广泛的关注。本文深入探讨了这一观点背后的逻辑,分析了为什么在AI时代,技术本身难以成为企业的护城河。
最近,瑞幸的AI排班系统引发了广泛关注,该系统通过分析历史销售数据和员工人效,自动预测出杯量并安排相应的人手,旨在提高门店效率和降低成本。本文深入探讨了瑞幸AI排班系统的底层逻辑、实际应用效果以及对线下门店运营的启示。
人人都是产品经理   我用AI做爆款,一条视频点赞300W
从“古人复活潮”到“宠物+AI”的奇幻故事,再到AI生成的数字人带货视频,AI不仅让创作者轻松打造出爆款内容,还极大地降低了制作成本和门槛。然而,随着AI短视频的迅速走红,内容同质化、伦理问题等挑战也逐渐浮现。
人人都是产品经理   这个外星人挺适合做AI伴侣!
随着AI技术的飞速发展,人工智能已逐渐融入我们的生活,成为一种全新的社交和情感陪伴方式。本文将探讨一款独特的AI社交应用——Tolan。它通过“外星人”聊天伙伴的创意设定,为用户带来了全新的互动体验。
随着人工智能技术的飞速发展,AI辅助网文创作已经成为一种常见的创作方式。然而,面对众多的AI工具,网文作者们常常面临选择的困惑:是使用通用的AI Chat,还是选择专业的AI写作软件?本文通过深入分析,探讨了AI写作软件相较于AI Chat的核心优势,供大家参考。
MCP(模型上下文协议)如同一座桥梁,连接起了AI与数据的两端,让复杂的AI交互变得更加高效、可靠和智能。本文将深入探讨MCP的核心价值、工作原理以及它如何改变人机协作的未来,帮助读者快速理解为什么MCP在当下如此受到关注。
从批量处理文件、深度调研分析到复杂任务的自主规划与执行,Manus似乎真的能成为人类的得力助手。本文将通过50个实际用例和深度拆解,带你全面了解Manus的技术亮点、应用场景以及它背后的团队故事,探索这款“中国造”AI产品是否真的能开启通用智能体的新时代。
OpenAI推出的“一句话P图”功能,凭借其强大的自然语言处理和深度学习技术,让用户只需通过简单的文字指令即可完成复杂的图像编辑任务。然而,这项技术的出现也引发了人们对于设计师职业未来的担忧。本文将深入探讨OpenAI“一句话P图”功能的技术原理、应用场景以及其潜在的技术短板,分析它是否真的会威胁到设计师的岗位,以及设计师如何应对这一新的技术挑战。
本文深度解析了AI顾问如何通过技术与管理双重能力,为企业定制智能解决方案。
近日,贾佳亚团队提出 MoTCoder(Module-of-Thought Coder),通过创新的模块化思维指令微调(MoT Instruction Tuning),显著提升了模型在复杂编程任务中的准确率与可维护性。
大模型遇到了严峻瓶颈。 参数膨胀效益递减,幻觉问题依旧。在这关键节点,有个核心技术正在成为破局者——向量数据库。
智能体在评估中需要复刻来自ICML 2024的论文,任务包括理解论文、编写代码和执行实验。
在三方图灵测试中,UCSD的研究人员评估了当前的AI模型,证明LLM已通过图灵测试。
来自 NUS 的团队提出了 Impossible Videos 概念,即那些违背物理、生命、地理或社会常识的视频,并构建了 IPV-BENCH,一个全新的基准,用于评测 AI 模型在 “反现实” 视频生成与理解方面的极限能力。
港理工、新加坡国立团队推出VideoMind框架,核心创新在于角色化推理(Role-based Reasoning)和链式LoRA(Chain-of-LoRA)策略。
兄弟们,有没有遇到过这种情况:凌晨三点在某东抢购显卡,刚提交订单就提示"系统繁忙",转头发现黄牛已经在海鲜市场挂出同款;扫码支付时突然弹出风险提示,非要验证人脸识别;更绝的是某银行APP,刚输完密码就收到短信提醒:"检测到您的账户存在异常操作"——但此时您根本没动过手机。
微软已向所有受影响的引导程序维护者披露了这些漏洞,并合作开发修复程序。博客补充说,安全更新已于2025年2月中旬发布,GRUB2补丁于2月18日提供,U-boot和Barebox补丁于2月19日发布。
更值得称谓的是,21st.dev 的功能设计真正做到了 AI 友好,能够很好地应用在各类 AI 工具中(cursor、v0.dev、bolt.new、cline 等等),并且这套设计逻辑还非常适合复用到各种 TO-D 场景中,
KeepHQ 是一个变革性的开源 AIOps 平台,为 DevOps 和 SRE 团队民主化了高级警报管理和自动化。通过减少噪音、丰富警报和自动化响应,Keep 帮助组织将数据转化为可操作的见解,促进协作和可扩展性,适合各种环境。
Model Context Protocol(MCP)模型上下文协议是一种标准化协议,它让大模型能够更容易地和外部的数据、工具连接起来。你可以把MCP想象成一个通用的插头或者接口,就像USB-C一样,不管是什么设备,只要插上这个接口,就能和电脑、充电器等连接起来。
CLIP和SigLIP代表了多模态人工智能研究的重要里程碑,使计算机系统能够以前所未有的方式理解和关联视觉与文本信息。
本文关注如何通过优化训练数据的数量、质量、语言分布等因素,以及改进评估方法,来提高开源语言模型在中文任务中的表现。
本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。
小型语言模型 (SLM) 在效率、隐私和适应性之间实现了出色的平衡,使其成为各种应用的理想选择。在医疗保健领域,快速的设备上症状诊断也可能成为远程医疗(一个新兴的医疗保健子领域)的差异化因素。
在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。
今天凌晨1点,OpenAI进行了技术直播发布了三款全新语音模型,专用于开发语音AI Agent。 两个是语音转文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一个是文本转语音模型GPT-40 Mini TTS。OpenAI还特意开发了一个新网站来展示新功能。 值得一提的是,开发者可以控制GPT-40 Mini TTS模型的语音情绪和风格,包括兴奋、平静、鼓励、严肃、热闹等,这对于搭建不同业务场景的智能体非常有用。 例如,在教育场景中,Agent可以用鼓励的语气激励学生;在客服场景中,Agent可以用温和、耐心的语气解答用户问题。 API地址:https://platform.openai.com/docs/guides/audio 展示地址:https://www.openai.fm/ 三款语音模型简单介绍 GPT-40 Transcribe是高性能版本,基于最新的语音模型架构,经过海量音频数据的训练,能够处理复杂的语音信号并将其准确地转换为文本。其训练数据量达到了前所未有的规模,涵盖了多种语言和方言,使得它在不同语言环境下的转录任务中表现出色。 GPT-4 Mini Transcribe则是在保持较高转录性能的同时,通过模型压缩技术,将模型大小大幅减小,从而提高了运行速度并降低了资源消耗。这种设计使得它更适合在资源受限的设备上运行,例如,移动设备或嵌入式系统,同时也能满足实时性要求较高的应用场景。 在性能方面,这两款语音模型相比上一代OpenAI的Whisper模型有了明显提升,能够更精准地捕捉语音中的细微差别,减少转录错误。测试结果显示,最新语音模型的词错误率大幅降低,也比同类的模型更好。 GPT-40 Mini TTS模型不仅能够将文本内容转换为自然流畅的语音,还允许开发者通过指令控制语音的语调、情感和风格。使得语音Agent能够根据不同的情境和用户需求,调整语音的表达方式,从而更好地传达信息和情感。 GPT-40 Mini TTS模型采用了先进的语音合成技术,能够生成高质量的语音输出。它通过模拟人类的发声机制和语音特征,使合成语音听起来更加自然、逼真。 这使得语音Agent在与用户交流时,能够提供更加亲切、生动的语音体验,增强用户的参与感和满意度。该模型也支持多种语言,并且能够生成不同性别、年龄和口音的语音,能够适应不同地区、不同文化背景的用户需求,提供更加个性化的语音服务。 OpenAI为语音转文本API增添了强大的streaming模式,允许开发者将连续的音频流实时输入模型,模型也能实时返回连续的文本和响应,这种实时交互的特性对于需要即时反馈的应用场景,例如,实时语音对话系统、语音会议转写等,帮助非常大。 而API 集成的噪声消除技术和语义语音活动检测器进一步优化了语音转文本的体验。噪声消除技术能有效过滤掉背景噪音,使模型专注于用户的语音内容; 语义语音活动检测器则可根据模型对用户说话结束的判断,对音频进行合理分块处理,避免处理不完整的语音信息,让开发者无需再为处理复杂的语音数据而烦恼,能够更专注于上层应用的开发。 刚刚,OpenAI首发语音Agent,智能体实现重大突破