🔥51CTO热榜:2025-03-10

掌握C#异步编程技术,深入理解await底层原理,并合理优化线程池配置,是应对高并发场景、避免系统崩溃的有效手段。
大模型运行框架的采用是项目独特需求和约束最密切相关的选择。在某些情况下,甚至可以同时使用: 用于快速成型和初始开发的Ollama ,以及用于扩展和优化生产环境的 vLLM。
分块能减少计算开销,增加检索相关信息的可能性,同时保持信息完整性。但也存在风险,如上下文丢失、冗余和不一致性。
选择性自我监督微调(Selective Self-to-Supervised Fine-Tuning,S3FT)是一种创新的大语言模型微调方法,该方法通过部署专门的语义等价性判断器来识别训练集中模型自身生成的正确响应。
AI竟能精准模拟博士生资格考试?只需将评委的履历和论文输入ChatGPT,就能创建数字形象,模拟面试问题,顺利通过考试。
通过系统化的故障处理与架构优化,Kubernetes集群的稳定性达到99.99% SLA,支撑了后续多次大促活动。
开源微调神器Unsloth带着黑科技又来了:短短两周后,再次优化DeepSeek-R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1/10!
AI智能体领域Type-C来了!Manus及其开源复现诞生,一夜捧红了MCP,工具调用/访问外部数据,一个协议就够了。
秒杀系统优化最核心的优化思路是:尽量将请求拦截在系统的上游,而不要压到库存数据。
西湖大学 AGI 实验室 提出了一种可进化的 GUI 智能体框架 ——AppAgent X。
机器人训练,苦数据难久矣。一方面是认知维度的数据:互联网上海量的文本和图片数据,帮助机器人建立基础认知,理解世界是什么样的。
不论是起跑、跑步过程以及停跑,各个关节的协调几乎是没有了“机器人味儿”。
实验遵循原始思维链论文,评估3类任务:算术推理、常识推理和符号推理。
为了厘清这些模型还有它们的各种版本,官方直接给做它们了一套“身份卡”。每个模型“身份卡”都包含了能力、速度、支持模态、价格等信息,并且以图示+简单文本的形式呈现,既简洁又清晰。
当一些美国公务员兴高采烈用马斯克的GSAi政务机器人提高办公效率时,很多人没有意识到这个机器人的目标是替代他们,而不是仅仅作为打杂的“实习生助手”。
jsonschema 是一个强大的库,用于验证 JSON 数据是否符合特定的模式(Schema)。在实际应用中,你可能会遇到更复杂的 JSON 结构和验证需求。下面我将详细介绍 jsonschema 的一些高级用法,包括复杂的数据结构、自定义验证器以及如何处理嵌套的 JSON 对象。
自主式AI正重塑商业世界,企业需适应新环境。三种策略助企业应对:传统营销、匹配消费者AI偏好、企业AI与消费者AI动态谈判。
本文我们通过使用 Redis 的有序集合,实现了一个简单的排行榜系统,另外,我们还延伸了有序集合更多的高级用法以及需要注意的事项。
Transformers 是一种基于自注意力机制的架构,主要架构由左侧的编码器(Encoder)和右侧的解码器(Decoder)构成。本次我们主要来看解码器如何工作。
具体来说,ReRanker模型在RAG Pipeline中扮演着第二阶段的角色,即在初始检索步骤之后,对检索出的文档块chunks进行重新排序,以确保相关的文档块优先被传递给LLM进行处理。