可自主帮人订餐购物,OpenAI首个AI智能体来了。
据界面,当地时间1月23日,OpenAI发布了首个AI智能Operator。据该公司CEO奥特曼介绍,这款智能体能像人类一样使用网页浏览器,并点击按钮、打字输入内容等,能自动完成预订旅行住宿、餐厅预约、在线购物等复杂任务。
不仅如此,系统还支持多任务并行处理,比如在某购物网站上订购搪瓷马克杯之时,也能同步在另一平台预定露营地。Operator支持个性定制,用户可为特定网页或全站添加自定义指令,并在主页保存,实现跨聊天窗口的多任务处理,如设置订机票时的首选航司等。
其技术原理主要由Computer-Using Agent(CUA)模型驱动,并结合了GPT-4o的视觉识别能力和基于强化学习的高级推理功能,使得Operator能 “看见” 网页,使用鼠标和键盘与网页互动。
目前,Operator研究预览版率先向订阅200美元Pro计划的美国用户开放,后续将逐步扩展至Plus、Team和 Enterprise级别用户。OpenAI表示,希望很快将Operator集成到其所有ChatGPT应用中。
尽管还谈不上完美,但“这款产品是我们进军智能体领域的开始。”奥特曼在直播中这样表示。
可以说,Operator是OpenAI向通用人工智能(AGI)目标迈进的重要一步,也将进一步增强该公司在AI领域的竞争力。但考虑到Operator在代替用户执行任务时可能需要输入敏感信息,如何避免潜在安全风险将成为重要问题。