ChatGPT官网

OpenAI发布全新智能代理Operator,引领AI技术革新

chatgpt2025-01-24 09:15:4553
OpenAI近日发布了一款名为Operator的智能代理工具,旨在通过自然语言交互帮助用户完成复杂的多步骤任务。Operator基于OpenAI的GPT模型,能够理解用户的指令并自动执行相关操作,如生成代码、查询数据库、发送邮件或管理文件等。该工具特别适用于开发者和企业用户,能够显著提升工作效率。Operator的亮点在于其灵活性和可定制性,用户可以通过简单的对话指导其完成任务,无需编写复杂的脚本或代码。Operator处于测试阶段,未来有望集成到更多工作流中,成为智能化办公的重要工具。

今天我们发布了Operator,这是一个可以代你在网络上执行任务的代理。它使用自己的浏览器,可以查看网页并通过打字、点击和滚动与之交互。目前这是一个研究预览版,意味着它有一些限制,并将根据用户反馈不断发展。Operator是我们首批代理之一,这些AI能够独立为你完成工作——你给它一个任务,它就会执行。

Operator可以处理各种重复性浏览器任务,如填写表格、订购杂货,甚至创建迷因。能够使用人类每天交互的相同界面和工具,扩大了AI的实用性,帮助人们节省日常任务的时间,同时为企业开辟了新的互动机会。

为确保安全和迭代推出,我们从小规模开始。从今天起,Operator将在Operator.chatgpt.com提供给美国的Pro用户。这个研究预览版让我们能够从用户和更广泛的生态系统中学习,并不断完善和改进。我们的计划是扩展到Plus、Team和Enterprise用户,并在未来将这些功能整合到ChatGPT中。

Operator由一个名为计算机使用代理(Computer-Using Agent,CUA)的新模型驱动。通过结合GPT-4o的视觉功能和通过强化学习的高级推理能力,CUA经过训练可以与图形用户界面(GUI)交互,包括屏幕上的按钮、菜单和文本框。

Operator可以通过截图"看"并使用鼠标和键盘允许的所有操作与浏览器"交互",使其能够在网络上采取行动,而无需定制API集成。

如果遇到挑战或犯错,Operator可以利用其推理能力进行自我纠正。当它陷入困境需要帮助时,会将控制权交还给用户,确保流畅的协作体验。

尽管CUA仍处于早期阶段并存在局限性,但它在WebArena和WebVoyager两个关键浏览器使用基准测试中创造了新的最先进的基准结果。

使用方法 开始时,只需描述你想完成的任务,Operator即可处理其余工作。用户可以随时接管远程浏览器的控制权,且Operator经过训练,会主动要求用户接管需要登录、支付详情或解决验证码的任务。

用户可以通过添加自定义指令来个性化Operator的工作流,可以针对所有网站或特定网站,如在Booking.com上设置航空公司偏好。Operator允许用户在主页保存提示以快速访问,非常适合重复任务,如在Instacart上补充杂货。类似于使用多个浏览器标签,用户可以通过创建新对话让Operator同时运行多个任务,比如在Etsy上订购个性化珐琅杯的同时在Hipcamp上预订露营地。

Operator将AI从被动工具转变为数字生态系统中的主动参与者。它将简化用户任务,并为希望提供创新客户体验和提高转化率的公司带来代理的好处。我们正与DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber等公司合作,确保Operator满足现实需求并遵守既定规范。除了这些合作,我们还看到在提高某些工作流的可访问性和效率方面有很大潜力,特别是在公共部门应用中。为了进一步探索这些用例,我们正与斯托克顿市合作,使城市服务和项目的报名更加便捷。

本文链接:https://www.rongxin.vip/openai_sora_645.html

OpenAIOperator

相关文章

网友评论