16
2026
06

云开体育 年薪300万的前沿部署工程师,要被「录屏教养」替代了

发布日期:2026-06-16 12:25    点击次数:107

云开体育 年薪300万的前沿部署工程师,要被「录屏教养」替代了

机器之心发布

AI 正在学着操作电脑。

往常 AI 答谢问题,目下它平直开动帮你干活。填表格、录系统、整理文献,Anthropic 的 Claude Cowork、OpenAI 的 Codex 桌面版 —— 越来越多的 Agent 开动接受实在职责流。

但当扫数行业豪恣冲向桌面时,有一个问题被忽略了:AI 越来越会干活了,但凡俗东谈主该如何把我方的职责过程交给它?

目下主流 Agent 的逻辑是 “你写 Prompt → AI 奉行”,听起来合理,履行中却屡屡碰壁。

掀开里面系统、填表单、传附件、点提交…… 这些当作早已是职工的 “肌肉顾忌”,可要用笔墨描画明晰,大多数东谈主平直卡住。更别说跨系统跳转、条款分支,好多东谈主连 Prompt 从哪儿写起齐不知谈。

要是东谈主说不清过程,AI 还能学会吗?

故真理的是,为了处分这个贫窭,硅谷催出身了一个新管事 ——FDE(Forward Deployment Engineer,前沿部署工程师)。

他们驻场在客户公司,职责等于把业务东谈主员 “说不清” 的过程,翻译成 AI 能奉行的任务。他们既要懂工夫,又要熟悉实在的职责流。如今资深 FDE 的年薪中位数已高达 48.5 万好意思元。

FDE 的存在评释了一件事:让东谈主学会教 AI,其实莫得那么容易。

那要是能让 AI 我方学会清爽业务过程,而不是靠年薪数十万好意思元的工程师来翻译,会若何?

有东谈主给出了谜底。

不会写 Prompt?那就演示给 AI 看

由清华大学计较机系博士团队创立的非十科技,最近发布了一款桌面 Agent 家具 ———Agivar。

与多数家具试图优化 Prompt 不同,它聘请从另一个主义切入:让 AI 主动学惯用户的职责过程。

你不错把它清爽成一个会操作电脑的 “AI 职工”。

Agivar 的中枢才能叫作念 “录屏教养”,使用格式非常浅薄:掀开电脑录屏,像通俗职责一样把过程操作一遍。录制终端后,剩下的事情交给 AI。

听上去有点像早年的 “按键精灵”?但两者其实完全不同。

按键精灵记载的是坐标和当作 —— 鼠标转移到 (300,500) 点击,机械访佛;Agivar 学习的是任务和逻辑 —— 它不雅察你职责的每一步,然后清爽:为什么先掀开这个页面?为什么填这个数字?什么情况下跳过这一步?

Agivar 学到的不是 “下一步点那处”,而是你的职责顺次。它清爽的是过程背后的限定与判断逻辑,而不是单纯复现点击轨迹。即便界面改版、按钮移位,它依然能识别正确方针并奉行。

你训导它一次,它就能把这套过程自由、可追溯地奉行下去。

录屏三分钟,换回每天两小时

广东省某政务部门的职责主谈主员,每天齐要在里面系统处理大批表单。掀开系统→聘请业务类型→填写信息→上传附件→提交审批,每天相同的过程齐要访佛十几次。仅这一项职责,日常就要花掉一、两个小时。

这些系统莫得 API、莫得自动化接口,只可靠东谈主工点击。于是他尝试使用 Agivar。录制了一次完满过程,不到三分钟,尔后这套过程便兑现了自动奉行,无用再盯着屏幕慢慢操作。

录屏三分钟,换回每天两小时。

这么的场景远非个例。政务系统、企业 ERP、CRM、财务软件、里面 OA、采购系统…… 大批访佛、无 API、只高手工操作的过程,恰是成千上万凡俗职工的日常。实在蹧跶时候的从来不是复杂职责,而是那些让东谈主麻痹的访佛。

别的 Agent 还在念念考,Agivar 也曾作念罢了

要是你试用过一些桌面 Agent,可能会有一个直不雅感受:颖悟,但慢。

原因并不复杂。因为大多数家具是平直调用通用多模态大模子 “硬解” 桌面任务:截图→上传云霄→推理→复返→奉行,再截图→再推理……

对于桌面任务来说,这意味着大批与任务无关的才能也被带进了奉行过程,每次点击齐随同五秒以上蔓延。扫数过程像一个刚学会电脑的新东谈主。

而 Agivar 聘请了另一条门道。

米兰体育2026世界杯指定中国官网

团队针对桌面任务场景熟习了专用的奉行模子,强化了桌面操作的才能。在此基础上,谋略了 “大脑 + 小脑” 双层架构:

大模子(大脑):清爽录屏实质、拆罢黜务方针、权术奉行旅途、处理极端。

专用小模子(小脑):界面识别、鼠标点击、键盘输入、高频当作奉行。

这与东谈主类神经系统非常相似。当你开车时,不会每踩一次油门齐再行念念考交通限定。大脑认真门道权术,小脑认真具体当作。

撑捏这套架构的,是团队基于清华大学自研深度学习框架 Jittor(计图) 开采的推理引擎,针对高隐约、低蔓延场景的桌面任务场景,团队对模子调遣和奉行链路进行了专门优化,确保大小模子协同不恭候。

速率差距平直体目下数据上:

吞并台电脑奉行吞并个后台信息录入的任务,云开体育某主流家具耗时 2 分 12 秒,Agivar 仅 57 秒,速率普及一倍以上。

单个任务差一分钟,差距约略不显著。但当任务造成 100 份报销单、300 条客户信息,或者一天的批量审批时,分钟级差距很快被放大成小时级资本。

比速率更难的,是深信性

速率虽然垂死,但企业是否能让 Agent 走进坐褥环境,良善的不是快,而是稳。

大模子是概率系统。第一次点 A,第二次可能点 B,第三次换个按钮 —— 这在写诗时是创意,在财务录入、契约存档里却是风险。

AI 能否参加坐褥环境,拼的从来不是上限,而是下限。

为了处分深信性,Agivar 作念了三层谋略:

熟习管理。用海量桌面任务数据,强化 “界面气象→用户意图→奉活当作” 之间的自由映射,减少 “发散”。

多重校验。里面多个 Agent 交叉考证 —— 权术、奉行、不雅察、复核,不同扮装各司其职,每一步齐有东谈主问:“点对了吗?界面还在预期气象吗?”

限定管理。高频过程的关节操作节点、统共不成出错的当作,平直写成圭臬铁心的 “铁律”。奉行中枢设施时,系统会优先慑服预设旅途,不随意推崇。

最终方针只消一个:吞并任务访佛奉行,走相同旅途,得到相同闭幕。

毕竟,对于企业来说,坐褥环境不需要惊喜,只需要自由。

全栈自研,清华团队的硬核底牌

Agivar 的模子熟习到奉行框架,一谈由非十科技自研完成。团队的中枢成员来自清华大学计较机系,同期亦然清华自研的深度学习框架 Jittor(计图)的主要开采者。

Jittor 以其易用性和成果上风,早已成为国内主流深度学习框架之一,这意味着 Agivar 对底层推理调遣的优化,并非树立在第三方才能之上,而是具备从框架层到模子层的完满掌控才能。

Agivar 并非团队的第一个 “爆款”,此前团队推出的 AI 编程助手 Fitten Code,累计下载量向上 150 万,在多个主流插件平台评分第一。

同期领有大模子自研才能、深度学习框架研发才能以及百万级家具落地陶冶,这么的组合,在国表里同类赛谈中并未几见。

让每个东谈主齐领有我方的 “AI FDE”

往常两年,AI 行业追赶的是更大、更强的模子。但时候走到今天,一个更履行的问题浮出水面:

AI 到底能不成实在参加凡俗东谈主的职责流?

FDE 模式曾是谜底,但腾贵的资本让大多数东谈主望而生畏。

今天,Agivar 聘请了一条更朴素、也更普惠的旅途:把 “翻译” 和 “界说职责流” 的才能,交还给用户我方。无用祸害地学 Prompt,不必改造俗例。一次录屏演示,就能熟习属于我方的桌面 Agent。

目下,Agivar 已开启公测,支捏 Windows 与 macOS。录一遍,让 AI 替你干活。

下载地址请拜访:https://agivar.fittentech.com

从某种真理上说,“录屏教养” 实在改造的并不是交互格式,而是东谈主与 AI 之间的衔尾联系。

它让桌面 Agent 第一次有契机解脱复杂成立和专科门槛,实在参加凡俗东谈主的职责流。要是说往常的软件是在要求东谈主妥贴系统,那么下一代的 Agent 正在反过来妥贴东谈主。

而当每个东谈主齐领有一个能够清爽我方职责过程的 “AI FDE” 时,这场对于成果的变革,约略才刚刚开动。

© THE END

转载请关联本公众号赢得授权

投稿或寻求报谈:liyazhou@jiqizhixin.com云开体育



推荐资讯
热点资讯


Copyright © 1998-2026 云开体育2026世界杯中国官网入口™版权所有

yilisj.com备案号 备案号: 

技术支持:®开云直播 RSS地图 HTML地图