首页  >  资讯  >  正文

Hermes Agent上线Mac控制功能:大幅压缩AI操作成本

时间: 2026-05-12 阅读: 114
欧易交易所
欧易交易所

全球三大交易所之一,注册领50 USDT数币盲盒!

本地AI智能体领域近日迎来一项颇具代表性的技术升级,Hermes Agent正式在macOS平台上线计算机控制能力,并通过新的上下文压缩机制显著降低模型调用成本。这一更新不仅在工程实现上对标同类产品的“后台操作”能力,也在资源优化层面给出了新的解法,被认为可能影响未来AI桌面代理的发展方向。

此次更新最受关注的,是其在Mac系统上的深度控制能力。Hermes Agent能够通过持续的屏幕截图理解当前操作环境,并在后台执行任务,例如搜索邮件、自动整理内容或辅助代码编写。与传统自动化工具不同,它在执行过程中不会抢占当前窗口焦点,鼠标指针也保持自然状态,从而实现“人类与AI在同一系统内并行工作”的体验,这一点对日常生产力场景尤其关键。

在技术实现层面,该系统接入了开源驱动cua-driver,并通过对苹果系统私有接口的调用实现进程级操作控制。换句话说,它并不是简单模拟键盘鼠标,而是直接与操作系统底层交互,从而获得更高精度的执行能力。值得注意的是,这种方式在效率提升的同时,也对稳定性与资源管理提出了更高要求。

真正的技术重点在于成本控制机制。由于计算机控制任务通常依赖连续截图进行环境理解,模型上下文会快速膨胀,进而导致token消耗飙升。Hermes Agent为此设计了一套四层上下文压缩策略,只保留最近三帧关键截图,并对历史画面进行动态清理和缓存裁剪,从源头减少无效信息输入。

一个明显变化是,在同样的操作密度下,其token使用量出现了数量级下降。官方给出的测试数据显示,在1568×900分辨率环境中连续执行20步操作时,传统模式可能消耗约60万token,而优化后的系统可以压缩至约3万token左右,成本降低接近95%。这意味着AI执行复杂桌面任务的经济门槛正在快速下降。

从行业角度来看,这一进展反映出一个正在形成的趋势:AI智能体正在从“能执行任务”转向“高效执行任务”。过去,计算机控制类AI往往受限于计算成本过高,难以在真实工作流中长期运行,而现在通过上下文优化与结构化压缩,运行成本正在被重新定义。

值得注意的是,这种优化不仅是工程层面的改进,也改变了智能体的设计思路。传统模型更依赖完整信息输入,而新一代系统则开始主动“遗忘”,通过筛选关键帧来维持认知效率。这种机制在一定程度上类似人类注意力机制,只关注当前任务所需的信息,从而避免资源浪费。

放在更广泛的AI生态中,这一变化并非孤例。无论是桌面自动化工具还是云端Agent系统,行业都在探索如何降低推理成本,以支撑更长时间、更复杂的任务执行。例如一些企业级AI助手已经开始采用分层记忆结构,将长期记忆与短期上下文分离,以减少重复计算。

同时,对操作系统级别的深度集成也正在成为新的竞争方向。相比传统基于API调用的工具,能够直接控制系统行为的智能体,在效率和灵活性上具有明显优势,但也对安全性提出更高要求。这类技术未来可能在企业自动化、开发辅助以及内容处理等场景中快速扩展。

整体来看,Hermes Agent此次更新不仅提升了macOS端的自动化能力,也在AI成本结构上提供了一种新的优化路径。它所展示的“低token消耗+高频操作能力”,或将成为下一代桌面智能体的重要参考方向。

从发展趋势来看,随着上下文压缩技术进一步成熟,以及系统级权限整合不断深入,AI在个人电脑上的角色可能会从辅助工具逐渐转变为常驻执行层。未来的竞争重点,或许不再只是模型能力本身,而是谁能用更低的成本完成更复杂的真实操作。

上一篇:黄金代币化项目落地阿布扎比:机构级RWA再扩展 下一篇:日本首个底地数字证券落地:三井物产推进RWA创新
币安
币安

币安,全球顶级数字货币交易平台,手机即可买卖BTC等!