Manus前阵子爆火虽然褒贬不一,但是无形中也证明一个事实,那就是AI智能体一定是未来重要的AI应用场景!字节也不甘示弱,近期发布了一个开源的多模态AI Agent:Tars !
它的功能十分强大,可以进行联网搜索、浏览器操作、还能操作命令行、管理文件!下面是官方视频介绍
它能够通过视觉解析网页来执行复杂的浏览器操作,还支持最近十分火热的MCP技术!极大的拓展了能力边界的上限!TARS能做什么?
在功能特性方面,Agent TARS 表现十分亮眼。
在浏览器操作上,借助先进的代理框架,它能执行深度研究、操作功能等复杂任务,实现全面的规划与执行。
无论是在海量信息中精准筛选,还是完成特定的网页交互任务,Agent TARS 都能应对自如。
在工具支持上,它集成了搜索、文件编辑、命令行以及模型上下文协议(MCP)工具,轻松处理复杂的工作流程。用户可以在不同工具间灵活切换,提高工作效率。
在桌面应用上,Agent TARS 的桌面应用焕然一新。全新的 UI 设计,融合了浏览器显示、多模态元素、会话管理、模型配置、对话流可视化以及浏览器 / 搜索状态跟踪等功能。
用户能够更直观地与 AI 代理进行交互,实时掌握操作进展。在工作流编排上,它能将 GUI 代理工具(如搜索、浏览、探索链接等)无缝连接,并将信息整合为最终输出,为用户打造连贯高效的工作流程。
此外,它还为开发者提供了友好的框架,便于与 UI - TARS 集成,助力开发者创建自定义的 GUI 代理项目工作流。
如何使用?
想要体验 Agent TARS 的用户,可以从项目的发布页面下载最新版本。
地址:
https://github.com/bytedance/UI-TARS-desktop/releases
如果安装了 Homebrew,可以克隆项目自行运行安装。
brew install --cask agent-tars
项目主页:
https://agent-tars.com/
好了,今天的内容就分享到这里希望你喜欢!欢迎关注、点赞和分享!