OpenClaw是一种能够持续运行的AI智能体,可调用多种大型语言模型,并可作为网关使用户通过聊天软件与之交互,它结合了Claude的对话能力与执行操作的功能。该程序可在Mac、Windows电脑或树莓派等本地设备上运行,其可运行于Mac、Windows、Linux本地电脑,并支持接入Anthropic、OpenAI或本地模型,通过Telegram、iMessage等通讯软件进行操作,用户可通过手机APP(如WhatsApp、Telegram、iMessage)发送文本指令,远程操控电脑执行安装软件、管理文件、发邮件等任务。
其在运行设备上具有访问shell和文件系统的权限,可以执行终端命令、编写并运行脚本或安装模块;当通过聊天软件接收到指令时,能够在后台调用终端、编写脚本或安装软件来执行任务。
OpenClaw具备记忆功能,可在不同会话间记录用户的工作习惯与项目细节。它可根据用户提供的API文档或操作逻辑更新其功能。用户可要求其添加新功能,程序能够完成相应的开发过程,能够开发新“Skills”,自主写代码、安装并开始工作。
OpenClaw的架构主要由四个部分构成。Gateway(网关)是核心组件,负责连接各类聊天平台并处理智能体与外部系统的交互。Agent(智能体)负责驱动思考过程,接入模型以处理上下文记忆与逻辑推理。Skills(技能)使其能够执行网页调研、浏览器自动化及访问邮箱等操作。Memory(记忆)负责将对话内容与用户偏好以文件形式保存。
从更高层次看,其架构由运行在用户电脑上的LLM驱动代理,以及连接多种通讯应用的“网关”系统两部分组成。作为典型的自主智能体,OpenClaw类应用通常需要超长上下文和高性价比的推理能力。要运行此类应用,需要一个高效且经济的大模型。此外,Agent通常需要借助提示词编排工具来组织思考流程;要处理大量的用户文件细节和历史操作,向量数据库可用于存储相关信息。当AI拥有删除文件、修改系统的高权限时,安全性是需要考虑的重要问题,因此Docker容器和各类安全沙箱技术常被采用,以确保AI在受控环境中运行,避免误操作。其所有设置、偏好和记忆以Markdown文档形式存储在本地文件夹中。
1、通过部署多台电脑和多个智能体,OpenClaw可以实现自动化处理邮件、阅读文档、编写代码、发布社交媒体内容及撰写报告等工作。例如,可控制智能家居设备、管理邮件账户等。
2、根据开发者分享的用例,OpenClaw能够处理更复杂的任务,例如比较多家汽车经销商的报价以辅助购车决策,以及自动发送邮件、跟踪回复、管理日常事务如取消邮件订阅或预订航班。用户可以通过自然聊天界面与AI协作,并且系统能记忆本地项目和偏好,主动提供简报或警报。
3、此类工具已被用于创建自动化运营的公司示例,通过结合不同的智能体角色实现全自动化运营。这类工具可用于远程开发与维护,例如执行代码调试任务。具体应用场景包括远程合并Pull Request、修复bug、在云平台上部署、进行实时价格比价、自动发送日常问候短信等。也能进行自动化的信息研究与代码验证,并生成分析报告。
4、可以通过编写本地脚本实现自动化流程,例如监控信息源并将任务同步到待办事项应用中。此类工具支持功能扩展,用户可为其配置新的模型或创建新的技能模块。它们也能通过设置本地定时任务来实现自动化流程。
5、这类工具可用于自动化购物流程,例如自动添加商品。其可以根据天气信息生成相应的购物清单。该工具也支持语音合成功能,并能整合日历、笔记等数据生成语音简报。可以实现智能交互匹配:语音请求用语音回复,文字请求用文字回复,并支持多语言语音合成。此外,可整合日历等应用的数据自动生成日报。
6、用户可通过这类工具调用本地部署的大语言模型以减少对云端服务的依赖。该工具也被用于执行市场调研与分析任务。
7、其记忆系统可基于本地文件,自动生成Markdown格式的日志来记录交互内容,这些文件可直接导入笔记应用或进行自动化处理。