MCP Windows 桌面自动化
使用 AutoIt 实现 Windows 桌面自动化的模型上下文协议 (MCP) 服务器。
概述
该项目提供了一个 TypeScript MCP 服务器,它包装了node-autoit-koffi包,允许 LLM 应用程序通过 MCP 协议自动执行 Windows 桌面任务。
服务器暴露:
- 工具:所有 AutoIt 功能均可作为 MCP 工具
- 资源:文件访问和屏幕截图功能
- 提示:常见自动化任务的模板
特征
- 将所有 AutoIt 功能完整包装为 MCP 工具
- 支持 stdio 和 WebSocket 传输
- 用于读取文件和目录的文件访问资源
- 用于捕获屏幕或特定窗口的屏幕截图资源
- 常见自动化任务的提示模板
- 严格遵循 TypeScript 类型
安装
# Clone the repository
git clone https://github.com/yourusername/mcp-windows-desktop-automation.git
cd mcp-windows-desktop-automation
# Install dependencies
npm install
# Build the project
npm run build
用法
启动服务器
# Start with stdio transport (default)
npm start
# Start with WebSocket transport
npm start -- --transport=websocket --port=3000
# Enable verbose logging
npm start -- --verbose
命令行选项
--transport=stdio|websocket
:指定传输协议(默认:stdio)--port=<number>
:指定 WebSocket 传输的端口(默认值:3000)--verbose
:启用详细日志记录
工具
该服务器提供以下工具:
- 鼠标操作:移动、点击、拖动等。
- 键盘操作:发送击键、剪贴板操作等。
- 窗口管理:查找、激活、关闭、调整窗口大小等。
- 控制操作:与 UI 控件、按钮、文本字段等进行交互。
- 进程管理:启动、停止和监控进程
- 系统操作:关机、休眠等。
资源
该服务器提供以下资源:
- 文件访问:读取文件和列出目录
- 截图:捕获屏幕或特定窗口
提示
服务器提供以下提示模板:
- 窗口交互:查找窗口并与之交互
- 表单填写:自动化表单填写任务
- 自动化任务:为重复任务创建脚本
- 监控:等待特定条件
发展
# Run in development mode
npm run dev
# Lint the code
npm run lint
# Run tests
npm run test
执照
麻省理工学院