Skip to main content
Glama

Computer Control MCP

by AB498

Компьютерное управление MCP

MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.

  • Протестировано только на Windows. Должно работать на других платформах.

Демонстрация управления компьютером MCP

Быстрое использование (настройка MCP с использованием uvx )

Примечание: запуск uvx computer-control-mcp@latest в первый раз загрузит зависимости python (около 70 МБ), что может занять некоторое время. Рекомендуется запустить это в терминале перед использованием его в качестве MCP. Последующие запуски будут мгновенными.

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

ИЛИ установите глобально с помощью pip :

pip install computer-control-mcp

Затем запустите сервер с помощью:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Функции

  • Управление движениями и щелчками мыши
  • Введите текст в текущей позиции курсора.
  • Делайте снимки экрана всего экрана или отдельных окон с возможностью сохранения в каталоге загрузок.
  • Извлечение текста из снимков экрана с помощью OCR (оптического распознавания символов)
  • Список и активация окон
  • Нажмите клавиши клавиатуры
  • Операции перетаскивания

Доступные инструменты

Управление мышью

  • click_screen(x: int, y: int) : Щелкните по указанным координатам экрана
  • move_mouse(x: int, y: int) : переместить курсор мыши в указанные координаты
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : перетаскивание мыши из одной позиции в другую

Управление с клавиатуры

  • type_text(text: str) : Введите указанный текст в текущей позиции курсора
  • press_key(key: str) : нажать указанную клавишу клавиатуры

Управление экраном и окном

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : захват экрана или окна с возможностью распознавания текста
  • get_screen_size() : Получить текущее разрешение экрана
  • list_windows() : Список всех открытых окон
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : вывести указанное окно на передний план

Разработка

Настройка среды разработки

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Проведение тестов

python -m pytest

Ссылка на API

Подробную информацию о доступных функциях и классах см. в справочнике API.

Лицензия

Массачусетский технологический институт

Для получения дополнительной информации или помощи

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Сервер MCP, который обеспечивает возможности управления компьютером, включая движения мыши, действия с клавиатурой, захват снимков экрана с помощью OCR и управление окнами через унифицированный API.

  1. MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.
    1. Быстрое использование (настройка MCP с использованием uvx )
      1. Функции
        1. Доступные инструменты
          1. Управление мышью
          2. Управление с клавиатуры
          3. Управление экраном и окном
        2. Разработка
          1. Настройка среды разработки
          2. Проведение тестов
        3. Ссылка на API
          1. Лицензия
            1. Для получения дополнительной информации или помощи

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                8
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                26
                Python
                MIT License
                • Apple
                • Linux
              • A
                security
                A
                license
                A
                quality
                An MCP server providing web development tools such as screen capturing capabilities that let AI agents take and work with screenshots of the user's screen.
                Last updated -
                2
                678
                15
                MIT License
                • Apple
              • -
                security
                F
                license
                -
                quality
                An MCP server that allows users to interact with their browser through natural language commands, enabling actions like getting page content as markdown, modifying page styles, and searching browser history.
                Last updated -
                1
                TypeScript

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/AB498/computer-control-mcp'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server