Skip to main content
Glama

Computer Control MCP

by AB498

Computersteuerung MCP

MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.

  • Nur unter Windows getestet. Sollte auch auf anderen Plattformen funktionieren.

Demo zur MCP-Computersteuerung

Schnelle Verwendung (MCP-Setup mit uvx )

Hinweis: Beim ersten Ausführen uvx computer-control-mcp@latest werden Python-Abhängigkeiten (ca. 70 MB) heruntergeladen, was einige Zeit in Anspruch nehmen kann. Es wird empfohlen, dies in einem Terminal auszuführen, bevor Sie es als MCP verwenden. Nachfolgende Ausführungen erfolgen sofort.

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

ODER global mit pip installieren:

pip install computer-control-mcp

Führen Sie dann den Server mit folgendem Befehl aus:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Merkmale

  • Steuern Sie Mausbewegungen und Klicks
  • Geben Sie Text an der aktuellen Cursorposition ein
  • Machen Sie Screenshots des gesamten Bildschirms oder bestimmter Fenster mit optionalem Speichern im Download-Verzeichnis
  • Extrahieren Sie Text aus Screenshots mithilfe von OCR (Optical Character Recognition)
  • Fenster auflisten und aktivieren
  • Drücken Sie die Tastaturtasten
  • Drag-and-Drop-Vorgänge

Verfügbare Tools

Maussteuerung

  • click_screen(x: int, y: int) : Klicken Sie an den angegebenen Bildschirmkoordinaten
  • move_mouse(x: int, y: int) : Bewegen Sie den Mauszeiger zu den angegebenen Koordinaten
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : Maus von einer Position zur anderen ziehen

Tastatursteuerung

  • type_text(text: str) : Geben Sie den angegebenen Text an der aktuellen Cursorposition ein
  • press_key(key: str) : Drücken Sie eine angegebene Taste auf der Tastatur

Bildschirm- und Fensterverwaltung

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : Bildschirm oder Fenster mit optionaler OCR erfassen
  • get_screen_size() : Aktuelle Bildschirmauflösung abrufen
  • list_windows() : Listet alle geöffneten Fenster auf
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : Bringt das angegebene Fenster in den Vordergrund

Entwicklung

Einrichten der Entwicklungsumgebung

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Ausführen von Tests

python -m pytest

API-Referenz

Ausführliche Informationen zu den verfügbaren Funktionen und Klassen finden Sie in der API-Referenz .

Lizenz

MIT

Weitere Informationen oder Hilfe

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

MCP-Server, der Computersteuerungsfunktionen einschließlich Mausbewegungen, Tastaturaktionen, Screenshot-Erfassung mit OCR und Fensterverwaltung über eine einheitliche API bereitstellt.

  1. MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.
    1. Schnelle Verwendung (MCP-Setup mit uvx )
      1. Merkmale
        1. Verfügbare Tools
          1. Maussteuerung
          2. Tastatursteuerung
          3. Bildschirm- und Fensterverwaltung
        2. Entwicklung
          1. Einrichten der Entwicklungsumgebung
          2. Ausführen von Tests
        3. API-Referenz
          1. Lizenz
            1. Weitere Informationen oder Hilfe

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                8
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                26
                Python
                MIT License
                • Apple
                • Linux
              • A
                security
                A
                license
                A
                quality
                An MCP server providing web development tools such as screen capturing capabilities that let AI agents take and work with screenshots of the user's screen.
                Last updated -
                2
                678
                15
                MIT License
                • Apple
              • -
                security
                F
                license
                -
                quality
                An MCP server that allows users to interact with their browser through natural language commands, enabling actions like getting page content as markdown, modifying page styles, and searching browser history.
                Last updated -
                1
                TypeScript

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/AB498/computer-control-mcp'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server