Skip to main content
Glama

đŸȘ„ ImageSorcery MCP

đŸȘ„ ImageSorcery MCP

ComputerVision-basierte đŸȘ„ Zauberei der Bilderkennungs- und Bearbeitungstools fĂŒr KI-Assistenten

❌ Ohne ImageSorcery MCP

Bei der Arbeit mit Bildern sind KI-Assistenten eingeschrÀnkt:

  • ❌ Bilder können nicht direkt geĂ€ndert oder analysiert werden
  • ❌ Keine Möglichkeit zum Zuschneiden, Ändern der GrĂ¶ĂŸe oder Verarbeiten von Bildern
  • ❌ Einige LLMs können keine Objekte erkennen oder Text aus Bildern extrahieren
  • ❌ BeschrĂ€nkt auf verbale Beschreibungen ohne visuelle Manipulation

✅ Mit ImageSorcery MCP

đŸȘ„ ImageSorcery stattet KI-Assistenten mit leistungsstarken Bildverarbeitungsfunktionen aus:

  • ✅ Bilder prĂ€zise zuschneiden, skalieren und drehen
  • ✅ Zeichnen Sie Text und Formen auf Bilder
  • ✅ Erkennen Sie Objekte mit modernsten Modellen
  • ✅ Extrahieren Sie Text aus Bildern mit OCR
  • ✅ Erhalten Sie detaillierte Bildmetadaten
  • ✅ Nutzen Sie eine breite Palette vortrainierter Modelle fĂŒr Objekterkennung, OCR und mehr

Bitten Sie Ihre KI einfach um Hilfe bei Bildaufgaben:

"Fotos mit Haustieren aus dem Ordner photos " in den Ordner pets " kopieren"Haustiere kopieren

„Suchen Sie eine Katze im Foto.jpg und schneiden Sie das Bild in der Höhe und Breite auf die HĂ€lfte zu, damit die Katze zentriert wird.“Zentrierende Katze 😉 Tipp: Verwenden Sie den vollstĂ€ndigen Pfad zu Ihren Dateien".

„Nummerieren Sie die Formularfelder in diesem form.jpg mit dem Modell foduucom/web-form-ui-field-detection und fĂŒllen Sie die form.md mit einer Liste der beschriebenen Felder.“Formularfelder nummerieren 😉 Tipp: Geben Sie das Modell und die Konfidenz an.

😉 Tipp: FĂŒgen Sie „Use Imagesorcery“ hinzu, um sicherzustellen, dass das richtige Tool verwendet wird.

Ihr Tool kombiniert mehrere der unten aufgefĂŒhrten Tools, um Ihr Ziel zu erreichen.

đŸ› ïž VerfĂŒgbare Tools

WerkzeugBeschreibungBeispiel-Eingabeaufforderung
cropBeschneidet ein Bild mit dem NumPy-Slicing-Ansatz von OpenCV„Beschneide mein Bild ‚input.png‘ von den Koordinaten (10,10) bis (200,200) und speichere es als ‚cropped.png‘.“
resizeÄndert die GrĂ¶ĂŸe eines Bildes mit OpenCV„Ändern Sie die GrĂ¶ĂŸe meines Bilds ‚photo.jpg‘ auf 800 x 600 Pixel und speichern Sie es als ‚resized_photo.jpg‘.“
rotateDreht ein Bild mit der Funktion imutils.rotate_bound„Drehe mein Bild ‚photo.jpg‘ um 45 Grad und speichere es als ‚rotated_photo.jpg‘“
draw_textsZeichnet mit OpenCV Text auf ein Bild„FĂŒgen Sie den Text ‚Hello World‘ an Position (50,50) und ‚Copyright 2023‘ in der unteren rechten Ecke meines Bildes ‚photo.jpg‘ hinzu.“
draw_rectanglesZeichnet mit OpenCV Rechtecke auf ein Bild„Zeichnen Sie auf meinem Bild ‚photo.jpg‘ ein rotes Rechteck von (50,50) bis (150,100) und ein ausgefĂŒlltes blaues Rechteck von (200,150) bis (300,250)“
get_metainfoRuft Metadateninformationen zu einer Bilddatei ab„Metadateninformationen zu meinem Bild ‚photo.jpg‘ abrufen“
detectErkennt Objekte in einem Bild mithilfe von Modellen von Ultralytics„Erkenne Objekte in meinem Bild ‚photo.jpg‘ mit einer Konfidenzschwelle von 0,4“
findFindet Objekte in einem Bild basierend auf einer Textbeschreibung„Finde alle Hunde in meinem Bild ‚photo.jpg‘ mit einer Konfidenzschwelle von 0,4“
get_modelsListet alle verfĂŒgbaren Modelle im Modellverzeichnis auf"Alle verfĂŒgbaren Modelle im Modellverzeichnis auflisten"
ocrFĂŒhrt optische Zeichenerkennung (OCR) auf einem Bild mit EasyOCR durch„Extrahieren Sie Text aus meinem Bild ‚document.jpg‘ mit OCR in englischer Sprache.“

😉 Hinweis: Detaillierte Informationen und Verwendungsanweisungen fĂŒr jedes Tool finden Sie in der /src/imagesorcery_mcp/tools/README.md des Tools.

🚀 Erste Schritte

Anforderungen

  • Python 3.10 oder höher
  • Claude.app , Cline oder ein anderer MCP-Client

Installation

ImageSorcery-Demo

1. Load MCP documentation if you have the tool for it. It will give you path to *MCP-configuration file* and other needed instructions. 2. Run command `python -m venv imagesorcery-mcp` 3. Run command `source imagesorcery-mcp/bin/activate` For windows bash run command `source imagesorcery-mcp/Scripts/activate` For windows cmd run command `imagesorcery-mcp\Scripts\activate` 4. Run command `pip install imagesorcery-mcp` 5. Run command `imagesorcery-mcp --post-install` 6. Create or modify *MCP-configuration file*. 7. Add the `imagesorcery-mcp` server configuration to the `mcpServers` object in the *MCP-configuration file* `"imagesorcery-mcp": {"command": "/full/path/to/venv/bin/imagesorcery-mcp","timeout": 100}` 8. Get available models using `get_models` tool from `imagesorcery-mcp` 9. Attempt completion, indicating that the installation and configuration are complete.
  1. Erstellen und aktivieren Sie eine virtuelle Umgebung (dringend empfohlen): FĂŒr eine zuverlĂ€ssige Installation aller Komponenten, insbesondere des clip Pakets (installiert ĂŒber das Post-Install-Skript), wird dringend empfohlen, das in Python integrierte venv Modul anstelle von uv venv zu verwenden .
    python -m venv imagesorcery-mcp source imagesorcery-mcp/bin/activate # For Linux/macOS # source imagesorcery-mcp\Scripts\activate # For Windows
  2. Installieren Sie das Paket in der aktivierten virtuellen Umgebung: Sie können pip oder uv pip verwenden.
    pip install imagesorcery-mcp # OR, if you prefer using uv for installation into the venv: # uv pip install imagesorcery-mcp
  3. FĂŒhren Sie das Post-Installationsskript aus: Dieser Schritt ist entscheidend. Es lĂ€dt die erforderlichen Modelle herunter und versucht, das clip Python-Paket von GitHub in der aktiven virtuellen Umgebung zu installieren.
    imagesorcery-mcp --post-install
  • Erstellt ein models (normalerweise im Site-Packages-Verzeichnis Ihrer virtuellen Umgebung oder an einem benutzerspezifischen Speicherort bei globaler Installation), um vortrainierte Modelle zu speichern.
  • Generiert dort eine erste Datei models/model_descriptions.json .
  • LĂ€dt die vom detect benötigten Standard-YOLO-Modelle ( yoloe-11l-seg-pf.pt , yoloe-11s-seg-pf.pt , yoloe-11l-seg.pt , yoloe-11s-seg.pt ) in dieses models herunter.
  • Versucht, das Python-Paket „ clip “ aus dem GitHub-Repository von Ultralytics direkt in die aktive Python-Umgebung zu installieren . Dies ist fĂŒr die Texteingabefunktion im find erforderlich.
  • LĂ€dt die vom find benötigte CLIP-Modelldatei in das models herunter.

Sie können diesen Vorgang jederzeit ausfĂŒhren, um die Standardmodelle wiederherzustellen und clip Installation zu versuchen.

  • Verwenden von uv venv zum Erstellen virtueller Umgebungen: Tests haben gezeigt, dass mit uv venv erstellte virtuelle Umgebungen pip möglicherweise nicht so enthalten, dass das Skript imagesorcery-mcp --post-install das clip Paket von GitHub automatisch installieren kann (wĂ€hrend der clip -Installation kann die Fehlermeldung „Kein Modul mit dem Namen pip“ auftreten). Wenn Sie uv venv verwenden:
    1. Erstellen und aktivieren Sie Ihr uv venv .
    2. Installieren Sie imagesorcery-mcp : uv pip install imagesorcery-mcp .
    3. Installieren Sie das clip -Paket manuell in Ihrem aktiven uv venv :
      uv pip install git+https://github.com/ultralytics/CLIP.git
    4. FĂŒhren Sie imagesorcery-mcp --post-install aus. Dadurch werden Modelle heruntergeladen, die Installation des Python-Pakets fĂŒr den clip schlĂ€gt jedoch möglicherweise fehl. FĂŒr eine reibungslosere automatisierte clip -Installation ĂŒber das Post-Install-Skript empfiehlt sich die Verwendung python -m venv (wie in Schritt 1 oben beschrieben) zum Erstellen der virtuellen Umgebung.
  • Verwenden von uvx imagesorcery-mcp --post-install : Wenn Sie das Post-Installationsskript direkt mit uvx ausfĂŒhren (z. B. uvx imagesorcery-mcp --post-install ), schlĂ€gt die Installation des Python-Pakets clip wahrscheinlich fehl. Dies liegt daran, dass die von uvx erstellte temporĂ€re Umgebung normalerweise kein pip in einer vom Skript nutzbaren Weise zur VerfĂŒgung stellt. Modelle werden heruntergeladen, aber das clip Paket wird durch diesen Befehl nicht installiert. Wenn Sie uvx zum AusfĂŒhren des Hauptservers von imagesorcery-mcp verwenden möchten und clip FunktionalitĂ€t benötigen, mĂŒssen Sie sicherstellen, dass das clip Paket in einer zugĂ€nglichen Python-Umgebung installiert ist, die uvx finden kann, oder erwĂ€gen Sie die Installation imagesorcery-mcp in einer persistenten Umgebung, die mit python -m venv erstellt wurde.

⚙ Konfiguration MCP-Client

FĂŒgen Sie Ihrem MCP-Client diese Einstellungen hinzu. Wenn imagesorcery-mcp nach der Installation im Pfad Ihres Systems enthalten ist, können Sie imagesorcery-mcp direkt als Befehl verwenden. Andernfalls mĂŒssen Sie den vollstĂ€ndigen Pfad zur ausfĂŒhrbaren Datei angeben.

"mcpServers": { "imagesorcery-mcp": { "command": "imagesorcery-mcp", // Or /full/path/to/venv/bin/imagesorcery-mcp if installed in a venv "transportType": "stdio", "autoApprove": ["detect", "crop", "get_models", "draw_texts", "get_metainfo", "rotate", "resize", "classify", "draw_rectangles", "find", "ocr"], "timeout": 100 } }
"mcpServers": { "imagesorcery-mcp": { "command": "imagesorcery-mcp.exe", // Or C:\\full\\path\\to\\venv\\Scripts\\imagesorcery-mcp.exe if installed in a venv "transportType": "stdio", "autoApprove": ["detect", "crop", "get_models", "draw_texts", "get_metainfo", "rotate", "resize", "classify", "draw_rectangles", "find", "ocr"], "timeout": 100 } }

📩 ZusĂ€tzliche Modelle

FĂŒr einige Tools mĂŒssen bestimmte Modelle im models verfĂŒgbar sein:

# Download models for the detect tool download-yolo-models --ultralytics yoloe-11l-seg download-yolo-models --huggingface ultralytics/yolov8:yolov8m.pt

Beim Herunterladen von Modellen aktualisiert das Skript automatisch die Datei models/model_descriptions.json :

  • FĂŒr Ultralytics-Modelle: Beschreibungen sind in src/imagesorcery_mcp/scripts/create_model_descriptions.py vordefiniert und enthalten detaillierte Informationen zu Zweck, GrĂ¶ĂŸe und Eigenschaften jedes Modells.
  • FĂŒr Hugging Face-Modelle: Beschreibungen werden automatisch aus der Modellkarte im Hugging Face Hub extrahiert. Das Skript versucht, den Modellnamen aus dem Modellindex oder der ersten Zeile der Beschreibung zu verwenden.

Nach dem Herunterladen der Modelle wird empfohlen, die Beschreibungen in models/model_descriptions.json zu ĂŒberprĂŒfen und sie bei Bedarf anzupassen, um genauere oder detailliertere Informationen zu den Funktionen und AnwendungsfĂ€llen der Modelle bereitzustellen.

đŸ€ Beitragen

Verzeichnisstruktur

Dieses Repository ist wie folgt organisiert:

. ├── .gitignore # Specifies intentionally untracked files that Git should ignore. ├── pyproject.toml # Configuration file for Python projects, including build system, dependencies, and tool settings. ├── pytest.ini # Configuration file for the pytest testing framework. ├── README.md # The main documentation file for the project. ├── setup.sh # A shell script for quick setup (legacy, for reference or local use). ├── models/ # This directory stores pre-trained models used by tools like `detect` and `find`. It is typically ignored by Git due to the large file sizes. │ ├── model_descriptions.json # Contains descriptions of the available models. │ ├── settings.json # Contains settings related to model management and training runs. │ └── *.pt # Pre-trained model. ├── src/ # Contains the source code for the đŸȘ„ ImageSorcery MCP server. │ └── imagesorcery_mcp/ # The main package directory for the server. │ ├── __init__.py # Makes `imagesorcery_mcp` a Python package. │ ├── __main__.py # Entry point for running the package as a script. │ ├── logging_config.py # Configures the logging for the server. │ ├── server.py # The main server file, responsible for initializing FastMCP and registering tools. │ ├── logs/ # Directory for storing server logs. │ ├── scripts/ # Contains utility scripts for model management. │ │ ├── README.md # Documentation for the scripts. │ │ ├── __init__.py # Makes `scripts` a Python package. │ │ ├── create_model_descriptions.py # Script to generate model descriptions. │ │ ├── download_clip.py # Script to download CLIP models. │ │ ├── post_install.py # Script to run post-installation tasks. │ │ └── download_models.py # Script to download other models (e.g., YOLO). │ └── tools/ # Contains the implementation of individual MCP tools. │ ├── README.md # Documentation for the tools. │ ├── __init__.py # Import the central logger │ └── *.py # Implements the tool. └── tests/ # Contains test files for the project. ├── test_server.py # Tests for the main server functionality. ├── data/ # Contains test data, likely image files used in tests. └── tools/ # Contains tests for individual tools.

Entwicklungs-Setup

  1. Klonen Sie das Repository:
git clone https://github.com/sunriseapps/imagesorcery-mcp.git # Or your fork cd imagesorcery-mcp
  1. (Empfohlen) Erstellen und aktivieren Sie eine virtuelle Umgebung:
python -m venv venv source venv/bin/activate # For Linux/macOS # venv\Scripts\activate # For Windows
  1. Installieren Sie das Paket im bearbeitbaren Modus zusammen mit den EntwicklungsabhÀngigkeiten:
pip install -e ".[dev]"

Dadurch werden imagesorcery-mcp und alle AbhĂ€ngigkeiten von [project.dependencies] und [project.optional-dependencies].dev (einschließlich build und twine ) installiert.

Regeln

Diese Regeln gelten fĂŒr alle Mitwirkenden: Menschen und KI.

  1. Lesen Sie alle README.md -Dateien im Projekt. Machen Sie sich mit der Projektstruktur und dem Zweck vertraut. Machen Sie sich mit den Richtlinien fĂŒr BeitrĂ€ge vertraut. Überlegen Sie, wie sich dies auf Ihre Aufgabe bezieht und wie Sie entsprechende Änderungen vornehmen können.
  2. Lesen Sie pyproject.toml . Beachten Sie die Abschnitte: [tool.ruff] , [tool.ruff.lint] , [project.optional-dependencies] und [project]dependencies . Halten Sie sich strikt an den in pyproject.toml definierten Codestil. Halten Sie sich an den in pyproject.toml definierten Stack der AbhĂ€ngigkeiten und fĂŒgen Sie ohne triftigen Grund keine neuen AbhĂ€ngigkeiten hinzu.
  3. Schreiben Sie Ihren Code in neue und bestehende Dateien. Falls neue AbhĂ€ngigkeiten benötigt werden, aktualisieren Sie pyproject.toml und installieren Sie diese ĂŒber pip install -e . oder pip install -e ".[dev]" . Installieren Sie sie nicht direkt ĂŒber pip install . Beispiele finden Sie in vorhandenen Quellcodes (z. B. src/imagesorcery_mcp/server.py , src/imagesorcery_mcp/tools/crop.py ). Halten Sie sich an den Codestil, die Namenskonventionen, die Ein- und Ausgabedatenformate, die Codecode-Struktur, die Architektur usw. des bestehenden Codes.
  4. Aktualisieren Sie die zugehörigen README.md Dateien mit Ihren Änderungen. Behalten Sie das Format und die Struktur der vorhandenen README.md Dateien bei.
  5. Schreiben Sie Tests fĂŒr Ihren Code. Sehen Sie sich vorhandene Tests als Beispiele an (z. B. tests/test_server.py , tests/tools/test_crop.py ). Halten Sie sich an den Codestil, die Namenskonventionen, die Ein- und Ausgabedatenformate, die Codecode-Struktur, die Architektur usw. der vorhandenen Tests.
  6. FĂŒhren Sie Tests und Linter durch, um sicherzustellen, dass alles funktioniert:
pytest ruff check .

Bei Fehlern korrigieren Sie den Code und die Tests. Es ist unbedingt erforderlich , dass der gesamte neue Code den Linter-Regeln entspricht und alle Tests besteht.

Codierungshinweise

  • Verwenden Sie gegebenenfalls Typhinweise
  • Verwenden Sie pydantic zur Datenvalidierung und -serialisierung

📝 Fragen?

Wenn Sie Fragen, Probleme oder VorschlÀge zu diesem Projekt haben, können Sie sich gerne an folgende Adresse wenden:

  • Projektautor: titulus ĂŒber LinkedIn
  • Sunrise Apps CEO: Vlad Karm ĂŒber LinkedIn

Sie können im Repository auch ein Problem fĂŒr Fehlerberichte oder Funktionsanfragen öffnen.

📜 Lizenz

Dieses Projekt steht unter der MIT-Lizenz. Das bedeutet, dass Sie die Software unter den Bedingungen der MIT-Lizenz frei verwenden, Ă€ndern und verbreiten dĂŒrfen.

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    Enables AI assistants to download images from URLs and perform basic image optimization tasks.
    Last updated -
    2
    14
    10
    JavaScript
    Apache 2.0
  • -
    security
    A
    license
    -
    quality
    A Cursor-compatible toolkit that provides intelligent coding assistance through custom AI tools for code architecture planning, screenshot analysis, code review, and file reading capabilities.
    Last updated -
    758
    10
    TypeScript
    MIT License
  • A
    security
    F
    license
    A
    quality
    Drawing Tool for AI Assistants
    Last updated -
    4
    9
    JavaScript
  • -
    security
    F
    license
    -
    quality
    Enables searching for AI agents by keywords or categories, allowing users to discover tools like coding agents, GUI agents, or industry-specific assistants across marketplaces.
    Last updated -
    33
    Python
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/sunriseapps/imagesorcery-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server