MCP Website Downloader
Einfacher MCP-Server zum Herunterladen von Dokumentationswebsites und Vorbereiten für die RAG-Indizierung.
Merkmale
- Lädt komplette Dokumentationsseiten herunter, zumindest große Teile.
- Behält die Linkstruktur und Navigation bei, nicht wirklich. lol
- Lädt Assets (CSS, JS, Bilder) herunter und organisiert sie, ist aber nicht wirklich KI-freundlich und es muss wahrscheinlich alles irgendwie analysiert oder in eine Datenbank oder so etwas vektorisiert werden.
- Erstellt einen sauberen Index für RAG-Systeme. Derzeit scheint in jedem Ordner ein Index erstellt zu werden, ohne dass er noch einmal angeschaut wurde.
- Einfache, zweckgebundene MCP-Schnittstelle, ja.
Installation
Forken und herunterladen, mit CD zum Repository wechseln.
Fügen Sie dies mit Ihren eigenen Pfaden in Ihre claude_desktop_config.json ein:
Andere Verwendungen, über die Sie sich keine Sorgen machen müssen und die halluzinogene Wirkungen haben können, lol:
- Starten Sie den Server:
- Verwendung über Claude Desktop oder andere MCP-Clients:
Ausgabestruktur
Entwicklung
Der Server folgt der Standard-MCP-Architektur:
Komponenten
server.py
: Hauptimplementierung des MCP-Servers, die die Tool-Registrierung und -Anfragen verarbeitetcore.py
: Kernfunktion zum Herunterladen von Websites mit ordnungsgemäßer Asset-Verarbeitungutils.py
: Hilfsprogramme für die Dateiverwaltung und URL-Verarbeitung
Designprinzipien
- Einzelverantwortung
- Jedes Modul hat einen klaren Zweck
- Server verarbeitet MCP-Schnittstelle
- Der Kern übernimmt das Herunterladen
- Utils übernimmt allgemeine Operationen
- Saubere Struktur
- Behält die ursprüngliche Site-Struktur bei
- Organisiert Vermögenswerte nach Typ
- Schafft einen übersichtlichen Index für RAG-Systeme
- Robuster Betrieb
- Richtige Fehlerbehandlung
- Angemessene Tiefengrenzen
- Überprüfung des Asset-Downloads
- Saubere URL-/Pfadverarbeitung
RAG-Index
Die Datei rag_index.json
enthält:
Beitragen
- Forken Sie das Repository
- Erstellen eines Feature-Zweigs
- Nehmen Sie Ihre Änderungen vor
- Senden einer Pull-Anfrage
Lizenz
MIT-Lizenz – Siehe LICENSE-Datei
Fehlerbehandlung
Der Server behandelt allgemeine Probleme:
- Ungültige URLs
- Netzwerkfehler
- Fehler beim Herunterladen von Assets
- Fehlerhaftes HTML
- Tiefe Rekursion
- Dateisystemfehler
Fehlerantworten folgen dem Format:
Erfolgsantworten:
local-only server
The server can only run on the client's local machine because it depends on local resources.
Tools
Dieser Server ermöglicht Benutzern das Herunterladen ganzer Websites und ihrer Assets für den Offline-Zugriff und unterstützt konfigurierbare Tiefen- und Parallelitätseinstellungen.
- Merkmale
- Installation
- Andere Verwendungen, über die Sie sich keine Sorgen machen müssen und die halluzinogene Wirkungen haben können, lol:
- Ausgabestruktur
- Entwicklung
- Beitragen
- Lizenz
- Fehlerbehandlung
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityThis server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.Last updated -162,980TypeScriptMIT License
- AsecurityFlicenseAqualityProvides a tool to download entire websites using wget. It preserves the website structure and converts links to work locally.Last updated -1123JavaScript
- AsecurityAlicenseAqualityAn advanced web browsing server enabling headless browser interactions via a secure API, providing features like navigation, content extraction, element interaction, and screenshot capture.Last updated -620PythonMIT License
- -securityFlicense-qualityThis server provides an interface for performing basic file system operations such as navigation, reading, writing, and file analysis, allowing users to manage directories and files efficiently.Last updated -4Python