PDF-процессор MCP-сервер
Сервер Model Context Protocol (MCP) для обработки PDF-документов с расширенными функциями, включая извлечение уравнений LaTeX. Этот сервер позволяет Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.
Функции
- Извлечение PDF-файлов из URL-адресов
- Извлечение текста из PDF-файлов
- Распознавание и извлечение уравнений LaTeX
- Интеграция с Клодом через MCP
Установка
Стандартная установка
Установка для Claude Desktop/Claude Code
Чтобы использовать этот MCP-сервер с Claude Desktop или Claude Code:
- Установите инструменты MCP CLI, если они еще не установлены:
- Установите сервер с помощью инструмента MCP CLI:Например, если вы клонировали этот репозиторий в
~/mcp_pdf_processor
: - Для разработки с помощью MCP Inspector:
- В Claude Desktop теперь вы можете использовать сервер PDF_TOOLS в своих диалогах с помощью следующих команд:
Использование
Работает автономно
Переменные среды
OUTPUT_DIR
: Каталог для хранения обработанных PDF-файлов (по умолчанию:llm_output
)PYTHONPATH
: Укажите каталог, содержащий пакет mcp_pdf_processor
Использование с Клодом
После регистрации сервера вы можете попросить Клода:
- «Загрузить и проанализировать PDF-файл по адресу [URL]»
- «Извлечь уравнения LaTeX из PDF-файла по адресу [URL]»
- «Кратко изложите содержание PDF-файла по адресу [URL]»
Требования
Для сервера требуются следующие основные зависимости:
- Python 3.9 или выше
pymupdf
: обработка PDF-файлов и извлечение текстаmcp
: поддержка протокола контекста моделиpydantic
: Проверка и сериализация данныхaiohttp
: Асинхронный HTTP-клиент/серверtorch
: Для извлечения уравнений LaTeX (необязательно)pix2tex
: Для распознавания уравнений LaTeX (необязательно)
Полный список зависимостей и требований к версиям см. в pyproject.toml
Примеры использования
Вот полный пример рабочего процесса использования PDF-процессора с Claude Desktop:
Лицензия
Массачусетский технологический институт
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Сервер Model Context Protocol, позволяющий Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.
Related MCP Servers
- AsecurityAlicenseAqualityModel Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.Last updated -111MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.Last updated -391413MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.Last updated -381TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -31PythonMIT License