Skip to main content
Glama

PDF Processor MCP Server

PDF-процессор MCP-сервер

Сервер Model Context Protocol (MCP) для обработки PDF-документов с расширенными функциями, включая извлечение уравнений LaTeX. Этот сервер позволяет Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.

Функции

  • Извлечение PDF-файлов из URL-адресов
  • Извлечение текста из PDF-файлов
  • Распознавание и извлечение уравнений LaTeX
  • Интеграция с Клодом через MCP

Установка

Стандартная установка

pip install -e .

Установка для Claude Desktop/Claude Code

Чтобы использовать этот MCP-сервер с Claude Desktop или Claude Code:

  1. Установите инструменты MCP CLI, если они еще не установлены:
    pip install "mcp[cli]"
  2. Установите сервер с помощью инструмента MCP CLI:
    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
    Например, если вы клонировали этот репозиторий в ~/mcp_pdf_processor :
    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. Для разработки с помощью MCP Inspector:
    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. В Claude Desktop теперь вы можете использовать сервер PDF_TOOLS в своих диалогах с помощью следующих команд:
    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Использование

Работает автономно

python pdf_tool_server.py

Переменные среды

  • OUTPUT_DIR : Каталог для хранения обработанных PDF-файлов (по умолчанию: llm_output )
  • PYTHONPATH : Укажите каталог, содержащий пакет mcp_pdf_processor

Использование с Клодом

После регистрации сервера вы можете попросить Клода:

  • «Загрузить и проанализировать PDF-файл по адресу [URL]»
  • «Извлечь уравнения LaTeX из PDF-файла по адресу [URL]»
  • «Кратко изложите содержание PDF-файла по адресу [URL]»

Требования

Для сервера требуются следующие основные зависимости:

  • Python 3.9 или выше
  • pymupdf : обработка PDF-файлов и извлечение текста
  • mcp : поддержка протокола контекста модели
  • pydantic : Проверка и сериализация данных
  • aiohttp : Асинхронный HTTP-клиент/сервер
  • torch : Для извлечения уравнений LaTeX (необязательно)
  • pix2tex : Для распознавания уравнений LaTeX (необязательно)

Полный список зависимостей и требований к версиям см. в pyproject.toml

Примеры использования

Вот полный пример рабочего процесса использования PDF-процессора с Claude Desktop:

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

Лицензия

Массачусетский технологический институт

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Сервер Model Context Protocol, позволяющий Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.

  1. Функции
    1. Установка
      1. Стандартная установка
      2. Установка для Claude Desktop/Claude Code
    2. Использование
      1. Работает автономно
      2. Переменные среды
      3. Использование с Клодом
    3. Требования
      1. Примеры использования
        1. Лицензия

          Related MCP Servers

          • A
            security
            A
            license
            A
            quality
            Model Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.
            Last updated -
            1
            11
            MIT License
            • Apple
          • A
            security
            A
            license
            A
            quality
            A Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.
            Last updated -
            3
            914
            13
            MIT License
            • Apple
          • A
            security
            A
            license
            A
            quality
            A Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.
            Last updated -
            3
            8
            1
            TypeScript
            MIT License
            • Apple
          • A
            security
            A
            license
            A
            quality
            A Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.
            Last updated -
            3
            1
            Python
            MIT License

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server