Skip to main content
Glama

MCP PDF Server

by DeepSeekMine

Servidor PDF MCP

Un servidor de lectura de archivos PDF basado en FastMCP .

Admite extracción de texto PDF, reconocimiento OCR y extracción de imágenes a través del protocolo MCP, con un depurador web integrado para realizar pruebas fácilmente.


🚀 Características

  • leer_texto_pdf
    Extrae texto normal de un PDF (página por página).
  • leído por ocr
    Utiliza OCR para reconocer texto de archivos PDF escaneados o basados en imágenes.
  • leer imágenes en pdf
    Extrae todas las imágenes de una página PDF específica (salida codificada en Base64).

📂 Estructura del proyecto

mcp-pdf-server/ ├── pdf_resources/ # Directory for uploaded and processed PDF files ├── txt_server.py # Main server entry point └── README.md # Project documentation

⚙️ Instalación

Versión de Python recomendada: 3.9+

pip install pymupdf mcp

Nota: Para utilizar las funciones de OCR, es posible que necesite una compilación de MuPDF con soporte de OCR o bibliotecas de OCR externas.


🔦 Iniciar el servidor

Ejecute el siguiente comando:

python txt_server.py

Deberías ver registros como:

Serving on http://127.0.0.1:6231

Interfaz de depuración web

Abra su navegador y visite:

http://127.0.0.1:6231
  • Seleccione una herramienta del panel izquierdo
  • Complete los parámetros en el panel derecho
  • Haga clic en "Ejecutar" para probar la herramienta

No requiere codificación: depure y pruebe fácilmente a través de la interfaz de usuario web.


🛠️ Lista de herramientas API

HerramientaDescripciónParámetros de entradaDevoluciones
read_pdf_textExtrae texto normal de páginas PDFfile_path , start_page , end_pageLista de textos de páginas
read_by_ocrReconoce texto mediante OCRfile_path , start_page , end_page , language , dpiTexto extraído mediante OCR
read_pdf_imagesExtrae imágenes de una página PDFfile_path , page_numberLista de imágenes (codificadas en Base64)

📝 Ejemplo de uso

Extraer texto de las páginas 1 a 5:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

Realizar reconocimiento OCR en la página 1:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

Extraer todas las imágenes de la página 3:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 Notas

  • Los archivos deben colocarse dentro del directorio pdf_resources/ o se debe proporcionar una ruta absoluta.
  • La funcionalidad de OCR requiere soporte de OCR adecuado en el entorno.
  • Al procesar archivos grandes, ajuste la configuración de memoria y tiempo de espera según sea necesario.

📜 Licencia

Este proyecto está licenciado bajo la licencia MIT.
Para uso comercial, por favor dé crédito a la fuente original.


-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor de procesamiento de PDF que extrae texto mediante análisis normal u OCR y recupera imágenes de archivos PDF a través del protocolo MCP con un depurador web integrado.

  1. 🚀 Características
    1. 📂 Estructura del proyecto
      1. ⚙️ Instalación
        1. 🔦 Iniciar el servidor
          1. Interfaz de depuración web
            1. 🛠️ Lista de herramientas API
              1. 📝 Ejemplo de uso
                1. 📢 Notas
                  1. 📜 Licencia

                    Related MCP Servers

                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                      Last updated -
                      1
                      18
                      • Apple
                    • A
                      security
                      A
                      license
                      A
                      quality
                      A server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.
                      Last updated -
                      3
                      55
                      23
                      MIT License
                    • -
                      security
                      A
                      license
                      -
                      quality
                      A Model Context Protocol (MCP) based server that efficiently manages PDF files, allowing AI coding tools like Cursor to read, summarize, and extract information from PDF datasheets to assist embedded development work.
                      Last updated -
                      7
                      Apache 2.0
                    • -
                      security
                      F
                      license
                      -
                      quality
                      An MCP server that provides comprehensive PDF processing capabilities including text extraction, image extraction, table detection, annotation extraction, metadata retrieval, page rendering, and document structure analysis.
                      Last updated -
                      • Apple

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/DeepSeekMine/mcp-pdf-reader'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server