PDFプロセッサMCPサーバー
LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル(MCP)サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。
特徴
- URLからのPDF取得
- PDFからのテキスト抽出
- LaTeX 数式の認識と抽出
- MCP経由のClaudeとの統合
インストール
標準インストール
Claude Desktop/Claude Code のインストール
この MCP サーバーを Claude Desktop または Claude Code で使用するには:
- MCP CLI ツールがまだインストールされていない場合はインストールします。
- MCP CLI ツールを使用してサーバーをインストールします。たとえば、このリポジトリを
~/mcp_pdf_processor
にクローンした場合: - MCP Inspector を使用した開発の場合:
- Claude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。
使用法
スタンドアロン実行
環境変数
OUTPUT_DIR
: 処理されたPDFを保存するディレクトリ(デフォルト:llm_output
)PYTHONPATH
: mcp_pdf_processor パッケージを含むディレクトリを設定します
クロードと一緒に使う
サーバーが登録されると、Claude に次のことを依頼できます。
- 「[URL] の PDF を取得して分析する」
- 「[URL]のPDFからLaTeXの数式を抽出します」
- 「[URL]のPDFの内容を要約してください」
要件
サーバーには次の主な依存関係が必要です。
- Python 3.9以上
pymupdf
: PDF処理とテキスト抽出mcp
: モデルコンテキストプロトコルのサポートpydantic
: データの検証とシリアル化aiohttp
: 非同期 HTTP クライアント/サーバーtorch
: LaTeX 数式抽出用(オプション)pix2tex
: LaTeX 数式認識用(オプション)
依存関係とバージョン要件の完全なリストについては、 pyproject.toml
参照してください。
使用例
Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。
ライセンス
マサチューセッツ工科大学
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Claude が LaTeX 数式を含む PDF ドキュメントから情報を取得、処理、抽出できるようにするモデル コンテキスト プロトコル サーバー。
Related MCP Servers
- AsecurityAlicenseAqualityModel Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.Last updated -111MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.Last updated -391413MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.Last updated -381TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -31PythonMIT License