mcp-server-fetch-python
ウェブコンテンツを取得し、様々な形式に変換するためのMCPサーバー。このサーバーは、JavaScriptでレンダリングされたコンテンツやメディアファイルのサポートなど、ウェブページからコンテンツを抽出するための包括的なツールを提供します。
特徴
ツール
サーバーは 4 つの専用ツールを提供します。
get-raw-text : ブラウザレンダリングなしでURLから直接生のテキストコンテンツを抽出します
引数:
url
: 対象ウェブページのURL(テキスト、JSON、XML、csv、tsvなど)(必須)
構造化されたデータ形式や高速な直接アクセスが必要な場合に最適です
get-rendered-html : ヘッドレスブラウザを使用して完全にレンダリングされた HTML コンテンツを取得します。
引数:
url
: 対象ウェブページのURL(必須)
JavaScript レンダリングを必要とする最新の Web アプリケーションや SPA に必須
get-markdown : ウェブページのコンテンツを適切にフォーマットされた Markdown に変換します
引数:
url
: 対象ウェブページのURL(必須)
構造要素を維持しながら、読みやすいきれいなテキスト出力を提供します
get-markdown-from-media : メディアファイルからAIを活用したコンテンツ抽出を実行します。
引数:
url
: 対象メディアファイル(画像、動画)のURL(必須)
視覚コンテンツ分析にコンピュータービジョンとOCRを活用
環境変数に有効なOPENAI_API_KEYを設定する必要があります
APIキーが設定されていない場合、またはメディアファイルの処理に問題がある場合はエラーメッセージが返されます。
使用法
クロードデスクトップ
Claude Desktop で使用するには、サーバー構成を追加します。
MacOSの場合: ~/Library/Application\ Support/Claude/claude_desktop_config.json
Windows の場合: %APPDATA%/Claude/claude_desktop_config.json
環境変数
次の環境変数を設定できます。
OPENAI_API_KEY :
get-markdown-from-media
ツールの使用に必要です。このキーは、AI を活用した画像分析とコンテンツ抽出に必要です。PYTHONIOENCODING : 出力で文字エンコードの問題が発生した場合は、「utf-8」に設定します。
MODEL_NAME : 使用するモデル名を指定します。デフォルトは「gpt-4o」です。
ローカルインストール
あるいは、サーバーをローカルにインストールして実行することもできます。
次に、Claude Desktop 構成ファイルに次の構成を追加します。
発達
デバッグ
次のコマンドでnpxを使用して MCP インスペクターを起動できます。
Web コンテンツを取得してさまざまな形式に変換するための MCP サーバー。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.Last updated -41,09537MIT License
- AsecurityFlicenseAqualityA MCP Server used to collect MCP Servers over the internet.Last updated -319
- AsecurityAlicenseAqualityA simple MCP server that facilitates website fetching through a configurable server platform using stdio or SSE transport, allowing integration with tools like Cursor for streamlined access.Last updated -236MIT License
- JavaScriptMIT License