Mozilla Readability 解析器 MCP 服务器
一个模型上下文协议 (MCP)服务器,用于提取网页内容并将其转换为干净的、LLM 优化的 Markdown 格式。返回文章标题、正文、摘录、署名和网站名称。使用Mozilla 的 Readability 算法移除广告、导航、页脚和不必要的元素,同时保留核心内容结构。了解更多关于 MCP 的信息。
特征
删除广告、导航、页脚和其他非必要内容
将干净的 HTML 转换为格式良好的 Markdown(也使用 Turndown)
返回文章元数据(标题、摘录、署名、网站名称)
优雅地处理错误
为什么不直接获取?
与简单的获取请求不同,此服务器:
使用 Mozilla 的可读性算法仅提取相关内容
消除广告、弹出窗口和导航菜单等噪音
通过删除不必要的 HTML/CSS 来减少令牌的使用
提供一致的 Markdown 格式,以便更好地处理 LLM
包含有关内容的有用元数据
安装
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 Mozilla Readability Parser:
手动安装
工具参考
parse
获取网页内容并将其转换为干净的 Markdown。
参数:
返回:
与 Claude Desktop 一起使用
添加到您的claude_desktop_config.json
:
依赖项
@mozilla/readability——内容提取
turndown - HTML 到 Markdown 的转换
jsdom——DOM 解析
axios - HTTP 请求
执照
麻省理工学院
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Tools
提取网页内容并将其转换为简洁、LLM 优化的 Markdown 格式。返���文章标题、正文、摘录、署名和网站名称。使用 Mozilla 的 Readability 算法去除广告、导航、页脚和非必要元素,同时保留核心内容结构。
Related MCP Servers
- AsecurityAlicenseAqualityEnables web content scanning and analysis by fetching, analyzing, and extracting information from web pages using tools like page fetching, link extraction, site crawling, and more.Last updated -611MIT License
Skrape MCP Serverofficial
AsecurityAlicenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -12MIT License- AsecurityAlicenseAqualityEnables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.Last updated -12MIT License
- -securityAlicense-qualityA Python implementation of an MCP server that extracts webpage content, removes ads and non-essential elements, and transforms it into clean, LLM-optimized Markdown.Last updated -2MIT License