Skip to main content
Glama

Mozilla Readability Parser MCP Server

by emzimmer

Mozilla Readability 解析器 MCP 服务器

一个模型上下文协议 (MCP)服务器,用于提取网页内容并将其转换为干净的、LLM 优化的 Markdown 格式。返回文章标题、正文、摘录、署名和网站名称。使用Mozilla 的 Readability 算法移除广告、导航、页脚和不必要的元素,同时保留核心内容结构。了解更多关于 MCP 的信息

特征

  • 删除广告、导航、页脚和其他非必要内容

  • 将干净的 HTML 转换为格式良好的 Markdown(也使用 Turndown)

  • 返回文章元数据(标题、摘录、署名、网站名称)

  • 优雅地处理错误

为什么不直接获取?

与简单的获取请求不同,此服务器:

  • 使用 Mozilla 的可读性算法仅提取相关内容

  • 消除广告、弹出窗口和导航菜单等噪音

  • 通过删除不必要的 HTML/CSS 来减少令牌的使用

  • 提供一致的 Markdown 格式,以便更好地处理 LLM

  • 包含有关内容的有用元数据

安装

通过 Smithery 安装

要通过Smithery自动为 Claude Desktop 安装 Mozilla Readability Parser:

npx -y @smithery/cli install server-moz-readability --client claude

手动安装

npm install server-moz-readability

工具参考

parse

获取网页内容并将其转换为干净的 Markdown。

参数:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

返回:

{ "title": "Article title", "content": "Markdown content...", "metadata": { "excerpt": "Brief summary", "byline": "Author information", "siteName": "Source website name" } }

与 Claude Desktop 一起使用

添加到您的claude_desktop_config.json

{ "mcpServers": { "readability": { "command": "npx", "args": ["-y", "server-moz-readability"] } } }

依赖项

  • @mozilla/readability——内容提取

  • turndown - HTML 到 Markdown 的转换

  • jsdom——DOM 解析

  • axios - HTTP 请求

执照

麻省理工学院

Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

提取网页内容并将其转换为简洁、LLM 优化的 Markdown 格式。返���文章标题、正文、摘录、署名和网站名称。使用 Mozilla 的 Readability 算法去除广告、导航、页脚和非必要元素,同时保留核心内容结构。

  1. 特征
    1. 为什么不直接获取?
      1. 安装
        1. 通过 Smithery 安装
        2. 手动安装
      2. 工具参考
        1. parse
      3. 与 Claude Desktop 一起使用
        1. 依赖项
          1. 执照

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Enables web content scanning and analysis by fetching, analyzing, and extracting information from web pages using tools like page fetching, link extraction, site crawling, and more.
              Last updated -
              6
              11
              MIT License
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              12
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              Enables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.
              Last updated -
              1
              2
              MIT License
            • -
              security
              A
              license
              -
              quality
              A Python implementation of an MCP server that extracts webpage content, removes ads and non-essential elements, and transforms it into clean, LLM-optimized Markdown.
              Last updated -
              2
              MIT License
              • Linux
              • Apple

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/emzimmer/server-moz-readability'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server