ScrAPI MCP 服务器
MCP 服务器使用ScrAPI来抓取网页。
ScrAPI 是您的终极网络抓取解决方案,提供强大、可靠且易于使用的功能,可毫不费力地从任何网站提取数据。
工具
scrape_url_html
- 使用 ScrAPI 服务,通过 URL 抓取网站内容,并以 HTML 格式获取结果。此功能适用于抓取因机器人检测、验证码甚至地理位置限制而难以访问的网站内容。结果将以 HTML 格式呈现,如果需要高级解析,则更适合使用 HTML 格式。
- 输入:
url
(字符串) - 返回:URL 的 HTML 内容
scrape_url_markdown
- 使用 ScrAPI 服务,通过 URL 抓取网站内容,并以 Markdown 格式获取结果。此功能适用于抓取因机器人检测、验证码甚至地理位置限制而难以访问的网站内容。如果网页的文本内容而非结构信息很重要,则结果将以 Markdown 格式呈现,因此更适合使用 Markdown 格式。
- 输入:
url
(字符串) - 返回:URL 的 Markdown 内容
设置
API 密钥(可选)
可以选择从ScrAPI 网站获取 API 密钥。
如果没有 API 密钥,您将只能进行一次并发呼叫,每天只能进行二十次免费呼叫,并且排队功能也非常有限。
云服务器
ScrAPI MCP 服务器也可通过 SSE 在云端使用,网址为https://api.scrapi.dev/sse
云 MCP 服务器尚未得到广泛支持,但您可以直接从自定义客户端访问,或使用MCP 检查器进行测试。目前,连接到云 MCP 服务器时无法传递您的 API 密钥。
与 Claude Desktop 一起使用
将以下内容添加到您的claude_desktop_config.json
中:
Docker
NPX
建造
Docker 构建:
执照
此 MCP 服务器采用 MIT 许可证。这意味着您可以自由使用、修改和分发该软件,但须遵守 MIT 许可证的条款和条件。更多详情,请参阅项目仓库中的 LICENSE 文件。
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
该服务器可以对受机器人检测、验证码或地理位置限制影响的难以访问的网站进行网页抓取,并以 HTML 或 Markdown 格式返回结果。
Related MCP Servers
- AsecurityAlicenseAqualityA server that provides web scraping and intelligent content searching capabilities using the Firecrawl API, enabling AI agents to extract structured data from websites and perform content searches.Last updated -52TypeScriptMIT License
- -securityAlicense-qualityA Python-based MCP server that crawls websites to extract and save content as markdown files, with features for mapping website structure and links.Last updated -3PythonMIT License
- AsecurityFlicenseAqualityA server that provides tools to scrape websites and extract structured data from them using Firecrawl's APIs, supporting both basic website scraping in multiple formats and custom schema-based data extraction.Last updated -21JavaScript
- -securityFlicense-qualityEnables intelligent web scraping through a browser automation tool that can search Google, navigate to webpages, and extract content from various websites including GitHub, Stack Overflow, and documentation sites.Last updated -1Python