scrapling-web-fetch
MCP Serverby jllyzzd2023
clawhub⭐ 17/10
使用 Scrapling + html2text 获取现代网页正文内容,支持微信公众号文章抓取与尾部噪音清洗,减少无用信息与 token 消耗;适合抓取博客、新闻、公告及许多普通 fetch 不稳定、存在反爬或动态渲染干扰的网页。Supports WeChat article cleanup, markdown...
基于Scrapling+html2text的智能网页正文提取工具,专优微信公众号,支持动态渲染清洗,显著降低AI处理成本
📊 商业分析
商业模式
freemium
独特价值
专门优化微信公众号抓取,支持动态渲染干扰清洗,显著降低token消耗成本
竞品
Firecrawl(美国,通用爬虫),ReadabilityAPI(付费阅读提取),Jina Reader(开源但功能单一)
🎯 应用场景
目标用户
AI应用开发者(需要喂数据)内容聚合平台(新闻/博客)知识库建设团队
工具信息
- 类型
- MCP Server
- 平台
- clawhub
- Stars
- ⭐ 1
- 价值评分
- 7/10
- 子分类
- 网页内容抓取与清洗
- 可商业化
- ✅ 是
AI 标签
网页爬虫内容提取微信公众号markdown转换反爬克服token优化
相关工具推荐
chrome-devtoolsMCP
基于Chrome DevTools MCP实现AI驱动的浏览器自动化、网络流量分析、性能剖析及截图捕获,专家级调试能力触手可及
9/10⭐ 24,083
brave-searchSKILL
通过Brave Search API实现网页搜索与内容提取,无需浏览器,轻量接入,适合文档查询、事实核查及任意网页内容获取场景。
8/10⭐ 161
playwright-mcpMCP
基于Playwright MCP服务器实现浏览器自动化,支持网页导航、元素点击、表单填写、数据提取与截图等完整工作流。
8/10⭐ 96
browser-useMCP
通过AI指令自动化浏览器操作,支持网页导航、表单填写、页面截图及结构化数据提取,适合测试与RPA场景
8/10⭐ 70
playwrightMCP
基于Playwright MCP协议实现浏览器自动化,支持网页导航、元素点击、表单填写、截图及数据提取,可调试真实浏览器工作流。
8/10⭐ 56