clean-web-fetch
Skillby jllyzzd2023
clawhub⭐ 06/10
获取干净、可读的现代网页正文内容,支持微信公众号文章抓取与尾部噪音清洗,减少无用信息与 token 消耗;适合新闻、博客、公告及许多普通 fetch 不稳定、存在反爬或动态渲染干扰的网页。Clean readable web fetch for modern pages, with WeChat cleanup,...
专业网页内容提取工具,支持微信公众号文章抓取,智能清洗页面噪音,降低token消耗,适配动态渲染和反爬网页
📊 商业分析
商业模式
freemium
独特价值
专针对微信公众号和中文网页优化,噪音清洗效果好,token消耗低
竞品
Readability(国外,功能单一),Trafilatura(开源,无微信支持),Jina Reader(功能全但收费高)
🎯 应用场景
目标用户
内容聚合平台AI应用开发者新闻爬虫服务商知识库建设团队
工具信息
- 类型
- Skill
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 6/10
- 子分类
- 网页内容提取与清洗
- 可商业化
- ✅ 是
AI 标签
网页爬虫内容提取微信公众号文本清洗反爬虫
相关工具推荐
chrome-devtoolsMCP
基于Chrome DevTools MCP实现AI驱动的浏览器自动化、网络流量分析、性能剖析及截图捕获,专家级调试能力触手可及
9/10⭐ 24,083
brave-searchSKILL
通过Brave Search API实现网页搜索与内容提取,无需浏览器,轻量接入,适合文档查询、事实核查及任意网页内容获取场景。
8/10⭐ 161
playwright-mcpMCP
基于Playwright MCP服务器实现浏览器自动化,支持网页导航、元素点击、表单填写、数据提取与截图等完整工作流。
8/10⭐ 96
browser-useMCP
通过AI指令自动化浏览器操作,支持网页导航、表单填写、页面截图及结构化数据提取,适合测试与RPA场景
8/10⭐ 70
playwrightMCP
基于Playwright MCP协议实现浏览器自动化,支持网页导航、元素点击、表单填写、截图及数据提取,可调试真实浏览器工作流。
8/10⭐ 56