baoyu-url-to-markdown
MCP Serverby jimliu
clawhub⭐ 07/10
使用Chrome CDP抓取任意URL并转为Markdown,保存渲染后的HTML快照,采用升级版Defuddle流程。
通过Chrome CDP渲染任意URL并转为Markdown,同步保存HTML快照,集成Defuddle增强去噪管道,适合AI知识库与RAG数据预处理场景
📊 商业分析
商业模式
freemium
独特价值
CDP真实渲染JS页面并同步保存HTML快照供溯源审计
竞品
1. Jina Reader (r.jina.ai) - 同类URL转Markdown,API更成熟但无CDP渲染;2. Firecrawl - 功能更全但收费较高;3. Markdownify/html2text - 纯静态解析,无JS渲染能力
🎯 应用场景
目标用户
AI应用开发者数据工程师/爬虫工程师内容研究员/知识库构建者
工具信息
- 类型
- MCP Server
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 7/10
- 子分类
- 网页内容抓取与转换
- 可商业化
- ✅ 是
AI 标签
网页转MarkdownChrome CDP内容抓取RAG预处理Defuddle去噪
相关工具推荐
chrome-devtoolsMCP
基于Chrome DevTools MCP实现AI驱动的浏览器自动化、网络流量分析、性能剖析及截图捕获,专家级调试能力触手可及
9/10⭐ 24,083
brave-searchSKILL
通过Brave Search API实现网页搜索与内容提取,无需浏览器,轻量接入,适合文档查询、事实核查及任意网页内容获取场景。
8/10⭐ 161
playwright-mcpMCP
基于Playwright MCP服务器实现浏览器自动化,支持网页导航、元素点击、表单填写、数据提取与截图等完整工作流。
8/10⭐ 96
browser-useMCP
通过AI指令自动化浏览器操作,支持网页导航、表单填写、页面截图及结构化数据提取,适合测试与RPA场景
8/10⭐ 70
playwrightMCP
基于Playwright MCP协议实现浏览器自动化,支持网页导航、元素点击、表单填写、截图及数据提取,可调试真实浏览器工作流。
8/10⭐ 56