defuddle-extractor
CLI 工具by yeholdon
clawhub⭐ 05/10
调用Defuddle库从网页中提取主体内容,自动过滤广告导航等噪音,输出干净Markdown,支持CLI命令行与Node.js编程两种使用方式
📊 商业分析
商业模式
free
独特价值
基于Defuddle库一键提取正文并转Markdown,CLI与Node.js双模式
竞品
Jina Reader(更成熟的网页转Markdown服务,有API)、Firecrawl(功能更全面支持JS渲染)、Readability.js(Mozilla官方同类库,生态更广)
🎯 应用场景
目标用户
前端/全栈开发者数据采集工程师AI训练数据处理人员
工具信息
- 类型
- CLI 工具
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 5/10
- 子分类
- 网页内容提取与解析
- 可商业化
- ❌ 否
AI 标签
网页抓取内容提取Markdown转换文本处理Node.js工具
相关工具推荐
chrome-devtoolsMCP
基于Chrome DevTools MCP实现AI驱动的浏览器自动化、网络流量分析、性能剖析及截图捕获,专家级调试能力触手可及
9/10⭐ 24,083
brave-searchSKILL
通过Brave Search API实现网页搜索与内容提取,无需浏览器,轻量接入,适合文档查询、事实核查及任意网页内容获取场景。
8/10⭐ 161
playwright-mcpMCP
基于Playwright MCP服务器实现浏览器自动化,支持网页导航、元素点击、表单填写、数据提取与截图等完整工作流。
8/10⭐ 96
browser-useMCP
通过AI指令自动化浏览器操作,支持网页导航、表单填写、页面截图及结构化数据提取,适合测试与RPA场景
8/10⭐ 70
playwrightMCP
基于Playwright MCP协议实现浏览器自动化,支持网页导航、元素点击、表单填写、截图及数据提取,可调试真实浏览器工作流。
8/10⭐ 56