Repository navigation

crawl

Website
Wikipedia

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰，旨在安全快捷的帮助用户拿回自己的数据，工具代码开源，流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。

Python crawl spider Selenium wxpython tkinter 自动化 hotmail Chrome csdn outlook

Python

8105

1493

2 个月前

201206030 / novel-plus

novel-plus 是一个多端（PC、WAP）阅读、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。

novel crawl read book spider

Java

4272

1431

11 小时前

wkunzhi / Python3-Spider

Python爬虫实战 - 模拟登陆各大网站包含但不限于：滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝，如果喜欢请start ❤️

scrapy Python crawl 爬虫 geek spider taobao dianping meituan Selenium pyppeteer splash

Python

3271

1033

2 年前

any4ai / AnyCrawl

AnyCrawl 🚀: A Node.js/TypeScript crawler that turns websites into LLM-ready data and extracts structured SERP results from Google/Bing/Baidu/etc. Native multi-threading for bulk processing.

aitools crawl scrape webscraper ai-scraping data html-to-markdown rag scraping

TypeScript

2327

229

5 天前

ReaJason / xhs

基于小红书 Web 端进行的请求封装。https://reajason.github.io/xhs/

crawl Python xhs

Python

1850

410

3 个月前

coder-hxl / x-crawl

Flexible Node.js AI-assisted crawler library

crawl 爬虫 Node.js TypeScript spider flexible Puppeteer JavaScript multifunction Chromium fingerprint 人工智能

TypeScript

1758

109

1 天前

ArchiveTeam / grab-site

The archivist's web crawler: WARC output, dashboard for all crawls, dynamic ignore patterns

archiving crawl spider 爬虫 warc

Python

1528

150

4 个月前

zhuweiyou / weixin-game-helper

微信小游戏辅助合集（加减大师、包你懂我、大家来找茬腾讯版、头脑王者、好友画我、悦动音符、我最在行、星途WeGoing、猜画小歌、知乎答题王、腾讯中国象棋、跳一跳、题多多黄金版）

WeChat game helper robot crawl Node.js MongoDB anyproxy charles fiddler socket Python

JavaScript

1388

385

2 年前

darbra / sperm

浏览过的精彩逆向文章汇总，值得一看

frida unidbg 爬虫 spider crawl

1324

363

10 天前

LoseNine / Crack-JS-Spider

JS破解逆向，破解JS反爬虫加密参数，已破解极验滑块w（2022.2.19），QQ音乐sign（2022.2.13），拼多多anti_content，boss直聘zp_token，知乎x-zse-96，酷狗kg_mid/dfid，唯品会mars_cid，中国裁判文书网（2020-06-30更新），淘宝密码，天安保险登录，b站登录，房天下登录，WPS登录，微博登录，有道翻译，网易登录，微信公众号登录，空中网登录，今目标登录，学生信息管理系统登录，共赢金融登录，重庆科技资源共享平台登录，网易云音乐下载，一键解析视频链接，财联社登录。

crawl spider JavaScript crack

JavaScript

957

258

1 年前