웹 스크래핑

웹사이트 크롤링, 헤드리스 브라우징 및 데이터 추출을 위한 프레임워크 및 도구.

Repositories

scrapy/scrapy

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python
60.5k

Elegant Scraper and Crawler Framework for Golang

Go
25.1k

Puppeteer 는 DevTools 프로토콜 또는 WebDriver BiDi 를 통해 Chrome 이나 Firefox 를 제어할 수 있는 고급 API 를 제공하는 JavaScript 라이브러리입니다. 기본적으로 헤드리스 모드로 실행되며 웹 스크래핑, 테스트 및 자동화에 널리 사용됩니다.

TypeScript
93.7k

The fast, flexible, and elegant library for parsing and manipulating HTML and XML.

TypeScript
30.1k

🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://discord.gg/jP8KfhDhyN

Python
61.1k

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python
44.8k

⬛️ CLI tool and library for saving complete web pages as a single HTML file

Rust
14.8k