-
【nodeJS爬虫】前端爬虫系列 -- 小爬「博客园」
前端同学可能向来对爬虫不是很感冒,觉得爬虫需要用偏后端的语言,诸如 php , python 等。
当然这是在 nodejs 前了,nodejs 的出现,使得 Javascript 也可以用来写爬虫了。由于 nodejs 强大的异步特性,让我们可以轻松以异步高并发去爬取网站,当然这里的轻松指的是 cpu 的开销。
要读懂本文,其实只需要有
- 能看懂 Javascript 及 JQuery
- 简单的 nodejs 基础
- http 网络抓包 和 URL 基础