刮quest
因为刮总是冒险
npm install scrapequest
var scrapequest = require ( 'scrapequest' ) ;
var url = 'https://en.wikipedia.org/wiki/Radioisotope_thermoelectric_generator' ;
scrapequest . scrape ( url , function ( err , $ ) {
console . log ( $ ( 'h1' ) . text ( ) )
} ) ;
这是一个队列,它可以使用interval选项保护您免于过于费力地抓取, interval选项是在抓取url之间等待的毫秒数。 默认值为1000毫秒。
scrapequest . interval = 0 ; // superfast!
// or
scrap