记录puppeteer爬虫遇到的坑1.page.$(selector)中,selector不准确2.page.goto(url[,options]),跳转多页卡在page中。$(selector),选择器不准确打开控制台,在页面查看器中右键要使用的DOM,复制->复制选择器,将本页DOM元素最准确的节点路径复制到这次比如我想获取四福body首页logo的节点路径>div.global-nav.sf-header.sf-header--index>nav>div.row.hidden-xs.hidden-sm>div.col-sm-8.col-md-9.col-lg-9>div.sf-header__logo>h1>apage.goto(url[,options]),跳转到多个页面时,puppeteercrawler是获取dom的页面,{waitUntil:'domcontentloaded'},加上这句话的意思是等待页面DOM加载完成后再返回一个值,避免了在页面DOM加载完成之前就爬取数据导致的错误。awaitpage.goto(url,{waitUntil:'domcontentloaded'});
