参考QQ群-Javascript高级爬虫-作者自建群,欢迎加入!awesome-java-crawler-作者收集的爬虫相关工具和资料一个帮你自动创建阿里云抢占实例并开启网络加速的脚本-自动创建阿里云海外抢占节点Squid+SSH隧道实现加密代理-可以参考这篇文章在CentOS上配置SSH免登录安装node.js二进制发布包-在CentOS上安装最新版nodejs前言要在CentOS7上安装部署puppeteer并正常显示网页,可不像在Windows上那么简单.推荐使用现成的docker镜像,这里总结一下直接安装的方案,其实超级简单。安装nodejs的步骤,请参考安装cnpm的参考。npm安装cnpm-g;如果服务器在墙外,可以忽略这一步安装puppeteer。通常情况下,它会和项目目录下的所有依赖库一起安装(包括package.json),即执行:cnpminstall如果只是为了测试,可以直接在当前目录下安装:cnpminstallpuppeteer安装完成后,您可以使用以下命令查看chrome可执行文件中仍然缺少哪些依赖库(版本号可能不同):lddnode_modules/puppeteer/.local-chromium/linux-706915/chrome-linux/chromeinstallmissingdependencies:yuminstall-yalsa-lib.x86_64atk.x86_64cups-libs.x86_64GConf2.x86_64gtk3.x86_64ipa-gothic-fontslibXcomposite.x86_64libXcursor。x86_64libXdamage.x86_64libXext.x86_64libXi.x86_64libXrandr.x86_64libXScrnSaver.x86_64libXtst.x86_64pango.x86_64wqy-unibit-fonts.noarchwqy-zenhei-fonts.noarchxorg-x11-fonts-dpi-fonts-100d-100dxorg-x11-fonts-cyrillicxorg-x11-fonts-miscxorg-x11-fonts-Type1xorg-x11-utils至此安装完成,可以验证。验证index.js是否写入,内容如下:constpuppeteer=require('puppeteer');(async()=>{constbrowser=awaitpuppeteer.launch({args:['--no-sandbox','--disable-setuid-sandbox']});constpage=awaitbrowser.newPage();awaitpage.goto('https://www.segmentfault.com');awaitpage.screenshot({path:'sf.png'});awaitbrowser.close();})();注意:1)启动chrome必须加上--no-sandbox参数,否则会报错2)默认以headless(无界面)模式启动chrome,即自动执行上面的脚本与--headless参数nodeindex.js,会在当前目录生成四福首页截图。可以打开验证中文是否正常显示。
