节点进程与线程

时间：2023-04-04 00:48:32 Node.js

1.进程进程指的是一个正在进行的程序，也就是正在运行的程序。进程是操作系统进行资源分配和调度的最小单位，因此每个进程都有自己独立的虚拟地址空间，一般包括文本区（textregion）、数据区（dataregion）和栈区（stackregion）).文本区存放处理器执行的代码；数据区存放全局变量和常量；栈区存放函数的参数和函数中定义的局部变量；堆用于存储程序员创建的对象。2、进程模块节点提供进程模块，用于获取当前进程中的相关信息。这是一个全局对象，不需要require就可以直接使用。如：process.title，可以指定创建的进程的名称。process.pid，可以得到当前进程的id。process.ppid可以得到当前进程的父进程id。比如我们在命令行窗口（bash）中执行nodeserver.js，那么server.js程序进程的父进程id就是命令行窗口的进程idprocess。env，可以指定当前进程的环境变量，比如可以通过process.env.NODE_ENVprocess.cwd()来识别当前项目是开发环境还是生产环境，可以得到的工作目录当前进程process.platform，可以获取当前运行的进程操作系统平台process.nextTick(callback)，可以为事件循环设置一个任务，node.js在进入之前会调用callback**process.uptime()next事件循环，可以获取当前进程的运行时间process.on()，可用于进程监控事件process.stdout、process.stdin、process.stderr，表示标准输出、标准输入、标准错误输出.console.log("hellonodeprocess.");process.title="我是一个节点进程";//设置进程名称console.log(`进程id为${process.pid},${process.uptime()}`);//打印进程id和运行时间当我们运行代码的时候，会发现电脑的活动监视器中并没有名为我是节点进程的进程，因为代码是很简单的同步代码，只是简单的输出，没有异步操作和等待操作，执行速度很快，输出完成后程序结束，从代码输出结果来看，进程运行时间为126ms，所以进程创建后代码被kill掉系统运行不久，所以我们看不到对应的进程名，即该进程是一个正在进行的程序。为了能够看到我们创建的进程，我们需要让程序运行更长时间，比如启动一个web服务器等待请求，开启一个setTimeout等，如下：consthttp=require("http");console.log("hellonodeprocess.");constserver=http.createServer();server.listen(3000,()=>{process.title="Mynodeprocess";//设置名称进程的console.log(`processidis${process.pid}，${process.uptime()}`);//打印进程id和运行时间});这时候我们可以在活动监视器中看到刚才创建的那个名为我的节点进程的进程已经没有了。3.线程线程是程序执行的最小单位。它是进程中代码的不同执行路线。一个进程可以包含多个线程，所以进程是线程的容器。进程之间相互独立，但进程的资源可以在同一个进程下的线程之间共享。我们知道Node程序在运行时是单线程的，也就是说程序只有一条执行路径，所以它的代码会按顺序同步执行。如果在执行过程中遇到过多的耗时同步操作，那么node的线程就会被阻塞，无法处理后续的响应。因此，我们不应该在请求处理的回调中包含过多的耗时代码。虽然请求来了，node会马上把这个请求的回调加入到事件循环对应的队列中，但是事件循环中的代码执行也需要跑到主线程中去。也就是说，处理请求的回调函数必须在主线程中执行。如果回调中有大量耗时计算，后续请求会被阻塞。consthttp=require("http");console.log("hellonodeprocess.");constserver=http.createServer();constlongRuning=()=>{letresult=0;for(leti=0;i<3000;i++){for(letj=0;j<1000;j++){for(letk=0;k<1000;k++){结果=结果+i+j+k;}}}返回结果;};server.on("request",(req,res)=>{console.log("request");if(req.url==="/test"){console.log(`开始处理请求`);conststartTime=Date.now();constresult=longRuning();constendTime=Date.now();console.log(endTime-startTime);res.end(`resultis${result}`);}else{res.end("ok");}});server.listen(3000,()=>{process.title="Mynodeprocess";//设置名称processconsole.log(`进程id为${process.pid},${process.uptime()}`);//打印进程id和运行时间});可以看到节点服务器在监听请求的时候，会注册一个回调函数来处理请求，回调函数中需要进行一次耗时计算，大概需要15秒左右，所以主线程是阻止。四、node单线程的理解我们都知道node是单线程的。其实准确的说，node的主线程是单线程。例如，如果我们启动一个节点应用程序，我们可以看到这个进程包含8个线程，而不是一个线程。其中一个是主线程，另外7个是非主线程，因为我们的node应用启动后，会创建一个V8引擎实例，而这个实例是多线程的，主要如下：主线程：负责编译和执行JS代码；编译/优化线程：在主线程执行时，可以对代码进行优化；analyzer线程：记录和分析代码的运行时间，为Crankshaft优化代码执行提供依据；多个用于垃圾收集的线程；异步IO对线程数的影响？当我们通过fs模块读取文件时，会发现进程中的线程数立马增加了4个，因为node中的一些IO操作（DNS、FS）和一些CPU密集型计算（Zlib、Crypto）会启用node的线程池，node的线程池默认是4个，所以线程数会变成12个，比如：当然我们也可以手动修改默认线程池的个数，比如：process.env。UV_THREADPOOL_SIZE=10;//将节点默认线程池数量改为10个。一开始process.env中没有常量UV_THREADPOOL_SIZE。我们需要手动设置它才能读取它。经过上面的配置，我们再次运行代码，发现node进程中的线程数变成了18个，比如node虽然是单线程模型，但是它是基于事件驱动的，自然可以应对高并发请求，因为一旦有web请求过来，node可以监听事件，然后处理请求，在事件环中加入回调函数，其IO是异步非阻塞的。进行IO操作时无需等待，可以在进行IO操作的同时处理其他请求。因此，节点请求处理速度的关键是事件循环中回调函数的执行速度。如果回调中有大量的计算，会占用大量的CPU资源，导致无法继续处理后续的请求。基于以上，我们可以采用多进程的方式，将大量的计算放在子进程中，避免过度占用主线程资源。5.多进程当你的应用包含大量的计算时，会占用大量的CPU计算时间，CPU会阻塞在主线程的计算中，后续的请求也会阻塞，后面的请求需要等待上一个请求执行后，最后一个请求的响应时间将是所有请求时间的总和。如果请求太多，最后一个请求的响应时间会变得很恐怖。因此，我们可以充分利用多核CPU的特点，开启多个进程，让子进程进行耗时计算。需要注意的是，启用多进程并不是为了解决高并发，而是为了充分利用CPU。node应用本身就具有高并发可以处理，因为只要请求来了就会加入事件循环，不需要等待。Node通过child_process模块??或者cluster模块创建子进程。child_process模块child_process模块是node的内置模块，但是需要require才能使用。我们可以通过child_process模块??提供的fork()方法创建一个新的进程。由于系统资源有限，fork是一个独立的进程，这个进程有一个独立的全新的V8实例，至少需要10M内存，所以不建议派生太多的子进程，一般情况下可以根据cpu核数确定，1个CPU对应1个进程。在创建子进程时，我们需要将模块路径传递给fork()方法，然后它会返回创建的子进程。其实就是把一个模块的处理交给子进程。consthttp=require("http");constfork=require("child_process").fork;console.log("hellonodeprocess.");constserver=http.createServer();server.on("request",(req,res)=>{console.log("request");if(req.url==="/test"){console.log(`开始处理请求`);constcomputeProcess=fork("./fork_compute.js");//传入子进程需要处理的模块路径，创建一个子进程computeProcess.send("启动一个新的子进程完成耗时计算。");computeProcess.on("message",(result)=>{//子进程收到计算结果数据console.log(`子进程计算完成，结果为${result}`);res.end(`resultis${result}`);computeProcess.kill();//杀死子进程});computeProcess.on("close",(code,signal)=>{console.log(`子进程收到关闭事件和${signal}信号，退出码为${code}`);computeProcess.kill();});console.log("请求已处理");}else{res.end("确定");}}）;服务器。listen(3000,()=>{process.title="Mynodeprocess";//设置进程名称console.log(`进程id为${process.pid},${process.uptime()}`);//打印进程号和运行时间});新建fork_compute.js文件用于长计算constlongRuning=()=>{letresult=0;for(leti=0;i<5000;i++){for(letj=0;j<1000;j++){for(letk=0;k<1000;k++){结果=结果+i+j+k;}}}returnresult;};process.on("message",(msg)=>{//这里的进程指的是创建的子进程console.log(`收到子进程发送的msg,${msg},the子进程的id为${process.pid}`);constresult=longRuning();//子进程开始执行计算耗时代码process.send(result);//传递子进程对象发送结果，然后使用子进程对象在父进程中接收它});使用子进程后，我们发现在请求处理回调中并没有长时间的计算代码执行。而是创建子进程，子进程监听消息Event，这里没有耗时长的计算代码，所以请求处理的很快，等子进程处理完时间就可以返回结果-消耗计算。cluster模块cluster其实就是对child_process的一层封装。集群也通过fork()方法创建子进程，但是不需要传递任何参数，必须由主进程调用，因为它是根据主进程复制一个子进程。主进程该进程不负责处理请求，只负责绑定端口和调度工作任务。它通过内置的负载平衡管理子进程。consthttp=require("http");constcluster=require("集群");constcpuNums=require('os').cpus().length;//获取CPU核数if(cluster.isMaster){//如果是主进程process.title="我的节点进程";//设置主进程的名称for(leti=0;i{//监听子进程退出事件console.log(`worker${worker.id}退出。`)});cluster.on('fork',(worker)=>{//监听子进程创建事件console.log(`fork:worker${worker.id}`)});cluster.on('listening',(worker,addr)=>{//监听子进程进入监听事件console.log(`worker${worker.id}listeningon${addr.address}:${地址端口}`)});cluster.on('online',(worker)=>{//监听子进程创建成功事件console.log(`worker${worker.id}isonlinenow`)});}else{process.title=`我的工作进程${cluster.worker.id}`http.createServer((req,res)=>{console.log(cluster.worker.id);if(req.url==="/test"){Cconsole.log(`开始处理请求`);conststartTime=Date.now();常量结果=longRuning();constendTime=Date.now();console.log(endTime-startTime);res.end(`结果是${result}`);}else{res.end("确定");}}).listen(3000);}constlongRuning=()=>{让结果=0;for(leti=0;i<3000;i++){for(letj=0;j<1000;j++){for(letk=0;k<1000;k++){结果=结果+i+j+k;}}}返回结果;};我们通过主进程执行完上面的代码后，如果在主进程中使用cluster模块创建子进程，那么上面的代码会被创建的子进程重新执行，所以当上面的代码运行在子进程在运行时，我们可以使用子进程创建服务器，即执行创建服务器的代码，相当于一个子进程对应一个服务器。当一个子进程在处理长计算时，另一个子进程可以马上处理一个新的请求过来，从而充分利用CPU，需要注意的是cluster.isMaster的判断必须在应用程序代码，因为子进程无法调用fork()方法。//查询哪个进程正在使用3000端口lsof-i:3000我们可以通过这条命令来查看哪个进程经常使用3000端口。从查询结果可以看出，主进程实际上是在监听3000端口。可以说主进程创建一个socket并绑定监听目标端口，然后主进程通过IPC通道与子进程通信，通过调用将主进程的socket（句柄）传递过去子进程的send方法，内部通过RoundRobin负载均衡技术将请求转发给子进程，后面会讲到handle传递。需要注意的是，子进程对主进程有依赖关系。也就是说，如果主进程退出，则所有子进程也会退出；但子进程退出不会影响主进程。6.节点多进程端口监听问题一般来说，一个端口只能被一个进程监听。如果一个端口已经被监听，而另一个进程试图监听该端口，则会报错，提示该端口已经被占用，如下所示：events.js:174thrower;//Unhandled'error'event^Error:listenEADDRINUSE:addressalreadyinuse::3000那么node是如何解决多个进程同时监听同一个端口的呢？所谓句柄就是一个引用，可以用来标识一个资源。它包含一个指向对象的文件描述符，可以看成是对应内核资源的指针。句柄可以是服务器、套接字套接字或任何底层的_handle属性。节点可以通过发送句柄来避免句柄资源的浪费。子进程对象的send(message,handle)的第二个参数是句柄。//parent.jsconsthttp=require("http");constchildProcess=require("child_process");constserver=http.createServer((req,res)=>{res.end(`我是主进程--${process.pid}`);});constchildProcess1=childProcess.fork("./child.js");//创建子进程1constchildProcess2=childProcess.fork("./child.js");//创建子进程2server.listen(3000,()=>{global.server=server;//保存主进程中创建的服务器对象childProcess1.send("server",server);//保存服务器在主进程中创建将其作为句柄传递给其子进程childProcess2.send("server",server);//将主进程创建的服务器作为句柄传递给其子进程server.close();//主进程关闭连接后，不会影响子进程});//child.jsconsthttp=require("http");constserver=http.createServer((req,res)=>{res.end(`我是一个子进程--${process.pid}`);});process.on("message",(message,handle)=>{//handle.close();//这里不能关闭，否则无法监听到连接事件console.log(global.server===handle);//false，说明句柄没有传递句柄时直接传递handle.on("connection",(socket)=>{//子进程获取server.emit("connection",s插座）;//触发服务器请求监听回调});});#通过以下命令发送10个连续的请求测试for((i=1;i<=10;i++));docurlhttp://localhost:3000;echo"";done可以看到主线程中创建的server关闭close连接后，并不会影响子进程监听连接事件，因为子进程对象的send方法实际上并没有传递该对象，而是手柄。即server._handle，但是传递过来的对象还是同类型的对象，所以子进程拿到handle后会新建一个Server对象，所以子进程拿到的server对象并不是里面创建的server对象主进程，因为新创建的服务器对象和主线程有相同的句柄，所以它也可以监听3000端口的连接，然后向子进程创建的服务器发起连接事件，并传递socket到它，所以子进程的server也可以处理request节点之所以多进程不会造成端口冲突，主要是以下两个原因：子进程中调用的listen方法被hack了，所以子进程的监听实际上不起作用。节点可以通过传递句柄来共享句柄。

上一篇：从无到有实现一套自己的UI框架——发布到npm_0

下一篇：参与筹备《D2前端技术论坛》是一种怎样的体验？

节点进程与线程相关文章