如何用Python实现分布式计算？

时间：2023-03-26 12:37:22 Python

面对计算密集型任务，除了多进程，就是分布式计算。如何用Python实现分布式计算？今天分享一个很简单的方法，就是使用Ray。什么是RayRay是一个基于Python的分布式计算框架，采用动态图计算模型，提供简单通用的API来创建分布式应用程序。使用起来非常方便。可以使用装饰器对代码进行极少的修改，让原本运行在单机上的Python代码轻松实现分布式计算，目前多用于机器学习。Ray的特点：1.为构建和运行分布式应用程序提供简单的原语。2.使用户能够在很少甚至零代码更改的情况下并行化独立代码。3.RayCore包括一个庞大的应用程序、库和工具生态系统，以支持复杂的应用程序。例如Tune、RLlib、RaySGD、Serve、Datasets、Workflows。安装Ray最简单的方法就是安装官方版：pipinstall-Uraypipinstall'ray[default]'如果是Windows系统，必须安装VisualC++runtime。其他安装方式请参考官方文档。使用Ray作为装饰器来处理分布式计算：importrayray.init()@ray.remotedeff(x):returnx*xfutures=[f.remote(i)foriinrange(4)]print(ray.get(futures))#[0,1,4,9]先执行ray.init()，然后在函数前添加装饰器@ray.remote，执行分布式任务，实现分布式计算。装饰器@ray.remote也可以装饰一个类：importrayray.init()@ray.remoteclassCounter(object):def__init__(self):self.n=0defincrement(self):self.n+=1defread(self):returnself.ncounters=[Counter.remote()foriinrange(4)]tmp1=[c.increment.remote()forcincounters]tmp2=[c.increment.remote()对于计数器中的c]tmp3=[c.increment.remote()forcincounters]futures=[c.read.remote()forcincounters]print(ray.get(futures))#[3,3,3,3]当然，上述的分布式计算仍然是在自己的电脑上进行的，只是采用分布式的形式。程序执行过程中，可以输入http://127.0.0.1:8265/#/查看分布式任务的执行情况：那么如何实现Ray集群计算呢？然后往下看。使用RayClusteringRay的优势之一是能够在同一程序中利用多台机器。当然，Ray可以在一台机器上运行，因为通常情况下，你只有一台机器。但真正的力量在于在一组机器上使用Ray。Ray集群由一个头节点和一组工作节点组成。需要先启动头节点，将头节点的地址分配给worker节点，形成集群：可以使用RayClusterLauncher配置机器，启动多节点Ray集群。您可以在AWS、GCP、Azure、Kubernetes、阿里云、本地和Staroid上使用集群启动器，甚至可以在您的自定义节点提供商上使用。Ray集群还可以利用RayAutoscaler，它允许Ray与云提供商交互，根据规范和应用程序工作负载请求或释放实例。现在，让我们快速演示一下Ray集群的功能。这里我们使用Docker启动两个Ubuntu容器来模拟集群：环境一：172.17.0.2作为头节点环境二：172.17.0.3作为工作节点，可以有多个工作节点具体步骤：1.下载ubuntu镜像dockerpullubuntu2.启动ubuntu容器并安装依赖项启动第一个dockerrun-it--nameubuntu-01ubuntubash启动第二个dockerrun-it--nameubuntu-02ubuntu用bash检查它们的IP地址：$dockerinspect-f"{{.NetworkSettings.IPAddress}}"ubuntu-01172.17.0.2$dockerinspect-f"{{.NetworkSettings.IPAddress}}"ubuntu-02172.17.0.3然后分别安装python,pip,rayaptupdate&&aptinstallpython3aptinstallpython3-pippip3在容器内安装ray3。启动头节点和工作节点，选择其中一个容器作为头节点，这里选择172.17.0.2，执行：raystart--head--node-ip-address172.17.0.2默认端口为6379，可以使用--port参数修改默认端口，启动后结果如下：忽略警告，可以看到有提示，如果要使用其他节点绑定到头部，可以这样做像这样：raystart--address='172.17.0.2:6379'--redis-password='5241590000000000'在另一个节点上执行上面的命令启动worker节点：如果要关闭，执行：raystop4.随机选择一个节点执行任务，执行以下脚本，修改ray.init()函数的参数：fromcollectionsimportCounterimportsocketimporttimeimportrayray.init(address='172.17.0.2:6379',_redis_password='5241590000000000')print('''这个集群总共有{}个节点，总共有{}个CPU资源'''.format(len(ray.nodes()),ray.cluster_resources()['CPU']))@ray.remotedeff():time.sleep(0.001)#返回IP地址。返回socket.gethostbyname(socket.gethostname())object_ids=[f.remote()for_inrange(10000)]ip_addresses=ray.get(object_ids)print('Tasksexecuted')forip_address,num_tasksinCounter(ip_addresses.items():print('{}taskson{}'.format(num_tasks,ip_address))执行结果如下：可以看到172.17.0.2执行了4751个任务，172.17.0.3执行了5249个任务，实现分布式计算的影响。最后，借助Ray，您可以在不使用Python的多处理的情况下实现并行计算。现在的机器学习主要是计算密集型任务，没有分布式计算速度会很慢。Ray提供了一个简单的解决方案来实现分布式计算。

上一篇：说说python协程和golang协程的区别

下一篇：【K哥的爬虫法则】爬虫第一案，侵犯个人隐私，“入侵”短视频服务器！

如何用Python实现分布式计算？相关文章