数据科学可能是一项昂贵的工作。物理基础设施和设备、云托管服务和数据库访问会迅速增加大量成本。因此,这个行业可能很难起步。大多数小公司每年在数据分析上的花费超过10,000美元,但大多数个人负担不起。无论您是独自工作还是组建公司,您都需要一个更实惠的解决方案。以下是如何在不花大钱的情况下设置您的架构。1.寻找提供免费套餐的服务提供商幸运的是,其中许多提供商还为入门级用户提供免费或低成本计划。甚至像AWS这样的行业领导者也免费提供S3和AWSLamba之类的东西,但有限制。您无法访问免费套餐中提供商的所有服务,并且您的存储空间或访问频率可能有限。确定您的项目需要什么,然后货比三家,看看哪个最适合您的要求。2.青睐基于网络的软件在购买要使用的软件工具时,重点关注基于网络的选项,而不是传统的设备上的应用程序。如果您将大部分或全部业务运营转移到网上,对物理设备的要求就不会那么高。然后,您可以减少在计算机、服务器或其他基础设施上的花费,因为您不需要那么多的存储或处理能力。查看基于网络的选项时,请确保您知道它们的收费方式。Kubernetes操作的许多计费选项都按小时集群量收费,这很快就会变得非常昂贵。确保X-as-a-Service选项的成本不会高于本地解决方案。3.重新思考什么是必要的另一种降低架构成本的方法是消除一些选项。许多功能和过程可能很昂贵,但您可能并不需要它们。例如,托管费用通常在1,000美元到4,000美元之间,但您不一定需要唯一的域名。在分析预算和目标时,重新考虑您是否需要清单上的每一项。有些功能可能会有所帮助,但不会显着影响您的最终产品,因此最好暂时不要使用它们。4.使用开源数据库数据科学的另一个可能很昂贵的部分是数据库。收集自己的数据很慢,需要大量的基础设施成本,而且许多公开可用的数据库都很昂贵。您可以通过在开源数据库上训练您的程序来避免这些成本。许多开源数据库会为您提供有限的免费访问权限。一些服务提供商的免费套餐(例如Supabase)甚至免费提供对数据库的完全访问权限,通常基于开源选项。但是,在使用这些开放数据库时,一定要检查它们的安全性并在处理它们之前清理数据。5.从小处着手最后,您可以通过降低目标来控制成本。大型、开创性或改变游戏规则的项目的复杂性和存储要求可能超出您的有限预算。先专注于小规模、低强度的项目,等收入多了再扩张也不晚。小项目可以让免费资源相对有限的效用感觉不那么受限。如果你能坚持到赚到更多的钱来扩大规模,那么免费的数据库和托管工具会大有帮助。数据科学不一定很昂贵数据科学一开始可能很昂贵,尤其是考虑到一些企业在这方面的花费。虽然这些费用加起来可能是天文数字,但不一定如此,特别是对于新的数据科学操作。遵循上述五个步骤将帮助您在不花大钱的情况下构建您的架构。如果您已经拥有一些工具,您甚至可以免费开始工作。然后您就可以开始扩展您的业务,以便将来可以继续进行更大的项目。原标题:HowtoSetSetYourDataScienceStackonaBudgetbyDevinPartida
