当前位置：首页 > Linux

2021年度最佳开源软件！

时间：2023-04-06 18:25:13 Linux

Sveltehttps://svelte.dev/Svelte是一种构建用户界面的全新方法。React和Vue等传统框架在浏览器中完成大量工作，而Svelte则在构建应用程序的编译阶段处理这些工作。与虚拟DOM不同。Svelte编写的代码可以在应用程序状态发生变化时通过外科手术更新DOM。Minikubehttps://minikube.sigs.k8s.io/Minikube是一个可以在本地单机上运行Kubernetes集群的工具。Minikube跨平台工作，不需要虚拟机，不需要在MacOS或Windows上安装Linux。支持多容器，如Docker、CRI-O、Containerd等。Pixiehttps://px.devPixie是一个查看Kubernetes的工具。可以查看Kubernetes集群的状态，比如服务器集群性能、网络状态、集群资源和相关应用等，还可以查看更详细的内容，比如pod状态、请求量、热图等Pixie的资源使用率只有5%左右。FastAPIhttps://fastapi.tiangolo.com/FastAPI是一个Python网络框架。FastAPI以其高效易用的特点赢得了开发者的青睐，直接挑战了Django和Flash的传统地位。FastAPI的优点是类型检查、自动swaggerUI、异步支持和强大的依赖注入。Crystalhttps://crystal-lang.org/Crystal面试多年。Crystal的特点是C语言的高效和Ruby的静态类型。今年早些时候发布了1.0版本，最新版本是1.2.1，已经足够稳定了。MicrosoftTerminalhttps://github.com/Microsoft/...MicrosoftTerminal是一个开源的Windows终端，提供类似于Mac和Linux命令行的体验。MicrosoftTerminal具有GPU加速渲染，比传统控制台有更好的性能提升。OBSStudiohttps://obsproject.com/OBSStudio是一款直播录屏软件，专为视频内容的高效采集、合成、编码、录制和流媒体而设计，支持所有流媒体平台。快捷键允许在视图之间平滑切换，甚至还有画中画和实时字幕的新功能。Shotcuthttps://shotcut.org/Shotcut是一个强大的视频编辑工具。Shotcut有中文版支持，可以运行在Windows、MacOS、Linux、BSD等操作系统上。Shotcut有上百种音视频格式，还有编解码器，不用导入直接编辑。WeaveGitOpshttps://github.com/weaveworks...WeaveGitOps是一个GitOps工具。其目的是简化DevOps工作流程，并通过声明式配置使Kubernetes更加稳定和安全。WeaveGitOps基于CloudNativeFoundation的Flux。ApacheSolrhttps://solr.apache.org/ApacheSolr是一个基于Lucene的全文搜索服务器，也是最流行的企业级搜索引擎。Solr放弃了开源许可证，但仍然免费。Solr可集群部署，可云部署，甚至包括自动调整加权结果的LTR算法。MLflowhttps://mlflow.org/MLflow是由ApacheSpark技术团队开源的机器学习平台。MLflow由Databricks创建并由Linux基金会托管，是一个MLOps平台，使用户能够跟踪、管理和维护各种机器学习模型、实验及其部署。MLflow提供了用于记录和查询实验（代码、数据、配置、结果）、将数据科学代码打包到项目中以及将这些项目插入到工作流中的工具。Orangehttps://orangedatamining.com/Orange是一个开源机器学习和数据可视化的工具。与RStudio和Jupyter等程序化或文本工具相比，Orange更直观、更易于操作。Orange包括一套完整的数据预处理组件，并提供数据核算、转换、建模、模式评估和探索的功能。Flutterhttps://flutter.dev/Flutter是Google推出的新SDK，用于构建跨平台的移动、Web、桌面和嵌入式设备应用程序。Flutter的滚动条、导航、图标、字体等组件整合了iOS和Android平台的差异。ApacheSupersethttps://github.com/apache/sup...ApacheSuperset是一个现代的、轻量级的可视化BI分析工具。ApacheSuperset在可视化、易用性和交互性方面非常有特色，用户可以轻松地对数据进行可视化分析。而ApacheSuperset已经达到了企业级商业软件的水平。Prestohttps://prestodb.io/Presto是一个开源的分布式SQL引擎，用于集群在线分析处理。Presto可以查询从文件到数据库的各种数据源，并将结果输出到BI和分析环境。更重要的是，Presto可以在Hive、Cassandra、关系型数据库中查询，Presto还可以结合多源数据查询。Facebook、Uber、Twitter和阿里巴巴创建了Presto基金会。其他成员现在包括Alluxio、Ahana、Upsolver和Intel。ApacheArrowhttps://arrow.apache.org/ApacheArrow是一个柱状内存分析层，旨在加速CPU和GPU上的大数据分析。它包括一组典型的平面和分层数据的内存表示，Arrow内存格式支持零拷贝读取和极快的数据访问，无需序列化。ApacheArrow目前支持的语言包括C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby和Rust。InterpretMLhttps://interpret.ml/InterpretML是微软推出的可解释机器学习包。它包含几种最先进的机器学习可解释性技术。InterpretML提供两种类型的解释：玻璃盒模型和黑盒模型。InterpretML使从业者能够通过一个内置的、可扩展的可视化平台在一个统一的API下使用多种方法轻松比较可解释性算法。InterpretML还包括ExplainableBoostingMachine(EBM)的首次实施，这是一种功能强大的可解释亮盒模型，可以与许多黑盒模型一样准确。Limehttps://github.com/marcotcr/limeLime（Localinterpretablemodel-agnosticexplanations本地可解释模型-不可知解释的缩写），Lime用于解释表格或图片的机器学习分类器。Lime能够解释两个或多个类别的黑盒分类器。分类器实现一个函数，该函数采用原始文本或numpy数组并输出每个类的概率。Daskhttps://dask.org/Dask是一个用于并行计算的开源库，可将Python包扩展到多台机器。Dask可以跨多个GPU分布数据和计算，在单个系统或多节点集群中运行。Dask可以与RapidscuDF、XGBoost和RapidscuML集成，用于GPU加速数据分析和机器学习。Dask还集成了NumPy、Pandas和Scikit-learn以进行并行化工作。BlazingSQLhttps://blazingsql.com/BlazingSQL是一个基于Rapids生态系统构建的GPU加速SQL引擎。BlazingSQL在Apache2.0许可下是开源的。BlazingSQL是cuDF的SQL接口，具有支持大规模数据科学工作流（包括提取、转换、加载）和企业数据集的各种功能。Rapidshttps://rapids.ai/Nvidia的Rapids是Nvidia开源的开源机器学习GPU加速平台。Rapids使用NVIDIACUDA原语进行底层计算优化，并通过Python将GPU的并行和高带宽内存对外开放。Rapids依赖于ApacheArrow柱状内存格式，包括cuDF（一个类似Pandas的DataFrame库）；cuML（机器学习库的集合，提供Scikit-learn中大多数算法的GPU版本）；和cuGraph（类似NetworkX的加速图形分析库）。PostHoghttps://posthog.com/PostHog是一个为开发者打造的开源产品分析平台。自动收集网站或应用程序上的每个事件，而无需将数据发送给第三方。PostHog提供基于用户事件的分析，抓取网站使用数据，统计每个用户在网站上的具体动作。PostHog自动捕获点击和浏览量来分析网站用户在做什么，而无需手动推送事件。LakeFShttps://lakefs.io/LakeFS提供了一种“像管理代码一样管理数据湖”的方式，独特地引入了类似Git的功能来管理数据版本。LakeFS可以帮助用户创建独立的、零拷贝（Zero-copy）的数据分支，在运行、测试和建模分析过程中不存在破坏共享对象的风险。与Git类似，LakeFS数据将包含提交记录、元数据字段和回滚等信息。另外，还有钩子，就是在分支合并到主分支之前，钩子会检查数据，确保完整性和质量。AmazonS3和AzureBlob已经在使用LakeFS。Meltanohttps://meltano.com/Meltano于2018年开始作为GitLab的内部项目，服务于GitLab数据管理。2021年从GitLab中独立出来，成为一家初创公司。Meltano是DataOps时代一款免费的ETL工具，旨在替代传统的ELT工具。ELT是指数据提取、加载和转换操作的统称。Meltano是开源的、自托管的、CLI（命令行）、可调试和可扩展的。Meltano开创了管道即代码的概念，Meltano项目可以进行版本控制、代码审查、持续集成和部署（CI/CD）以及容器化。Trinohttps://trino.io/Trino用于大数据分析的快速分布式SQL查询引擎2019年，PrestoDB的开发人员创建了一个名为PrestoSQL的项目分支。PrestoSQL于2020年12月因基础转移更名为Trino。Trino是一个分布式SQL分析引擎，具有优越的大数据分析性能。Trino可以同时高效查询EB级数据湖和海量数据仓库。Trino符合ANSISQL标准，可与R、Tableau、PowerBI、Superset等BI工具配合使用。跨Hadoop、S3、Cassandra、MySQL中的数据仓库的联合查询。StreamNativehttps://streamnative.io/StreamNative是一个弹性部署和可扩展的消息和事件流平台，大大简化了实时报告和分析工具以及企业应用程序流的数据管道构建。StreamNative将ApachePulsar分布式流处理架构与Kubernetes和混合云支持相结合，以及企业级功能、大数据、认证授权、性能监控等工具，不仅简化了应用程序的开发，也简化了流式数据部署和管理的应用。HuggingFacehttps://huggingface.co/HuggingFace是一家公司和一个网站。HuggingFace提供了一个非常有用的深度学习资源库，比如深度学习模型、数据集、网站使用空间等，但是大部分都是付费的。此外，HuggingFace的主要产品是聊天机器人，HuggingFace开发了自己的自然语言处理(NLP)模型，称为分层多任务学习(HMTL)，并在PyTorch-Transformers库下管理预训练的NPL模型。EleutherAIhttps://www.eleuther.ai/EleutherAI是一个开源社区人工智能项目，旨在打造一个完全去中心化的具有自主文明的单实例人工智能。EleutherAI项目于2011年启动，任何拥有互联网连接和GitHub帐户的人都可以参与。社区成员可以通过提交开发功能或提案来参与该项目。EleutherAI的开发者将每周更新项目的进展情况，并在YouTube上进行现场直播。2021年，EleutherAI发布了用于训练的825GB多样化文本数据集ThePile；并在6月宣布了GPT-J，这是一个具有60亿个参数的模型，大致相当于OpenAI的GPT-3的居里变量。随着GPT-NeoX的出现，EleutherAI计划将参数一路提升至1750亿，发起挑战，争夺最大的GPT-3模型。此外，OpenAI的GPT-3模型在文本生成方面实现了惊人的飞跃，甚至达到了人类水平的性能。不过其API并未完全开放。目前，只有OpenAI和微软可以完全访问所有训练集。Colabnotebooksforgenerativeart/Colabnotebooksforgenerativeart从OpenAI的CLIP（对比语言-图像预训练）模型开始，这是一种用于生成文本和图像向量嵌入的多模态模型。虽然CLIP是完全开源的，但OpenAI的神经网络DALL-E却不是。为了填补这一空白，RyanMurdoch和KatherineCrowson开发了Colab笔记本，将CLIP与其他开源模型（如BigGAN和VQGAN）相结合，以生成基于提示的生成艺术作品。基于麻省理工学院的开源许可，这些笔记本在过去的几十年里在互联网上广泛传播，被重新混合、修改、翻译，并被用来生成令人惊叹的艺术作品。来源：今日头条/a7028029253035770371/

上一篇：服务器租赁有什么优势

下一篇：[Linux]tar命令详解

2021年度最佳开源软件！相关文章