最近在GitHub上看到的MindsDB[1]项目让我眼前一亮。可以构建、训练、优化和部署机器学习模型,要获得预测,只需查询数据和ML模型即可。MindsDB通过采用AI表的概念将机器学习引入数据库。AI表是作为虚拟表存储在数据库中的机器学习模型。它们有助于根据数据进行预测。您可以在数据库中进行时间序列、回归和分类预测,并通过使用简单的SQL语句查询AI表几乎立即获得输出。接下来我们来看一个官方提供的简单例子。1、申请免费的MindsDB云账号,即刻体验。如果你更喜欢在本地部署,你可以安装他们的Docker版本。2.从SQL客户端连接到MindsDB。3.使用CREATEDATABASE连接数据库。MindsDB有一个开箱即用的示例数据库。请使用CREATEDATABASE语句如下:CREATEDATABASEexample_dataWITHENGINE="postgres",PARAMETERS={"user":"demo_user","password":"demo_password","host":"3.220.66.106","port":“5432”,“数据库”:“演示”};执行后可以得到如下结果:QueryOK,0rowsaffected(3.22sec)4.可以使用标准SQL预览数据,如下图:5.使用CREATEPREDICTOR创建预测器:CREATE预测器mindsdb.home_rentals_predictorFROMexample_data(SELECT*FROMdemo_data.home_rentals)PREDICTrental_price;执行后:查询正常,0行受影响(9.79秒)6.检查预测器的状态:SELECTstatusFROMmindsHEdictorsname='home_rentals_predictor';将获得培训或完成的状态:+----------+|状态|+----------+|培训|+---------+或+----------+|状态|+----------+|完成|+------------+7。执行预测SELECT语句允许您根据特征进行预测,其中特征是用于进行预测的输入变量或输入列。现在预测一个1000平方英尺有两个浴室的房子的租金是多少。从mindsdb.home_rentals_predictorWHEREnumber_of_bathrooms=2ANDsqft=1000中选择rental_price;结果如下:+------------+|出租价格|+------------+|1130|+------------+至此,你已经成功地使用SQL训练了一个预测模型,并获得了预测数据!特点1.自动数据预处理、特征工程和编码2.分类、回归、时间序列任务3.无需“传统部署”即可将模型投入生产4.获取每个预测的模型准确率分数和置信区间5.可以集成ML模型与现有数据Join6、异常检测7、模型可解释性分析8、支持GPU训练支持和以下数据库:最后,只用SQL来使用机器学习真的很方便,MindsDB的技术细节可以访问官方文档[2】,如果对您有帮助,请点击分享给更多的朋友。参考资料:[1]MindsDB:https://github.com/mindsdb/mindsdb[2]文档:docs.mindsdb.com
