现在AI小白连教程都不用看,只用ChatGPT就可以创建模型。它不仅可以帮助您查找数据集、训练模型和编写代码,还可以一步完成评估准确性和创建程序。有这样一个25岁的男孩,他请ChatGPT帮他创建了一个地理位置识别程序,最终准确率高达99.7%。而且所有的细节和步骤都在,教你边工作边学习。这一波被ChatGPT感动了。更贴心的是,每次问答后,ChatGPT都会说最后一句话:Ifyouhaveanyquestions,pleaseletmeknow。在具体实施项目之初,这位小哥就明确表示:我不想再努力了,你能帮我创建一个AI程序吗?将两个坐标作为输入,预测他们在哪个国家。而ChatGPT“欣然”接受了挑战,并提醒这位小哥需要相应的数据集,否则无法训练模型。另外,如果有更多的信息就更好了。首先,需要找到合适的数据集。小哥又问了ChatGPT,结果二话不说就抛出三个选项让其选择,而且还有介绍链接。从三个数据集来看,naturalearth数据集明显好一些,它还有“边界”、海岸线等信息,意味着要给模型解释“边界”的概念,分离标签。但是作为新手,第一个数据集的任务相关数据较多,模型更容易实现。作者最终选择了第一个数据集。将这个决定告诉ChatGPT后,它会教你创建一个DataFrame(数据框)并给出示例代码。执行成功后,进入第二阶段:模型训练。ChatGPT也二话不说给了一份代码,甚至还附上了详细的解释。此代码将使用k-NN算法根据给定坐标预测国家/地区。KNN算法是一种简单的算法,它根据输入的k个最近邻居的多数类对输入进行分类。在此示例中,数据以80-20的比例分为训练集和测试集。然后在训练集上训练KNN分类器,并在测试集上测试模型的准确性。请记住,这是一个简单的示例,模型可能不是很准确。大家可以尝试尝试不同的算法和不同的k值,看看能否提高模型的准确率。在丢弃一些空白数据(没有坐标的国家)后,第一次执行k-NN训练成功,准确率为99.7%。然而,这个结果并不那么令人满意。作者将这些原因归结为:不同国家之间的数据分布不均;一些数据错误;偏见等问题。这将我们带到第三步:重新评估。在此代码中,我使用OpenCageGeocodingAPI从坐标中获取国家/地区信息。您需要将YORBAPI_KEY替换为您的API密钥才能访问API。您可以在OpenCage网站上注册一个免费的API密钥。根据说明,作者修改了代码,结果发现有很多NA错误,相当于只剩下30%的数据。但地球确实主要是水。(没问题,Doge)最终模型的准确率下降了一点,98.6%,但作者对这个结果很满意,毕竟只有7轮对话可以帮助创建一个AI模型。还尝试了其他算法,但这不是我的第一次尝试。在第一次对话中,他使用了同源较小的数据集,需要更多的数据集修正,而ChatGPT提供的第一个模型训练代码是逻辑回归,准确率只有51%。然后它尝试了不同的“求解器”(准确率约为65%),以及其他算法,包括随机森林和k-NN,准确率分别为93%和92%。这位25岁的兄弟在SentinelOne担任高级安全研究员,研究和开发恶意软件检测逻辑。因为对机器学习很感兴趣,所以开始自学,有一定的基础。在这次对话中,他竟然以新手的身份与ChatGPT对话,被其强大的效果所折服。最后他还表示,他真的在考虑用“他们”而不是“它”来调用ChatGPT。所以AI小白们,赶紧用ChatGPT吧。(Doge)完整对话:https://sharegpt.com/c/7zLivmp参考链接:https://xrl1.sh/posts/coordinates-model-with-ChatGPT/
