ChatGPT教你写AI包，7个对话写出识别模型，准确率高达99.7%

时间：2023-03-12 07:01:42 科技观察

现在AI小白连教程都不用看，只用ChatGPT就可以创建模型。它不仅可以帮助您查找数据集、训练模型和编写代码，还可以一步完成评估准确性和创建程序。有这样一个25岁的男孩，他请ChatGPT帮他创建了一个地理位置识别程序，最终准确率高达99.7%。而且所有的细节和步骤都在，教你边工作边学习。这一波被ChatGPT感动了。更贴心的是，每次问答后，ChatGPT都会说最后一句话：Ifyouhaveanyquestions,pleaseletmeknow。在具体实施项目之初，这位小哥就明确表示：我不想再努力了，你能帮我创建一个AI程序吗？将两个坐标作为输入，预测他们在哪个国家。而ChatGPT“欣然”接受了挑战，并提醒这位小哥需要相应的数据集，否则无法训练模型。另外，如果有更多的信息就更好了。首先，需要找到合适的数据集。小哥又问了ChatGPT，结果二话不说就抛出三个选项让其选择，而且还有介绍链接。从三个数据集来看，naturalearth数据集明显好一些，它还有“边界”、海岸线等信息，意味着要给模型解释“边界”的概念，分离标签。但是作为新手，第一个数据集的任务相关数据较多，模型更容易实现。作者最终选择了第一个数据集。将这个决定告诉ChatGPT后，它会教你创建一个DataFrame（数据框）并给出示例代码。执行成功后，进入第二阶段：模型训练。ChatGPT也二话不说给了一份代码，甚至还附上了详细的解释。此代码将使用k-NN算法根据给定坐标预测国家/地区。KNN算法是一种简单的算法，它根据输入的k个最近邻居的多数类对输入进行分类。在此示例中，数据以80-20的比例分为训练集和测试集。然后在训练集上训练KNN分类器，并在测试集上测试模型的准确性。请记住，这是一个简单的示例，模型可能不是很准确。大家可以尝试尝试不同的算法和不同的k值，看看能否提高模型的准确率。在丢弃一些空白数据（没有坐标的国家）后，第一次执行k-NN训练成功，准确率为99.7%。然而，这个结果并不那么令人满意。作者将这些原因归结为：不同国家之间的数据分布不均；一些数据错误；偏见等问题。这将我们带到第三步：重新评估。在此代码中，我使用OpenCageGeocodingAPI从坐标中获取国家/地区信息。您需要将YORBAPI_KEY替换为您的API密钥才能访问API。您可以在OpenCage网站上注册一个免费的API密钥。根据说明，作者修改了代码，结果发现有很多NA错误，相当于只剩下30%的数据。但地球确实主要是水。（没问题，Doge）最终模型的准确率下降了一点，98.6%，但作者对这个结果很满意，毕竟只有7轮对话可以帮助创建一个AI模型。还尝试了其他算法，但这不是我的第一次尝试。在第一次对话中，他使用了同源较小的数据集，需要更多的数据集修正，而ChatGPT提供的第一个模型训练代码是逻辑回归，准确率只有51%。然后它尝试了不同的“求解器”（准确率约为65%），以及其他算法，包括随机森林和k-NN，准确率分别为93%和92%。这位25岁的兄弟在SentinelOne担任高级安全研究员，研究和开发恶意软件检测逻辑。因为对机器学习很感兴趣，所以开始自学，有一定的基础。在这次对话中，他竟然以新手的身份与ChatGPT对话，被其强大的效果所折服。最后他还表示，他真的在考虑用“他们”而不是“它”来调用ChatGPT。所以AI小白们，赶紧用ChatGPT吧。(Doge)完整对话：https://sharegpt.com/c/7zLivmp参考链接：https://xrl1.sh/posts/coordinates-model-with-ChatGPT/

上一篇：JupyterNotebooks：你一直在寻找的基于Web的开发工具

下一篇：2018年Android应用开发趋势

ChatGPT教你写AI包，7个对话写出识别模型，准确率高达99.7%相关文章