介绍image-to-latex是一个将LaTeX数学方程式图像映射到LaTeX代码的应用程序。图像到标记问题是由邓云天等人提出并尝试的。在2016年。他们通过解析来自arXiv的LaTeX论文源提取了大约100,000个公式。他们使用pdflatex来渲染公式,并将渲染后的PDF文件转换为PNG格式。在他们的模型中,首先使用CNN提取图像特征。然后使用RNN对特征行进行编码。最后,编码后的特征被RNN解码器使用。该模型共有948万个参数。最近Transformer在很多语言任务上都超越了RNN,所以作者在这个问题上做了新的尝试。项目地址:https://github.com/kingyiusuen/image-to-latex下载安装安装将源码克隆到本地文件夹:gitclonehttps://github.com/kingyiusuen/image-to-latex.gitcdimage-to-latex创建一个名为venv的虚拟环境并安装所需的包:makevenvmakeinstall-dev数据预处理运行以下命令下载im2latex数据集并进行所有预处理,图像裁剪步骤可能需要一个多小时。pythonscripts/prepare_data.py部署创建了一个API以使用经过训练的模型进行预测。使用以下命令启动并运行服务器:makeapi可以通过http://0.0.0.0:8000/docs上生成的文档查看API的使用情况。模型架构运行示例
