当前位置: 首页 > 科技观察

停止使用arxiv链接!引用更加规范,华博士创造了一个小工具

时间:2023-03-16 14:54:54 科技观察

,只需要两步就可以将文档的arXiv信息转换成官方源信息。随着预印本平台arXiv的广泛使用,越来越多的研究人员在为论文撰写参考文献时更愿意直接使用arXiv信息。这看起来很方便,但是有一个问题:这篇arXiv论文是否发表在ACL、EMNLP、NAACL、ICLR或AAAI等学术会议上?是的,在某些情况下,仅引用arXiv信息并不那么准确,这种不准确的参考书目条目甚至可能违反某些会议的论文提交或camera-ready版本提交规则。如何解决这个问题呢?近日,我校毕业生、南加州大学博士生林宇辰开发了一个简单的Python工具Rebiber,可以基于ACLAnthology和DBLP数据库自动解决这个问题。项目地址:https://github.com/yuchenlin/rebiber下图为Rebiber的使用示例:本例中文章的原始信息来自GoogleScholar,仅包括标题、作者、期刊(arXiv)和年份。事实上,该论文已被EMNLP2020录用,原始信息明显不够准确。Rebiber转换后,将原始arXiv信息转换为来自官方来源的准确信息,包括标题、作者、年份、月份、出版商、数字对象标识符(doi)、URL等详细信息。Rebiber支持的会议包括ACL涵盖的会议Anthology,如ACL、EMNLP、NAACL及其workshop,以及DBLP涵盖的,如ICLR2020。目前Rebiber支持的会议列表如下:用户也可以手动添加DBLP中包含的任何会议:只需下载会议bib文件从DBLP到data文件夹,转成json格式,添加路径到bib_list.txt即可。如何使用?该工具也非常易于使用。首先,运行以下命令行:gitclonehttps://github.com/yuchenlin/rebiber.gitpipinstallbibtexparsertqdmcdrebiber然后,将书目条目规范化为正式格式:pythonnormalize.py-iexample_input.bib-oexample_output.bib-lbib_list.txt只需要很简单arXiv信息的操作可以转换成官方信息。项目作者简介项目作者林雨辰毕业于上海交通大学IEEE领航班。曾获上海市优秀本科生奖学金、上海交通大学优秀学士论文奖。他现在正在攻读博士学位。南加州大学计算机科学专业。任翔,理学院助理教授,智能与知识发现(INK)研究实验室主任。他曾在微软亚洲研究院和谷歌AI进行过多次实习。他的研究兴趣包括构建能够深入理解世界的神经符号系统,集成信息提取、知识图谱、机器推理、图神经网络和模型鲁棒性技术。最近的研究集中在使用常识推理来推进自然语言处理(理解和生成)。在ICLR、AAAI、EMNLP、KDD、ACL等学术会议上发表多篇论文。