当前位置: 首页 > 后端技术 > Java

清华大学开源了一个神器,在GitHub上火了

时间:2023-04-01 19:47:07 Java

近日,清华大学在GitHub上开源了一个神器万次网(WantWrong)。到字典。什么是反向字典?普通词典会告诉您单词的定义,而反向词典则相反,它会告诉您哪些单词与您输入的描述的含义相匹配。下图是万词网在线反向词典的页面截图,演示了一个反向查词的例子。输入“山很高”,系统会返回一系列模型认为表达“山很高”的词,例如“伟大”、“崇高”等。反向字典有什么用?解决“舌尖现象”(tip-of-the-tongue,又称说不出来的话),即暂时忘记单词的问题,帮助语言学习者学习和巩固词汇量Improvement选择性失语症患者的生活质量。这种病的症状是他们可以认识和描述一个物体,但是却记不住物体的名字。有时,这个工具可以派上用场。比如当你心慌拿不定主意,不知道该用哪个词的时候,你可以输入,会得到犹豫不决心慌等100个词。并且语音和押韵也可以定制。此外,还支持中文、英文、中英、英中等不同的转换方式。整体系统架构也很简单:万词网的核心模型是清华大学计算机系自然语言处理实验室(THUNLP)在AAAI-20上发表的论文中提出的多通道逆向字典模型:Multi-channelReverseDictionaryModel[Paper][Code],其模型架构如下:关于清华大学自然语言处理与社会人文计算实验室清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于1970年代90年代末,在黄长宁教授的带领下,初步从事中文信息处理方面的研究工作。是国内开展自然语言处理研究最早、影响最大的科研单位。科学技术专业委员会挂靠单位。实验室学术带头人为孙茂松教授,实验室教学团队还包括刘洋教授和刘志远副教授。实验室对以汉语为核心的自然语言处理前沿基础课题进行系统深入的研究。研究领域涵盖计算语言学的核心问题以及社会计算和人文计算。在实验室的支持下,实验室师生在IJCAI、AAAI、ACL、EMNLP等国际顶级会议和期刊上发表了多篇高水平学术论文,并与国际名校长期保持着良好的合作关系CMU、NUS、Google等企业。优秀毕业生大多在清华、谷歌、百度、阿里、微软等名校和公司工作。WantWords由THUNLP开发和维护。项目指导教师为孙茂松教授、刘志远副教授。开发团队成员包括齐凡超、张磊、杨彦辉。目前Wantwords在GitHub上已被标记1K星,共有56个分支(GitHub地址:https://github.com/thunlp/Wan...)开源最前沿(ID:OpenSourceTop)编译源美来自:https://github.com/pwxcoo/chi...