本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。身为科技编辑的我,最近和国外的老板互发邮件,感觉自己英语六级过后的写作水平真的是越来越着急了。如何使用从句?时态对吗?看着对面主编锐利的目光,那一刻,我真想问问自己,为什么不好好学习,天天向上。于是,我决定,我要好好学习英语写作!想要提高自己的水平,不自己写总是没那么有趣。那么,问题来了:写的好不好,谁帮我批改一下?其实,从小学、小学、初中、英语四六级、雅思托福……如何提高英语作文一直是个难题。尤其是各种考试都有严格的评分标准,但我们身边怎么总有经验丰富的阅卷老师帮助针对性的复习和提高呢?听到我的烦恼,网易的一个胖友向我招手:你看我手机里这个红色的app。里面有一个新推出的AI,可以帮你批改英文作文。是啊,如果AI真的能准确评分,甚至给出修改建议,那像我这样的同学岂不是随时随地都能练出英语作文飞起来?稍微研究了一下,发现有相当多的产品有AI批改英语作文的功能:网易有道词典、微软爱写作(小英)、百开网、Grammarly……想到了大佬们还有现在宅在家里的孩子们,也许我也有同样的问题,所以我决定测试一下这些AI到底靠不靠谱。AI批文写哪个好?经过初步筛选,我挑选了几款免费好用的选手参与评测,分别是:网易有道词典AI作文批改、微软爱写作、Grammarly免费版。那么,事不宜迟,让我们直接进入游戏吧。Round1:手写识别,比如中小学英语考试,英语四六级,考研英语,雅思托福,实际考试的时候需要在纸上书写,所以学生在练习的时候往往会选择手写.写了一遍又要打字会有点麻烦。如果我拍张照片,AI可以自己识别我写的东西,会方便很多。有道AI构图矫正和微软爱写作都支持图像识别功能。而Grammarly……由于没有这个功能,这位玩家选择了暂时退出。我尽量用非标准的应试字体抄写了一篇作文来测试两位选手。先来看看有道AI构图矫正的表现:识别的还是比较准确的,有涂改的地方没有出现误识别的情况。需要手动修改的几个地方,基本都是手写的时候字母和字母之间的间距太大,所以识别的时候就变成了两个字。看一下微软小影的结果:由于我没有写标题,小影强行将第一段识别为标题。如果忽略这一点,识别准确率也很高。不过标点符号的识别不如有道AI排文矫正(上图中红色标注)灵敏。还有一个小问题:如果把这两个字写的更开一些,多出来的空格小英就认出来了。如果检查不仔细,会影响下一步评分的准确性。此外,与微软爱写作唯一的网页版相比,手机端有道词典可以直接拍照识别,无需将图片传到电脑上,更加方便。第二轮:纠错能力如果说OCR只是影响用户使用便利性的一个细节,那么AI纠错构图的重点当然是能否准确捕捉到构图中的错误。有道AI作文纠错、微软小影、Grammarly都具有识别文中语法错误并给出修改建议的功能。这一轮,我们用一些单句来测试谁的调试能力更强。例1:姑娘要走的时候,在树上发现了一个老乞丐,怒目而视。有时会有时态错误和拼写错误。有道发现4处错误:具体判断为:①疑似措辞不当,建议将“willleave”改为“left”;②怀疑动词时态错误,建议将“fount”修改为“found”;③疑似误用名词,建议将“begger”改为“beggar”;④疑似介词“at”多余,建议删去。把题丢给微软小影,也发现了这4个错误,给了换词建议。具体判断为:①动词时态错误,将“willleave”改为“left”;②动词用法不正确,将“found”改为“found”;③单词拼写错误,将“begger”改为“beggar”;④多余,删去“at”;⑤建议将“寒”改为“苦”、“硬”、“卑”。最后看Grammarly的判断。免费版的Grammarly指出了一个拼写错误的单词,并建议我升级到付费版。同样,在“Butthisstressdidn'tblockmefromthinkingtoattendthebiggistactivityinourschool”这句话中,有道和小英都指出了三个错误:介词“to”改成了“about”;动词“attend”改为“attending”;“biggist”拼写错误改为“biggest”。免费版Grammarly仍然只指出了“biggist”的拼写错误。看来,就免费版而言经验来说,Grammarly的语法修改比较简单。最后给有道AI作文批改和微软小影加了一道试题。例句2:在一个寒冷的早晨,当我在fiont看一个女孩买面包和牛奶的时候对于我来说。对于AI来说,这句话的识别难点在于同一个物体涉及到多个错误。“fiont”的拼写错误紧随其后,介词“for”用错了。面对这道题,有道成功识别了整个“inthefrontof”,不仅指出了拼写错误,还发现了短语中介词的错误。不过,微软小英的改造方式有些让人看不懂。难道他感觉到了句子中主角的内心戏?本轮比赛结束,让我们做一个简单的总结。同样是免费的,但是免费版的Grammarly和这两款中文世界的播放器相比还是有很大的差距。不过Grammarly有插件版,直接写邮件的时候可以边写边改错。但如果你想借助AI提高英语写作能力,免费版Grammarly可能不是最佳选择。有道AI作文批改和微软小英都比较符合国内的英语学习路径,综合表现还不错。但是,当错误复杂度增加时,有道的表现稍微好一些。第三轮:得分的准确性另一个关键点是得分的准确性。毕竟考试有严格的评分标准。能否按照标准给出准确的分数,对于广大需要参加考试的同学来说,仍然是一个非常重要的参考指标。有道AI作文批改和微软爱作文均支持多学科英语作文批改,覆盖小学、初中、高中、四六级、雅思托福、考研英语。至于Grammarly,作为一个“进口”的应用,不太适合我考国的风格。没有评分功能,无法区分学校阶段和考试类型。不过,使用Grammarly,你还可以针对自己的情况进行一些个性化的设置,包括Audience(听众)、Formality(形式)、Domain(领域)。问题仍然存在,免费版本的选项有限。在网上找了一篇雅思范文,7.5分。人类老师评价这篇作文:词汇丰富,语法点丰富,论证全面。那么AI会如何评估这个作文呢?我们先来看看有道AI作文批改的答卷。有道给这篇作文打了8分,并在词汇、结构、语法和内容方面给它打分。点击查看评论,还可以看到作文的整体评价,一些更进阶词汇的推荐,以及AI阅卷官从词、句、章入手的好词巩固。...词汇更丰富...写作更流畅...词汇扎实。这样的评论与人类教师的判断基本一致。在同一篇文章中,我们来看看微软小影是怎么说的。也给了8分。比较特别的是,小英会统计作文中使用的考纲词汇、逻辑连词和从句的数量。与有道给出的整体评价报告不同,小影给出了四个评价指标:文章结构、句子关系、话题关联度、展开程度。需要注意的是,如果要参考文章内容中相关程度的指标,必须填写文章标题。至于发展程度这个指标,我反复尝试了很多作文,从高考范文到雅思范文,都稳定一星……这一轮比赛结束了,我也会做一个总结。总的来说,有道和小影的评分结果根据不同的考试类型与考试评分标准保持一致,具有参考价值。细节方面,有道会根据字数、词汇使用、句子逻辑和衔接等方面给出综合评价,而微软小影会分点给出建议,主要关注文章的结构和相互之间的关系句子。不过在测试过程中,微软小影出现了一些小bug。比如六级作文满分是15分,但是打分界面的最高分是25分。背后的技术看来,有道词典的批文AI确实有两把刷子。出于技术小编的好奇,特地请教了文章开头给我推荐软件的胖友,想知道这背后到底有什么样的技术。以有道为例,其英语作文批改分为三个核心模块:打分模块+评论模块+纠错模块。评分模块负责提供总分,以及词汇、语法、结构分数,采用传统方法+深度学习的方法。评论模块提供全文评论、词汇推荐、范文推荐。纠错模块提供14类语法错误识别和纠正,包括浅层拼写错误和深层语法错误。其中,拼写纠错采用了基于BERT的NER实体识别技术。语法纠错被定义为一个序列到序列的生成问题。核心基于Transformer架构。核心模型所做的事情实际上类似于翻译:将语法错误的句子翻译成语法正确的句子。此外,在语法纠错中,还使用了迁移学习和对抗学习。利用真实语料和基于真实用户错误分布生成的海量伪语料,不断提升模型能力。以上是网易有道词典的质量评测结果。P是准确率(Precision),R是召回率(Recall),F0.5是P值和R值的调和平均值。值越高,算法的性能越好。可以看出,有道AI构图校正的测试结果达到了行业领先水平。好了,看完这篇试听报告,不知道正在备考英语四级、雅思-托福、考研英语的你,是否愿意pickAI免费批改作文呢?
