x

免费雅思写作评分软件那么多,究竟真的靠谱吗?

2020-10-12 15:01:02编辑:景景

  免费雅思写作评分软件那么多,究竟真的靠谱吗?我们在备考的过程中会发现有很多写作免费评分工具,可以对我们写好的作文进行初步的更正和批改,然后再给到一个分数。

  很多同学在使用软件的时候发现,明明自我感觉是6分的作文,但是系统竟然给到了8分,所以很多同学就想知道这个评分是否真的靠谱呢?

  本来想给大家的答案是大家可以不要过分依赖这个评分结果,如果想要用这些软件可以着重使用对作文一些语法错误的更正。

  但是又想本着科学求实的态度给大家综合评估这些评分标准是否真正可靠,万一这些评分软件的AI非常给力呢?

  那么在最开始我们先了解语言水平测试领域中的一个基础概念,当然雅思考试也在语言测试水平的范畴中,这个概念就是interrater reliability,也就是评分者的间信度。

  简单来说就是同一篇作文由两位批改考官进行给分,然后再看两位考官给出的分数有无差值?如果两位不同的考官给出的分数比较一致,那么间信度就比较高,反之则是较低。

  但是对于我们平常使用的写作免费评分软件来说,无论使用什么算法,对于我们来说最重要的就是机器给出的分数是否和官方评分一致,所以就需要测试二者的间信度是否足够高?

  本着求实的态度,我们找到了剑桥真题集标有官方评分的考生范文,并且将其输入到目前几家主流免费批改软件或网站中。

  通过输入满分作文,我们发现极少有软件会给作文打出超过8以上的分数,所以我们在统计过程中对考官范文进行了单独的分类。

  同时也说明对于写作高分选手来说,AI批改就不尽如人意,如果写作目标是7分以上的同学,建议选择更有针对性的人工批改

  为了避免不必要的拉踩,我们此处不再公布软件或网站的具体名称。

  大多数评分软件或网站给我们从真题集摘下的作文打的分数以5-7分为主,这看似大概符合多数人的写作水平。

  呢么我们先从最基本的分差来看,小作文和大作文的数据偏差范围都较大。

  也就是说机器评分和真题集中官方给分差值相差3分及以上,这种极端情况普遍出现在目前主流的各种写作评分软件网站中。

  其次我们来看看官方给分以及写作软件或网站给分的间信度,无论是大作文还是小作文连0.20(即slight agreement略微一致)的标准都有点难达到,也就是说评分软件或网站的给分与官方真题集中给到的分数偏差较大。

  通过再次分析大作文,我们发现官方会给出5.5或6.5的分数,但是一般来说多数评分网站只能取整数,并不会给出半分,所以也导致了大作文的给分整体较高。

  所以这也就常常出现明明自我感觉6分,但是评分软件却给了7+分数的原因。

  另外通过我们的大量测试,输入文本的时候如果分段或者标点符号有错误,会较大程度影响给分。

  由于大部分写作评分的算法维度都是围绕拼写或者句法错误展开的,所以如果大家想要对作文进行一个初步的订正和修改,一部分写作评分软件或者网站还是可以做到的。

  虽然软件之间由于算法的差异,会有略微不同,但是这部分还是有一定的参考价值

  那么如果我们按照雅思官方给分标准,从写作评分标准中的这个维度:即写作任务回应情况来说,大部分写作评分系统都是不限定写作题目的算法。

  所以对于图表类小作文的批改来说其实这部分的给分是非常不客观的,而大作文也有同样的问题。

  所以如果想要对自己的写作水平有更精准的把控,写作评分系统的参考价值其实并不大。

  其次第二个维度,连贯和衔接,熟悉评分标准的同学都知道,其中反复强调的一个点就是组织信息和论点的能力

  那么论点也是围绕作文题目及主题展开的,所以这个维度的给分也会不够客观。

  可是我们都知道批改在写作备考中的重要性,想要客观了解自己作文的问题出在哪里?想要更加明了目前自己的写作水平?想要更加具有参考价值的评分

  联系网站客服老师,给出你专业的写作评分及备考建议,还不赶快试试!

  学雅思来环球,专注雅思培训23年,是你学雅思的首选!环球教育提分课程正在火热报名中,欢迎咨询预约试听哦~