智能校对-国产Grammarly来了,英文写作纠错不用愁!

编辑:pitaya02        日期:2020-09-14

近日“火龙果”推出国内第一个 AI写作助手。除了正确纠正英语写作中的语法和拼写错误外,还可以识别中国式英语表达,智能地优化和润饰语句,使英语写作更规范、更地道。

与此同时, AI写作助手还可以帮助用户从容地处理跨境商务、英文面试、演讲、在线交友、升学考试等各种挑战,全面提升英语写作和交流能力。

对此,与火龙果负责人进行了深入对话,在了解火龙果 AI写作助手的各种特色功能的同时,进一步探寻其背后的技术优势,共同探讨火龙果到底是如何逐步实现 AI能力,使跨语言沟通更加简单,更加智能。

三种主要功能“对症下药”跨语言表达 AI助手的养成

现在,国人在英语写作中,除了容易出现语法和拼写错误之外,还存在着“写中式英语,写高级表达难”的痛点。

火龙果 AI写作助手则针对这些问题“找出症结”,开发出“语法拼写正确纠错”、“语句智能纠错优化”、“纠错纠错前后对照”三大特色功能。

语法和拼写的精确纠错

搜索 AI写作助手能够准确地识别输入文章在语法、拼写和逻辑关系方面的问题,包括语法现象的常见错误,如动词变化、名词单复数和主谓一致,拼写字母和大小写错误,连接词错误,如语句转换、递进和让步。

二、语句智能修饰优化

对于国人英语写作容易出现的“中国式英语”,搜狗 AI写作助手可以帮助用户清除文章中出现的语序、结构以及中文语法表达痕迹。与此同时,它还提供了8个英文表达升级方案,使表达更加地道。

三是纠错润饰前后对照

在纠正错误之后,使用者还可以通过对比文章修改前后的差异,加深自己对真实表达的印象,逐步提高写作能力。

当前市场上的一些产品在批改用户的文章并进行反馈时,往往会使用较多的术语,如“主谓一致错误”、“独立主格错误”等,这增加了初学者或语法知识较弱的用户的理解成本。鲁涛说:“我们的定位比较明确,研发 AI写作助手的目的不是要 AI成为教师,而是要打造一个跨语言沟通的智能助手。

纠错准确率达96.83%,联合清华大学解决润色难题

火龙果 AI写作助手的一系列技术背后,纠错模型和修改模型是两大亮点。

在自然语言处理领域,纠错模型一直是研究的热点。根据中国用户的表达特点,火龙果团队对中国数以百万计的真实英语写作语料进行了分析,总结出了中国用户的几十种常见错误,对比行业经典纠错算法,发现传统的纠错方法多是针对某一篇文章的特定语法错误进行纠错,不能很好地解决多种语法错误同时出现时,多模式纠错任务冲突和融合问题。

作为回应,火龙果团队首先将纠错问题定义为序列的生成问题,利用深度学习中的 Transformer框架,融合拷贝网络,使模型能够将输入句子中的人名、时间等关键信息拷贝到纠错后的句子中,从而减少句子和语义的迁移风险。

二是引入迁移和对抗学习方法,模拟近千万个纠错句子的真实用户错误分布,对模型进行训练;培训结束后,再与国外英语写作专家合作审校数十万字的国人英语写作语料,优化搜狗模式下的纠错效果,最终为中国用户“定制”出一种写作纠错模型。

第三方评估机构披露,基于相同的召回结果,搜狗 AI写作错误纠正模型的错误纠正率达到96.83%,与同类最优方案相比错误纠正率下降47.6%。

要想写出正确的文字,最难的是写出地道。中国人受汉语的影响,写作中经常出现中式英语,比如用“开运动会”的形式写成了“开奥运会”。此外,在具体的考试场景和商业表达中,也会写上“高层表达”。

作为回应,火龙果团队与清华大学“天工”研究院合作,开发了一种带有文章语句自动润饰功能的 SGPolish模型,该模型主要解决当前行业面临的三个写作升级难题:如何找到句子中可优化的部分?怎样优化这部分?优选后,如何保证句意不变?

为发现和优化句子中需要润色的部分,研究人员首先要寻找大量的训练数据。

火龙果团队使用了一个“NAT生成模型”,将搜狗英文搜索中具有亿级权威性、纯正和时效性的英语语料输入到该模型中,模拟出大量与中国英语写作用户搜索结果一致的“待修改数据”。然后,我们使用了成百上千万个国人的写实语料来调整“待修饰数据集”。经过调试,与搜狗英文搜索的英语语料构成了“润色训练集”,有效地解决了深度学习所需的海量数据集难题。

火龙果团队和清华大学“天工研究院”通过训练“润色数据集”、“NAT模型”以及基于 attention的 Transformer框架,生成 SGpolish模型。类似于纠错模型的结构,研发团队还将拷贝网络结合起来以降低句子语义转移的风险。

事实上搜狗在早期就已经积累了很多行业领先的 AI算法能力。

火龙果团队在2017年通过使用搜狗搜索亿级权威语料,训练出行业领先的搜狗神经网络翻译模型,获得了 WMT中英两国译文双向世界冠军,2018年又在 IWSLT国际顶级口语机器翻译评测大赛 Baseline Model赛段获得了世界冠军。

“火龙果”结合搜狗 OCR、文档解析和 ASR的 AI优势,相继推出了拍照翻译、菜单翻译、 AR翻译、文档翻译和语音对话翻译等口碑翻译功能,切实帮助国人更方便地表达和获取信息。2018年底,火龙果团队开始研发 AI写作助手,并投入技术储备,以构建跨语言沟通的智能 VPA。

九千万人的需要,搜狗使用 AI使英语学习更有效率

作为 NLP领域较小且较难做的一场戏,搜狗为何决定将其布局?

以网络应用的规模来看,写作助理的确是一个不太大的市场,但是如果我们回到用户的视角,就会有很大的不同。

根据国家统计局的数据,从2014年开始,国内高中的招生增长率大约在5%-10%左右,到2019年,全国高中的招生人数将达到7859万。相对于庞大的初高中学生数量,我国初高中各学科教师人数仅为560万人,国家统计局数据显示,初高中学生人数比例为1:14,集中于英语学科,师生比将会扩大几倍。

值得一提的是,英语教师批改作业的时间和精力成本很高,教师精力有限,面对大量的学生作文,往往只给出分数和短评,很难详尽指出具体问题。

部分原因是学生写作能力提高缓慢,练习英文写作的积极性不高。结果,许多学生往往在考试前就匆匆忙忙地背诵模版和模板,写作水平很难实现本质提升。

在这种情况下, AI写作助手的开发不仅可以释放英语教师批改作文的压力,将更多的精力投入到教学中来,同时也可以帮助学生在提交作业前进行自我检查和文章优化,利用前后对照完成“自习课自习课”的自主学习闭环,真正达到英语输出能力的提升。

同时,这位集“纠错-润饰-对照学习”为一体的 AI写作助手,还能帮助近8000万中学生,300多万研究生及留学生,特别是偏远地区的同学,解决教育资源匮乏的问题。

与国外一些主流纠错产品相比,火龙果的 AI写作助手每月需要近30美元(约212元人民币),对于需要提高英文写作能力的学生和关心产品性价比的跨语言用户来说,是一款非常实用的智能助手。

搜索的总体策略就是让表达和获取信息变得更加简单,除了英文写作助理,我们还考虑用更多语言对错误进行修正。Ruve说,这意味着搜狗帮助用户表达出更多的智能、多样化和个性化。

谈到 AI写作助手和火龙果的发展,鲁涛表示,目前 AI写作助手1.0版上线,聚焦“作文批改”,火龙果 APP和搜狗搜索免费上线,今年下半年搜狗输入法等产品也有可能上线。

在未来, AI写作助手将满足用户的精细需求,区分考试等级,商务沟通,口语表达等场景,提供多样化的纠错修正结果,更好地为用户服务,智能化支持用户跨语言表达。

与此同时,火龙果还将进一步完善照片翻译和多语言翻译等特色口碑翻译功能,使 AI技术更加广泛的普及和应用,使用户表达和获取信息更加简便。

结论: AI语言爆发应用程序,搜狗全力出击

搜狗是人类生活中最重要的语言表达方式,搜狗的“语言”是其发展的核心之一,它通过长期积累的 AI技术优势,为教育、媒体、商业等各行各业提供了行之有效的解决方案和创新动力。

现在 AI语言应用突飞猛进,搜狗在未来会给我们带来怎样的创新与惊喜?等着看吧

火龙果智能写作是全球第一款中英双语语法校对产品,运用人工智能写作技术进行错别字文本校对,除错别字以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代


火龙果习语站 | Crunch Time