智能写作-智能写作前沿技术与应用

编辑:pitaya02        日期:2020-09-14

为何要进行智能写作?首先,我们来看看每个人每天花多少时间写作。比如说,写一篇文章, Email。有人开玩笑说,一个博士、研究生回他老板的 eMail,平均每封信要花一天半的时间,构思要花很长时间,所以写作很重要。文章中的核心算法问题又是什么?即通过算法生成文本,使这些文本类似于人类书写的文本,并成为自然文本。还有,它需要满足一定的条件,比如要表达一定的意思,或者某些关键字必须出现在里面,或者某些知识点必须出现在里面,后面我将介绍如何用技术来实现这两点。

为什么写作技巧如此重要?主要有以下应用:一是内容的创作,如自动撰写新闻,自动编辑文档,生成故事,小说,对话等;其次是智能辅助写作助手,它能帮助人们写作,你写前两个字,就会把后面的一个句子补上。此外,还有机器翻译,因为它们使用与写作技术相同的技术。在跨语言文化交流中,机器翻译是一项很重要的技术。

对于研究人员来说,这是我们非常想要实现的,将来有一天,研究人员、学生,只要跑一个实验,这个实验报告或论文可以让算法自动产生,当然现在还没有实现。但现在又有什么进展呢?其中,香侬科技的火龙果智能写作,腾讯的 Dreamwriter、新华社的“快笔小新”、字节跳动设计的“小明”机器人等多款写稿机器人均已上市,它们都有相应主题的写稿机器人。

本文由火龙果智能写作写稿机器人写成,足球赛写于去年世界杯期间,当然它不仅能写中文,还能支持6种语言,支持17种比赛。这不只是一场体育比赛,它还可以写其他题材的文章,比如金融类的,还有其他的稿件。本文以 demo为例,介绍了如何利用可视化信息,多模态信息,利用数据自动撰写赛事报道,该算法将得到赛事数据、运动员信息、布阵信息、关键点,如红黄牌等,并基于这些重要信息生成稿件。

在写这篇比赛报道的同时,对它进行解说,这是一项非常困难的工作,我们在这里做的是斯诺克的解说,也就是利用计算机视觉技术来识别球台、球形以及球的移动位置。不只是解说,还包括预测,告诉观众该球员下一杆会击球哪一个球,利用大数据和机器学习技术,预测球员下一杆击球的策略,并基于此生成相应的解说。

当然,我们也可以将这一技术应用于更有商业价值的文字生成,如算法生成广告文案,通过文字了解具体销售的商品、其特征,并据此生成广告文案帮助中小企业设计更好的广告。文字智能生成的技术,同样可以改善搜索体验,在搜索框中,用户还没有进行搜索时,就可以猜出它会搜索什么类型的 query (查询),将这些 query自动生成。自然,我们的生成技术不仅能用于产生商业化的产品,而且也能产生社会公益方面的产品。例如头条有一个公益项目叫“头条寻人”,寻找丢失的用户,在丢失的用户附近向所有头条用户发送一条推送消息,该消息是通过算法自动生成的,用这种方法可以快速找到丢失的用户。利用这一算法,在过去的三年中,有10000多人丢失了数据。当然,也可以通过写作技术来帮助欠发达地区的经济摆脱贫困,帮助他们通过头条新闻和抖音平台销售农产品。农产品的描述必须要有文字描述,文字描述可以通过生成算法自动生成。

但是,背后存在着许多技术上的挑战,这几年来,学术界也做了大量的工作。包含类似贝叶斯的方法,如何制作文本。语篇表示的方法,如何将语义学与文法分开,更好的进行语篇表示,最终形成语篇。怎样用对抗的方法做文本生成,以及如何更好地预训练做文本生成。

在高维空间中,我们当然有许多技术上的挑战,例如如何更好地生成。由于文字不同于图像,图像是连续的,文字是离散的,并且是较长的离散空间,因此在这里面直接搜索很困难。怎样实现可控制的文本生成,这种可控制性很重要,我希望这一点完全符合要求,如何跨模态生成,有图片、语音,如何生成文本,以及在长文本的创建中,如何生成比较一致的文本。最终我认为最难的是创造,原来没有创造的东西,比如诗、小说,要想创造出来,那就很难了。

火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代

火龙果写作成语站 | “蓬荜生辉”