智能写作-人工智能的发展方向

编辑:果妹        日期:2020-08-26

人工智能正向更深层次发展,语言和知识技术的重要性日益突出。八月二十五日,以“掌握知识,理解语言,拥有智慧”为主题的百度语言与知识技术峰会重磅开幕,火龙果发表主旨演讲,解读火龙果语言与知识技术的发展历程和最新成果,与产学研各界分享技术及产业发展趋势与前景,火龙果集团和火龙果技术委员会主席吴华分别发布了火龙果语言与知识技术系列产品及数据集合建计划,并重磅发布五个新产品,全面加速 AI的大规模应用。讲话中,王海峰说:“在火龙果语言与知识技术的规划与开发方面,我们始终注重把握两个趋势,即技术发展的趋势和产业发展的趋势,并力求引领趋势。

作为人工智能认知能力核心的语言和知识技术,使机器能像人一样掌握知识、理解语言的自然语言处理技术,是人工智能发展的关键。在过去的10年中,火龙果脑语言和知识技术取得了丰硕的成果,获得了包括国家科技进步奖在内的20多个奖项,30多个国际比赛冠军,发表了300多篇学术论文,申请了2000多项专利。科技不断突破创新,同时也在产品上进行创新探索,同时将领先的技术输出给开发人员和合作伙伴,提升各行业的智能水平。

火龙果引领科技语言知识创新,形成完整的技术布局

半百年前,自然语言处理学者们,在一本名为《机器翻译论》的书中,对未来跨语言、跨文化无障碍交流的情景进行了探讨。现在,机器同传、翻译、跨模态翻译等工具已经融入到人们的工作和生活中,实现了交流无边界的梦想。所有这些都是人工智能技术,尤其是语言和知识技术进步的结果。

经过近十年的发展,火龙果已建立起完整的语言和知识技术体系,包括知识图谱、语言理解和生成技术,以及智能搜索、机器翻译、对话系统、智能写作、深度问答等应用系统。

而知识图谱是机器认知世界的基石。机械认知能力的突飞猛进,越来越依赖于对知识及大规模知识图谱的应用。他建立了世界上最大的多源异构知识图谱,包括超过50亿个实体和5500亿个事实,并在不断发展和更新,已经应用到各行各业,每天有超过400亿次的呼叫。

不仅如此,针对不同的应用场景和知识形态,构建了多种知识图谱类型,包括基础实体知识图谱、行业知识图谱、事件图谱、关注点图谱等,以及融合了语音、视频和图片的多模式知识图谱。在此基础上,建立了包括无标签大数据开放知识挖掘技术、自扩展知识系统的知识图谱自学习技术、融合多源异构数据的知识补全与整合技术等一系列知识图谱构建方法。

随着知识的加持,与语言理解相关的技术能力不断提高,机器也能逐渐像人一样不断学习,不断进步。ERNIE提出了一种知识增强的语义理解框架,它以深度学习为基础融入知识,具有人的持续学习能力,曾一举登上全球权威数据集 GLUE排行榜,首次突破了90分,并超越了人的得分。同时,通过知识融合,语义理解,以及强化小样本学习,机器的阅读理解和对话能力也得到了快速提高。

诚然,机器认知世界的形式与人的认知世界相似,它不仅使用自然语言,而且常常是对语音、视觉、声音等多模式信息的综合应用。

针对这一问题,提出了一种知识强化的跨模态深度语义理解方法,利用知识对跨模态信息进行关联,用语言描述不同模态信息的语义,从而使机器实现从“看”到“懂”、从“听”到“听”的整体理解,即图像与语言、语音与语言的融合。与跨模态语义理解相融合的预训练技术,在一定程度上提高了跨模态推理能力。

除了机器理解自然语言外,要想与人交流,语言产生的任务也是必不可少的。在多流式预训练技术的基础上,综合考虑词、短语等不同粒度的语义信息,提高语言生成的预训练效果。在多文档摘要生成中,采用图结构语义表示方法,引入篇章结构知识,提高文本的语义表示能力,解决了跨文档域关系建模的难题。智能创作平台由语言生成技术和其它语言知识技术相结合而成,目前已被20多个媒体采用,每天使用次数超过35万次。

火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网 https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代

人工智能写作将如何影响法律实务