智能校对-我国人工智能写作发展面临三大挑战
编辑:pitaya02 日期:2020-09-24
AI已经发展了60多年,它涉及的范围非常广泛,它所具有的复杂性和比一般科技领域更丰富的内涵。这一阶段的人工智能技术研究主要集中在算法、框架软件、芯片等方面。今后十年是人工智能产业发展的重要时期,也是人工智能芯片技术实现突破的关键时期,未来人工智能技术的发展路径将沿着算法和算力两条主线前进,逐步引导人类进入人机协同时代。开发人工智能的最终目标不是取代人的智能,而是与人的智能形成互补,使人从重复性的繁重工作中解脱出来,集中精力推动自己的文明进步。火龙果智能写作
我国人工智能发展面临三大挑战
国内人工智能发展目前面临的挑战主要有三个方面,即 AI算法、 AI框架软件和 AI芯片。
㈠ AI算法
人工神经网络中常用的算法技术有决策树、随机森林、逻辑回归、支持向量机、朴素贝叶斯算法等,国内各大高校对此都进行了深入研究,但在科研成果转化方面却进展缓慢,困难在于如何将算法与实际工程应用相结合,实现技术转化为生产力。现在由华为,阿里,腾讯等公司领导的技术研发团队,将自身的应用和算法技术结合起来,实现从行业领域到算法领域的技术成果转化。火龙果语法检查
由于技术成果转化难,国内仅有一小部分科研队伍,而由于研究领域狭小,基础数学库的研究一直处于冷门行业。在企业界,主要尝试从底层硬件开发的角度,通过优化数学库来实现硬件效率的最优,比如美国 NVIDIA公司开发 cuDNN深度学习库,是专门为 CUDA GPU而优化的,但在大规模机器学习场景中,却缺乏分布式并行的支持。前几年,美国 IBM (PML)和 Intel (DistML)都开发了机器学习/深度学习相关的框架、库和工具集,但都仅限于内部使用,或者开源的简单版本。Databricks公司开发了基于 Spark的支持集群学习相关库。Caffe是基于开放源代码软件扩展 MPI的分布式并行实现。以市场为导向的产品来看,它们仍处于开发阶段,性能和稳定性的提高还有很大的空间。火龙果智能校对
在算法领域的技术突破方面,我国研究机构和企业关注的焦点有所不同。科学研究领域对于现有算法进行了深度优化,以达到更好的处理效果,或者另辟蹊径,将原有算法脱胎换骨。而且企业更多地是根据行业发展的需要,把成熟的算法应用到实际工程项目中,实现人工智能产业化。火龙果智能写作
㈡ AI框架软件
国产 AI框架软件逐渐起步,也开始拥抱开放源码,并在培育自身生态。构架软件是人工智能生态系统的重要组成部分,我国需要推动国产构架软件的开发与推广,摆脱国外构架软件生态标准的限制。国内 AI框架软件需要与国产 AI芯片和硬件相互匹配,并进行性能优化和应用推广,才能形成面向行业应用的软硬件一体化平台,推动这一融合技术在各行业的产业化。火龙果错别字检查
一、 AI框架软件
人工智能框架软件是相关算法,库,工具集。人工智能框架软件的出现降低了使用门槛,开发者无需从复杂的神经网络开始编写代码,就可根据需要,利用现有模型,快速实现应用。该框架软件提供了一系列机器学习、深度学习组件,在这些组件中,一般的 AI算法已经集成实现,如果需要可以根据自己的需求来定义新的算法,那么就调用深度学习框架的函数接口来定制新的算法。由于这些开放源代码框架在全球广泛使用,因特网巨头开始逐步掌控人工智能的应用生态,从而形成一种情况,即几乎所有的 AI芯片、系统、平台都需要与这些主流框架相匹配。与程序化生产不同, AI算法的产生是一个系统工程,需要能够协同优化数据、算法、算力的平台级产品。对计算能力的需求也越来越大,一些专门的计算框架软件和平台应运而生,例如谷歌的 TensorFlow,伯克利的 Caffe, Facebook的 PyTorch (基于 Torch推出),微软的 CNTK,亚马逊的 MXNet,百度的 PaddlePaddle等等。火龙果智能写作
2.国内主要研发机构的 AI框架软件
国产 AI产业也是大面积采用了国外研发的这些框架软件,自研的 AI框架软件相对较少,主要集中在从事 AI算法研究的几家公司内部使用,但随着技术的进步,逐渐开始进入实用环节,并且开放源代码发布。下面就是国内比较著名的几种框架软件。火龙果智能写作
百度 PaddlePaddle:国内开发比较完善的 AI计算框架,是一个集成了深度学习核心框架,基本模型库,端到端开发包,工具组件和服务平台的开放源码深度学习平台。现在百度的30多个主要产品都在使用 PaddlePaddle,从市场接受来看,目前百度的产品还处于起步阶段,使用群体比较少,还需要加大研发的投入和市场培育。火龙果智能写作
旷视 Brain++: Brain++拥有自主研发的深度学习框架, Brain++是一个自主研发的 AI算法平台,作为统一的底层架构,为算法培训和模型改进过程提供重要支持。就算法开发而言,旷视自研开放源代码深度学习框架 MegEngine (Brain++核心组件之一)帮助旷视建立了一个持续自我改进、持续自动化程度更高的算法系列,并且能够根据不同垂直领域的碎片需求,定制丰富而不断增长的算法组合。火龙果智能写作
Financial Parrots: Financial Parrots是一种训练框架,其核心是一个动态编译和调度引擎,它采用动态实时编译技术,所有代码在运行期间都是即时编译的,并被放入计算芯片或引擎中大规模并行执行。通过对传统静态深度网络的扩展和现代动态编程模型的灵活性,实现了这两者的最佳结合。
华为 MindSpore:正式开放计算框架。每个场景都由 MindSpore本地适应,包括端、边缘和云。该系统通过 MindSpore自身的技术创新以及与华为升腾 AI芯片的协同优化,实现了高效率的工作状态,大大提高了计算性能。
㈢ AI芯片
20世纪80年代,学术界提出了一种较为完善的 AI算法模型,但直到最近,该模型的内在价值还没有真正得到实现,主要是由于硬件水平的限制,无法提供支持深度神经网络训练/推理过程所需的计算能力。人工智能芯片的出现极大地提高了数据处理速度,特别是在海量数据处理方面优于传统 CPU。AI芯片通常被定义为“专用于 AI算法进行特殊加速设计的芯片”,根据技术体系结构, AI芯片主要分为 GPU, FPGA, ASIC和类脑芯片四大类。在边缘计算中, AI芯片是提供算力的灵魂和大脑,承担着为各种终端提供强大算力的重任,直到最近, GPU、 FPGA、 ASIC等 AI芯片被应用于相关领域,才得以解决算力不足的问题。
1.以技术结构分类为基础的 AI芯片
(1)GPU
图形处理器(Graphics Processing Unit, Graphics Processing Processing Pro经过几年的生态发展, GPU已与机器学习、深度学习等应用领域很好的兼容,通用性强,支持的精度灵活,性能卓越。GPU所面对的是高度统一、相互独立的大规模数据类型,以及不需要中断的纯计算环境。而 GPU的关键性能是并行计算,主流 GPU在计算能力和存储带宽方面都有很强的优势,无论是性能还是存储带宽都远远超过同代 CPU。中央处理器包括几个专门用于序列串行处理的核,而 GPU则有一个大型的并行计算架构,该架构由数千个更小更高效的核(专门用于同时处理多个任务)组成。在执行外部中断、进程切换等任务时, CPU会占用大量的 CPU时间,而 GPU则需要大量的并行计算时间。火龙果智能写作
(2)FPGA
FPGA (FieldProgramma-ble Gate Array,现场可编程门阵列)是一种包含数字管理模块、内嵌单元、输出单元、输入单元等的半定制电路,针对特定的操作,可通过编程重组电路,直接生成专用电路,用户可通过 FPGA配置文件实现应用场景的高度定制,可同时进行数据并行和任务并行,从而达到高性能,低功耗的目的。由于 FPGA的一次性成本比 ASIC要低得多,在芯片需求尚未成熟,深度学习算法尚不稳定,仍需要不断迭代改进的情况下,利用 FPGA具有可重构性的特点实现 AI芯片是最好的选择之一。FPGA能够实现前端推理场景的灵活设置功能,目前在人工智能推理领域得到了广泛的应用。
(3)ASIC
ASIC (Application Specific Integrated Circuits,专用集成电路)是指根据特定用户的要求和特定电子系统的需要而设计、制造的集成电路。该芯片可针对某些成熟或特殊的深度学习算法,定制电路和特殊的指令集,从而实现能源效率比的优化。目前 ASIC芯片主要应用于人工智能推理领域。利用 FPGA对特定用户场景进行开发,当算法成熟,芯片设计固定,然后以 ASIC的方式进行大规模生产时,对于适用的应用场景, ASIC的性能和能量消耗都要优于目前的芯片,包括 FPGA和 GPU。
TPU (张量处理单元, Tensor Processing Units)是一种定制的 ASIC芯片, TPU单片存储能力比 NVIDIA的K80 GPU高3.5倍,但体积相对较小。GroupTPU已经为谷歌的主要产品提供了计算支持,第一代 TPU只能用来推理,而目前发布的 TPU2.0不仅可以用来推理,还可以用来训练神经网络。火龙果智能写作
(4)类脑片
类脑片(Brain-Inspired Chip)可以模拟人脑对信息的处理方式,它可以以极低的功率消耗对信息进行异步、并行、低速和分布式处理,并具有许多能力,如自主感知、识别和学习,使其在推理、决策、记忆等方面达到类人智能水平。大脑芯片以数字处理器为神经元,以存储器为突触,这与传统的冯诺依曼结构不同,其存储器、 CPU和通信部分是完全集成的。所以信息的处理完全是局部的,并且由于局部处理的数据量不大,传统的计算机内存和 CPU之间的瓶颈已经消失。
借鉴“存储器与计算器相结合”等脑部信息处理的基本规律,类脑智能在硬件实现和软件算法等多个层面对现有计算系统和系统进行了本质上的改造,实现了计算能耗、计算能力和计算效率的大幅度提高。IBM已经开始了颠覆 VonNoyman架构的智能类脑算法和技术的探索,并且已经成功开发了 TrueNorth芯片。
二、 AI芯片的特性对照和国内外主要制造商
各种芯片在通用性、应用兼容性、编程难度、性能、能效比等方面各有优缺点,适合不同的应用场景,如训练、推理等。表1显示了各种 AI芯片的特点和优缺点。
表格1不同类型 AI芯片的特点及优缺点
目前 AI芯片核心技术和市场均为美国厂商所垄断,虽然国内部分厂商也在研发 AI芯片,但无论在技术成熟度还是市场占有率上,与国际巨头的差距依然十分明显。表2显示了国内外主要的 AI芯片研发厂商。火龙果智能写作
表2国内外主要研发厂商 AI芯片
GPU:由于 GPU在当前 AI市场的主导地位, NVIDIA在 AI芯片市场上独占鳌头。在 AMD最新发布的 GPU产品中,它已经实现了对主流 AI框架软件的良好支持,上升势头明显。英特尔也在研发 GPU。就国内而言,目前海光公司正按计划进行类 GPU (DPU)芯片的研发,目前已取得阶段性进展。
FPGA:目前市场份额第二的 AI芯片 FPGA,完全被美国两家公司 Xilinx和 Intel (收购的 Altera)所垄断,全球市场份额达90%。当前从事 FPGA芯片研发的国内厂商有紫光同创(Titan)、复旦微电子等,其 FPGA产品与美国厂商相比落后一代,且产品性能只能达到国外品牌上一代同系列产品中高端水平,尚无竞争力。
ASIC:国内已经开始采用 ASIC芯片体系结构进行创新,与国外 ASIC芯片厂商相比,差距相对较小,尤其在芯片性能和能效比上,而在高性能 GPU和 FPGA领域的研发相对落后。诸如寒武纪等 ASIC芯片已经形成批量生产。但是与国外大公司相比,还有一些先天的差距,比如 Google开发的 TPU,能够与自己研发的 Tensor Flow等主流的深度学习框架进行深度整合和优化,有了软件生态的加持,生存优势就更大了。火龙果智能写作
我国发展人工智能的三点思考
构建我国人工智能软、硬件产业生态
电脑时代的 Wintel系统(微软+ Intel)和移动终端时代的 AAA系统(ARM+ Android),通过建立一个完整的产业生态圈来控制产业,并处于绝对的产业垄断地位。AI产业属于新领域,目前还没有形成绝对主导的技术路径依赖,产业生态也没有形成绝对壁垒,软硬件协同优化已经成为技术提升的主要手段,单纯的数据和算法优化已经无法满足产业发展的需要。
面临发展机遇,我国应该加强人工智能产业发展顶层设计,加强人工智能软硬件协同布局,例如鼓励百度 Paddle Paddle、旷视、 Building Parrots、华为 Mind Spore等软件框架企业与寒武纪(MLU)、华为(升腾)、阿里(含光)、中星微(NPU)、比特大陆(算丰)、地平线、百度(昆仑)、海光(DPU)、紫光同创(Titan)、复旦微电子等 AI芯片企业强强联合,重点布局我国拥有自主知识产权的“框架软件+ AI芯片”的人工智能生态系统,力争五年内在人工智能领域占据主导优势。
第二,采用整体布局,分步突破的芯片开发思路
目前 AI芯片的核心技术和市场都处于被美国厂商垄断的状态,虽然国内也有厂商在研发,但无论在技术成熟度还是市场占有率上,与国际巨头的差距依然十分明显。当前我国的 GPU和 FPGA基本上完全依赖进口。在 GPU方面, NVIDIA占据了全球70%的市场。在 FPGA中,竞争对手是美国的 Xilinx和 Intel,它们垄断了全球90%的市场份额,而 Altera则是被 Xilinx和 Intel垄断了。从整体上看,三种 AI芯片 ASIC国产化程度都比较好。
所以,现阶段根据我国 AI芯片的实际情况,可以采取全面布局,逐步突破的发展道路,近期重点是专用芯片 ASIC,远期重点是通用芯片如 GPU、 FPGA等。随着 ASIC专用化程度的提高,各厂商都会根据具体应用场景的需要有针对性地进行研究开发,而通用芯片如 GPU、 FPGA等,由于目前国外已有较为成熟的标准化产品,国内厂商自主研发或国产化替代的意愿不强。所以,从产业布局上看,政府应该加大力度扶持有条件、有意愿的企业,在 GPU、 FPGA等通用芯片的研发上逐步实现突破。
㈢加强前沿领域如脑芯片的布局
类脑片的研究和开发属于前瞻性的领域,目前企业在这方面的研究和开发不多,因此,应该充分发挥国内高校和科研机构的力量,进行充分的布局。IBM公司开发的 TrueNorth芯片,作为类脑计算领域的一项突破,极大地推动了人工智能的发展,但类脑计算仍有巨大的发展空间。由于存储器、逻辑、传感技术的进步,未来的类脑计算芯片有望实现更低能量消耗、结构更紧凑、速度更快。
由于国内对类脑芯片的研究尚处于理论研究阶段,国际领先企业尚未形成明确的技术和知识产权壁垒,因此,各大科技巨头纷纷积极推进人工智能技术生态的研发布局,全力抢占人工智能产业制高点和话语权。
3.结论
对于人工智能的期望,不仅仅是为了解决狭隘、特定领域中的某一简单而具体的任务,而是希望能够真正地像人类一样,解决不同领域、不同类型的复杂问题,并做出判断和决策。
开发人工智能的最终目标也不是取代人的智能,而是形成与人的智能的优势互补,帮助人类处理许多虽然可以处理但效率不够的工作,使人类从重复性的繁重工作中解脱出来,从而集中精力推动人类自身的文明进步。火龙果智能写作
火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。
火龙果智能写作官网https://www.mypitaya.com
积极拥抱变化,才能更好的应对这个时代