智能校对-如何界定人工智能写作是否侵犯知识产权?

编辑:pitaya02        日期:2020-09-11

九月份是个无趣的月份,为什么?由于娱乐界的八卦实在太多了!非抄袭节目,就是艺人的不当行为。事实上,从2017年开始,娱乐圈就没有让吃瓜群众闲着过。身为一名文字工作者,在众多火辣辣的爆料中,我们更关注抄袭,维权这些与知识产权相关的事情。

知识产权侵权的成本在中国是非常低的,而维权的程序是复杂的。许多时候,都是由网友挖掘抄袭,自发寻找证据,然后公诸于众。可原创作者自己出来维权,往往耗费大量精力去搜集证据,三番五次奔波于各种机构,承受着“炒作”、“蹭热”等种种舆论压力。更为严重的是,许多人在不知情的情况下实施了侵权行为,许多人并不知道自己受到了侵权。因此,我们今天讨论的主题是,面对这一局面,人工智能能提供什么帮助呢?

侵犯知识产权举证困难?人工智能也许是解决办法

是啊,而且还会越来越普遍。

第一,人工智能能够解决费时费力收集复制证据的复制证据问题。一开始广告圈就流传着一篇名为“去年使用葛优躺表情包的公众号,今年全部被指控侵权”的文章,文章中写到了很多明星侵犯了品牌方的肖像权而不自知的案例。

许多人都在疑惑,我怎么一用图,就找不到明星律师了?那些律师每天什么也不做,只是盯着别人使用明星的图片看吗?绝对不会,直接爬取各个品牌的数据,利用图片识别比对明星照片,轻而易举地就可以找到使用明星照片的人。若能直接利用深度传感器获得明星更详细的脸部数据,相信任何肖像侵权、仿冒仿冒者都不再会有后顾之忧。而对于葛优的表情包这种一张图片经过简单的加工后多次传播的,想抓包实在是太简单了。

上述只是侵权的第一级,实际上对原创作者伤害最大的,就是那些模棱两可的“再版”式的抄袭。

图为网友制作的调色盘,指出两部小说有相似之处。“换句式”和“换形容词”是文学抄袭的常见形式,而“换句式”往往与抄袭情节有关。读过以后,往往会觉得有什么不对,但又很难指出。与此同时,为这种复制证据的方法十分麻烦,一般的论文查阅式的程序很难检查出来,需要人工进行反复阅读和比对。

在此过程中, NLP的语义理解能力可以起到很大的作用,通过语义理解识别出意义相近的词,再利用 LSTM的记忆特征识别出需要人工识别的句子结构相似的段落。这样,不仅证明的速度会提高,也许还会发现许多人的相似之处,难以挖掘。

比剽窃更可怕的是我不是针对谁…

另外,人工智能和新技术可以帮助原创作者在许多细节方面保持实力。例如简化知识产权申请程序,保护区块链记录信息免遭抄袭修改等。但是,从另一个方面来说,人工智能很可能使侵权行为更容易,或使侵权者更容易钻空子。

例如关于字体侵权问题,就存在着不少的问题。许多广告公司将被告非法销售的某某字体进行商业宣传,最终支付大量费用。但学界和实务界对于字库大致达成共识,具有独创性的字体构成了美术作品,可以进行维权。

可能对于独创性的标准还比较模糊,如果某个字库的字体全部加了一些小的改动,能否称它为自己的独创性呢?当读者回忆起我们在讨论神经风格转移技术时,他们会发现,使用算法来改变字体,可能比我们想象的要简单得多。即使我们可以用一些人眼难以察觉的字体,只有机器才能辨别的变化,到时候侵权的界限又该如何界定呢?

上面这幅图,是一位被爆出抄袭的插画师的作品,她抄袭的主要方式是将真人照片通过底片叠加等方式处理,再加上少量的手绘内容,就成了一幅有价值的插画。

即便是看过这两幅图的人,也很难清楚地感受到它们之间的相似之处,而当两幅图重合时,就会发现明显的相似之处。复制信息被曝光的年代,作者仍然仅仅使用 PS+绘板进行操作。而如今,神经迁移算法也得到了同样的应用,这种“再创造”已经可以成批生产,而且可以制成多种风格。

并且这种抄袭方式被发现的几率非常低,即使使用了图像识别技术,也没有人会对每一件作品进行全网比对。更为恐怖的是,我国知识产权保护的理念是“只保护表达,不保护思想”,也就是说,如果你的作品与某一原创者的风格完全相同,那么你的作品就不会构成侵权。假如你还记得 prisma这个图像处理软件,你就会知道,用机器学习来模仿某种画风的成本是非常低的,而且可以进行批量处理。

将来,当我们挖掘出一位新艺术家的作品时,很可能下一秒就会有大公司使用神经网络 copy他的风格,制造商品开始销售。对原创作者而言,人工智能复制所造成的伤害,往往比人工复制更大。

人工智能能帮助标准化原始权益范围吗?

那么,说人工智能最终对我们的知识产权保护没有任何帮助,甚至是有害的?但是我们认为,人工智能最大限度的保护知识产权,也许是规范了权益范围。

正如字面上的案例,知识产权的保护范围往往是“独创性”这样一个模糊的概念,难以量化,也导致侵权案件的最终判决往往难以服众。对音乐作品的知识产品保护,可以通过音节相似量的大小来判断,而对于绘画、文字作品,侵权行为往往无法量化。如果有人工智能的话,我们也许可以反向计算出两部作品之间的相似之处,并用数据加以呈现。

也许将来,我们需要一个知识产权保护平台,在发布作品前,要对平台中的作品进行比对,比对通过后才能通过“原创认证”。也有可能保护原创作品,例如其他人不能使用原创作品作为算法模型的培训数据,除非支付给原创人一定的红利等。总而言之,科技进步总是走在法规的前面,但是用科技来推动法规的建设,或许可以让科技发挥更大的价值。


火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代


错别字-错别字的危害