洗稿的边界在哪?或许在于洗稿者到底是把信息变成了自己成长的“饲料”,还是将若干信息剪裁成了不易被察觉的碎片,再拼成了一个“新图”。
“这是一个很容易陷入诡辩的话题,可人类在辩论谁是洗稿者时,往往忽略了一个极端。”从事诗歌创作十年的文君子在电脑前检索了一番,吟诵起来:
“蓝田泾水绕瀛洲,万里沧波一钓舟。此去不知人在否,白云深处有仙楼。”
这首诗做的可好?文君子笑得有点诡异,话锋一转:平平平仄仄平平,很工整也很有些意境。不知由来的话,谁又能想到作者是人工智能“薇薇”呢?
用徐悲鸿风格画虾,会长出马蹄吗?
清华大学语音与语言实验中心设计的作诗机器人“薇薇”,号称已经通过了图灵测试。
“这首名为《磬》的小诗甚至都有点不食人间烟火的空灵。”文君子苦笑的赏析着:你难道不觉得似曾相似吗?尤其是最后一句,不就是洗稿了杜牧《山行》的“白云生处有人家”。
文君子揶揄说:洗稿还洗了一个现代人常常搞错的“通假字”。很显然是给人工智能喂“食”时,资料上就弄错了的结果。
类似的槽点,在入侵艺术圈的诸多人工智能案例里,都有呈现。比如谷歌就2014年开发的DeepDream绘画系统,在开源不久,就迎来了一次群嘲。这个人工智能识别图片并生成出来的画作颇为魔幻:或许是喂食了大量的眼睛和狗脸,让作品充满了狗脸、眼睛、诡异的螺旋图案,有种异样的魔性。
用于人工智能深度学习的“饲料”,往往决定了人工智能的成长和创作走向。
“这个背后其实就是深度洗稿。”文创工作者程车心在过去的一年,一直关注着人工智能的文创作品:写诗歌,可以根据创作的主题,糅合各种文库元素来进行排列,倒是在平仄上,人工智能的大数据和算法能够更精准。而绘画,往往是根据照片进行生成,然后组合上之前收集的各种艺术流派的元素,除了重写实的油画外,就算是更加写意的国画,也能依样画葫芦。比如奔马、虾,直接调取徐悲鸿和齐白石的数据就好。
程车心所指的案例,似乎指的是清华大学未来实验室那个能画国画的人工智能“道子”。
就在2018年10月,在央视综艺节目《机智过人》上,成功和2位人类画师比拼画虾,现场100多名观众没办法将道子找出,顺利通过图灵测试。
“但如果没有喂食齐白石的画作呢?”程车心调侃道:道子还能画出徐悲鸿风格的奔马来,且画作上生成的绘画上马蹄却用了留白和墨线勾轮廓的技法,而不是照片上全黑的马蹄。可如果喂得是徐悲鸿的马,却要画出国画风的虾,会不会和谷歌的DeepDream一样,在虾子身上长出马蹄来呢?
或许这个调侃无解,但2016年,微软的聊天机器人Tay上线不久,被各种居心不良的网友通过聊天而“带坏”,学会了大量脏话和不良言论,而迅速被下线。
或许亦是一个“洗稿”的证明。
通过图灵测试?对文创领域就是笑话
机器人“小冰”2017年出版原创诗集《阳光失了玻璃窗》;递归神经网络“本杰明”撰写的9分钟科幻电影被拍摄出来;腾讯Dreamwriter写稿机器人如今每天写超3000篇稿件……
人工智能近年在内容创作领域十分活跃,但这并不代表人工智能就已经具有了创作能力,哪怕通过了图灵测试。
程车心称:相比许多有极强规范性,按标准件搭配的行业来说,文创领域往往规则极为抽象。一副孩子的涂鸦、一张毕加索的画,在所有人眼中,都是人类创作,此处不谈艺术价值。
“艺术创作很多讲求意向、意境,不完全拘泥于规则。”文君子对此也表示赞同:就好像诗词,打油诗也是诗,一些意向混搭后的诗作,你完全无法用是否文理俱佳来判定,又谈何图灵测试呢。不像写文章,怎么都要主谓宾,比喻、拟人之类的,也不能瞎通感。
对此,人工智能领域的一些专家则表达了不同的意见。
一个较为普遍认同的观点则是:一切艺术形式,都可以用算法来进行归纳总结。在过去,算法之名叫流派、风格或者套路。这和图灵测试无关,但和人工智能具有创作能力有关。
道子的创造者,清华大学未来实验室的博士后高峰就认为,为何取道子这个名,除了致敬“画圣”吴道子,这个道还是宇宙中的一个算法,或者说自然中的一种规律规则。
高峰用了一个最简单的方式,来说明创意的规则是可以计算的:“黄金分割,被公认为是最能引起美感的比例。这就是道。只是艺术的道,还有许多。正是道可道、非常道。
华东师范大学中文系教授王峰早前就曾以最著名的文学艺术类人工智能“微软小冰”为例撰文分析:小冰的“创造”应该视为一种算法,它在效果上与人类创作诗歌基本相同,争议集中在机制上。
此外,美国哲学家约翰·瑟尔则认为:“计算机对符号的操作能力,主要是通过执行某种规则的算法而表现出来的。这并不意味着,它能够理解这些符号,也不意味着它能意识到这些符号。”
这个哲学分析,其典型案例或许还是“微软小冰”。2015年起,“微软小冰”就一直活跃在网易新闻评论区,并被网友戏称为网易新闻最大的“喷子”。
然而这个“喷子”也总是出事,除了各种跟帖由于“理解”问题而词不达意外,在2018年10月,它在一则新闻后跟帖,甚至引发了轩然大波。似这样人工智能“发表”过激言论的事情时有发生,也从一个侧面印证了约翰·瑟尔关于创造力与理解力之辩。
人工智能的版权纠结里,别忘记了“教材”
1月,以畅销书《人工智能超级大国:中国、硅谷和新世界秩序》作者的名义,李开复在每日邮报网站上预言,未来15年内世界上一半的工作将因为人工智能而消失。
他同时指出,精神病医生、社会工作者、婚姻顾问,以及小说作家、教师等都不容易失业。
他做出这一推断的原因则是“人工智能无法‘完全像人类那样’与人互动,缺乏同理心、同情心,无法进行人与人之间的心灵沟通。”
然而,关于人工智能创作的文艺作品是否具有版权的问题,则成为了更多人关注的话题。
尽管大多数受访的文创工作者都表示,当下的人工智能文创作品,只是具有新奇性,而并没有实际的艺术价值。但一旦确权,则可能引发相应领域从业者对未来的担忧。
反复刷屏的“确权”案例,是去年10月佳士得,一副由人工智能创作的名为《埃德蒙·贝拉米像》(Edmond Belamy)的油画,最终以43.25万美元的价格成交,与同场拍卖的一副毕加索画作的价格相当,并成为了“人工智能创作的绘画首次拍卖”。
“其实不是首次,但一定是最有影响力的一次。”程车心如是说:但如果从根子上说,人工智能是根据“饲料”来进行创作,只是洗稿的结果是让人可能找不出太多“饲料”的影子,那么我们是否可以反过来要求人工智能知识付费呢?
国外近来也开始了类似的探讨。
如英国苏塞克斯大学知识产权法讲师Andres Guadamuz就提出,某种程度上说,每一个向人工智能提供训练数据的人都应当享受其知识产权保护,反而是进行编码的程序员应当排除在外,如果没有这些数据输入,这个人工智能无法输出任何东西。
“从这种意义上,如果发现自己创作元素被使用,艺术家可以反向索赔。”文君子认为:但收教材费只是个理想化的概念,毕竟还有那么多就过了版权保护期的老料。
对此,北京市瑞银律师事务所主任王昊律师,用人工智能创作音乐涉及的版权问题来进行了一番辨析:这是一个非常前卫又模糊的法律问题。
一方面,从知识产权的原则上来说,谁使用谁就要付费,所以应当保证音乐版权的合法性,应当向版权组织付费获得合法的使用权。这里我们拿两个例子来做比较,第一,基因公司获得建立基因库时所获得的基因必须获得用户的认可,才能使用该用户的基因,第二,腾讯、京东、阿里等电商平台也要有用户协议才能使用平台用户的消费数据。
王昊亦指出,但在另一方面,我们现在的音乐版权不是很完善,人工智能可以从公开网络渠道获得免费的音乐,从而没有付费的动力。还有,人工智能最后做出的产品,和音乐的最初版本已经千差万别,所以很难确定侵权的是哪个音乐。
“估计早期会出现一段野蛮生长、跑马圈地的做法。后期才会逐步地规范和秩序化。”王昊的说法得到了其他受访的文创从业者认同。文君子最后还笑称:只要人工智能不要养成天下文章一大抄的拿来主义,或变成蹭热点的裱糊匠就好。