写在前面的话
如果在留学的过程中,各位同学能有机会在维多利亚与艾伯特博物馆V&A博物馆举办一次展览,想必这样的经历写在履历之中,无论对今后深造还是未来求职,都有极大的助益。
2020年2月28日,伦敦传媒大学(LCC)便为每一名交互设计的在读研究生提供了此番千载难逢的机会。而在本次康石石周三的“艺术留学知识共享”栏目中,即将与大家分享的Wei Zhang(张威)同学,便是他们创作小组的主负责人,分享了本次参展作品的全部创作环节。(PS:这是参加张威同学参加的第一次展览...)
回顾这段难得的V&A参展经历,张同学没有谈及太多兴奋的个人主观感受,而是对康石石说:您一定要把我下面的话写到今天的文章当中
我最想感谢我在北服上学时候的郭老师,因为我是学视觉传达的,没有您的鼓励和支持,我不可能迈出这么大的一步,跨专业出国学习交互设计。您告诉我:要一直关注人机交互,人工智能,这是未来。是的,5年前您对我说的这番话,我一直记到现在。
还有北服的李老师,谢谢您当时给我的鼓励,即便我现在学习的是交互设计,在我的作品中依然有视觉传达的影子,两位老师对我指导,我都牢记在心。
再有就是汉艺的Falin付老师啦,哈哈,我觉得咱俩中间有一片合理而又自由的空间吧,我能发挥我的个性,也不必担心飞的太远,跳出作品集的框架拿不着offer,哈哈。
下面我们言归正传,与以往不同康石石今天要跟大家分享的内容不是张同学的留学经历与感受,而是几乎完整转载(有极小部分删减)张同学对于自己V&A参展作品的创作全解。康石石与大家如此分享的目的有三:
1. 带同学们看一看LCC作为英国交互设计最强的院校之一,其交互设计专业究竟在学习什么内容,研究哪些方向。
2. 带大家充分了解世界顶尖名校的教育水平与教学高度,从侧面了解世界名校能够为各位同学带来怎样的留学价值。
3.通过张同学自己梳理总结的创作全过程,带同学们了解一个优秀的作品,需要达到怎样的体量,需要思考多少问题,如何一步一步进行思考与创作。
对了,张威,康石石在结尾为你准备了一个彩蛋,记得翻阅到最后浏览查收啊。
本文分享者:
张威
汉艺国际教育 18届学员
本科 北京服装学院 视觉传达设计
伦敦艺术大学 交互设计硕士在读
根据(Paglen, 2016)提到的,在过去十年左右的时间里,人类视觉文化已经逐渐成为一个特殊的存在形式,并且已经脱离了人类的视线中。绝大多数的图像是由机器为其他机器所服务的, 这其中很少具有人类参与。通过训练数以万亿计的图像将作为人类视觉文化的机器学习基础,几乎没有人注意到机器之间视觉对峙的出现,而对于那些已经开始注意到在我们眼前看不见的构造转变的人们,在应用前时会产生极大的误导。图像已经介入人们的日常生活,其功能从表现和中介变为激活操作和执行,这些看不见的图像正在注视着我们。社交媒体上图像的激增及其对文化主导性的影响已经成为文化理论家和批评家们广泛讨论的话题。
我的作品Observation是一视觉感官互动装置,探索作为理解机器视觉和人类视觉的区别方式。
观察:人与机器之间的视觉对话 Observation: A Visual Conversation betweenHuman and Machine
1.Observation装置分为三个组成部分:
第一部分(上图右侧装置):探索了机器是如何看待事物的以及机器与人类感官的区别,并将机器视觉在人们眼前模拟展现出来。
第二部分(上图中间装置)是人类如何借助机器的帮助去进行探索以人类视角所看不见的机器制造事物;
第三部分(上图左侧装置)是借助图片数据库,创造两个不同的记忆数据库,并且根据装置的外观作为条件输出完全不同的结果。
三个部分的体验过程共同揭示了机器视觉以及机器学习的偏差,考虑到此项技术的两面性,受益于人类的生产活动而不是取代人类的自我感知。
2.我创作的灵感来源:
我的灵感来自 Promobot(2019) 提供的—个记录在案的事故案例,如上图所示。发生在1月7日于拉斯维加斯开幕的 2019 Consumer Electronics Show 上,特斯拉Model S配备了“自动驾驶”功能,该模式以协助驾驶员进行高速驾驶,但在视频中,特斯拉汽车却撞倒了机器人Promobot。虽然这段视频仍有争议,但我们能够从中获得反思与猜想,两个机器相信了彼此,互相认为对方会避开,或者伴随着这种猜想,它们进行了某种对话。
而在另外一份由Shepardson(2018) 撰写提到的 NTSB 初步报告之中,—辆2017款沃尔沃XC90的优步技术公司 (UberTechnologies, Inc.) 测试车在行驶过程中撞上了—名行人。这辆车采用了计算机控制模式的自动驾驶系统。报告中写道,汽车在撞车前6秒钟就意识到道路上有障碍物,但紧急制动功能已被禁用。
在我接下来的进一步调查中 ,探索事故的来源成为首要任务,捕捉使用到的视觉部分和摄像头或其他工具确切的说是—个数据库,这是接近更多的机器和人类感知能力,机器人看到的是什么以及和人类视觉的区别,机器如何建议并影响人们的抉择的。
然而,在许多领域,特别是在繁杂的事件处理方面,很多争论都集中在用机器代替人工管理上。根据 Grgic-Hlaca, Nina and Gummadi, 2019) 提供的司法示例,法官可以使用该机器预测功能,预测被告再次犯罪的概率。最终的选择和责任仍由人类决策者来决定似乎可以减少,但最好由机器来提供建议根据数据分析。
(Brabandere, Neven, Gool, 2017) 对语义实例分割的研究,网络将每个像素映射到特征空间。综上所述,属于相似清况的区域将会相互靠近,使得机器可以立即聚集一群人,便于快速识别个体和数量。因此,借助于语义实例分割可以获得基本的机器视觉原理。
a.装置作品第一部分(下图右间位置)
如何依靠交互手段让观众理解机器视觉文化 ,我们需要学习如何像机器—样看待事物 。根据机器视觉研究的结果,如何看到激活点/习惯关键点特征面转换、分类器训练集声音和对立面机器,成为了这个角度的主要目的。
(Brabandere, Neven, Gool, 2017) 对语义实例分割的研究,网络将每个像素映射到特征空间中的一个点。这样,属于等价实例的像素就会彼此接近,使得机器可以立即聚集成—组,便于快速识别个体和数量。使用这个原理来模拟机器如何观察对象。
为了达到这个目的, 观众被邀请到达观察装置的右侧去看待机器是以何种方式观察人类和周围环境的。通过转动摄像头,各个窗口视图的画面也跟随着变化,这就是基于机器视觉所进行的模拟输出,通过体会这种换位思考的交互过程,设计者和观众可以很自然的被带入到故事情节中,这为接下来的深层次体会埋下了伏笔。
受到视觉信息的影响,人们会相信声音是从不同的位置发出的,根据 (BBC, 2010) 做过的实验 The McGurkeffect可以看到这种感官冲突。在这种情况下观众所收到的视觉信息是具有迷惑性的,因为视觉信息的输入会占据绝大部分的人类感官,人类愿意以此作为感知决定权。
根据Five Modes of Arts Participation Framework 获得的启发(Novak-Leonard and Brown, 2004) , 我认为升华装置的右侧声音互动部分很重要,因为表象的机器视觉输出只是浅显的内容解释或者吸引观众的注意力 , 这在设计的最后阶段被发现并且进行了修改。
总而言之,人类受到的环境影响下的理解是混乱和模糊的,这是作为理论支持来管理,传达给观众的是声音而不是视觉。装置右侧的声音部分揭示了这样一种现象:人眼看到的不一定是宏观信息。综上所述,为了简单宏观的令观众看清楚这个原理,装置中的蓝色格子被转化成了钢琴乐谱并且播放,这种可视化声音部分不仅是简单的声音转换,也是表达人类基础视觉的局限,以及诵过编程机器可以看到更多细节转化更多信息。
b.装置作品第二部分(下图中间位置)
“尽管我的作品是我的作品,但我的作品更多地是关于你的见识,而不是我的见解。我对空间的存在也很感兴趣。那是你感觉到存在的空间,几乎是—个实体-空间可以赋予的物理感觉和力量。" (Turrel, 2020, p1)
(Turrel, 2020) 将光作为一种艺术媒介,带来了感性和精神上的体验。使观察者的视线达到极限。消除了空间感限制位置的可能性,旁观者的视线转变为感知本身,产生了观者对于自我意识的反思。
通过调研机器视觉和识别技术(Krizhevsky, Sutskever and Hinton, 2012) 得知,当前的物体识别方法主要是利用机器学习方浩。为了提嵩机器识别的性能(特别是在实时扫描阶段),需要收集大量的的离分辨率图片作为信患数据库,学习更强大的模型,并使用更好的技术来防止错误率的增加。例如,MNIST数字识别的错误率<0.3%,这种结果接近于人类。
在调研机器学习的测试中得到了以上这些图片,这种熟悉又陌生的图片很适合这个装置的主题,把他们放到正面的理由是比较直观的让观众体验这种难以识别的感受,原因是原始图片经过机器学习训练后的,图像变得简单化并且特别抽象,甚至是转化变为几个迷你的像素色块,这很难用肉眼识别但是正是我们所需要的结果。
依据(Brabandere, Neven and Gool, 2017)提供的关于语义实例分割semantic instance segmentation数据,二维空间对单一图像的集中性。左侧部分为输入的真实场景。中间部分显示了网络的原始输出(作为RGB的channels的R和G), 并且进行前景遮盖。二维特征空间中的每个像素进行标签着色。
依照这个原理在After effect中进行模拟机器视觉,通过—开始的局部到整体,摄像机运用并且捕捉了物体的点,线面,形状,大小,颜色,像素等物理层面并且经过计算得出条件进入最终的数据收渠处理,很显然此机器处理的过程应用augmented reality的形式输出,效果达到了最佳。
经过机器学习训练后的图片再次借助机器的分析处理,观众可以清楚的看到原始图片是什么以及机器处理的过程是什么,体会人类借助机器去识别机器创造的事物。目前为止,观众可以沉浸在机器为我们带来的好处,这和最后的左侧装置角度可以形成鲜明的对比。
c.装置作品第三部分(下图左侧位置)
通过阅读 (Paglen, 2016) 提供的关于机器学习的知识,机器学习的途径是训练数以万亿计的图像来作为人类对人类的文化基础,我们用来分析视觉文化的理论概念在应用于机器视觉和误读时是严重误导的。作为依据归因于此,在最后—个阶段,设计两个不同的信息数据库是可行的,依据(Blevis, Lim, Roedl, and Stolterman, 2007)在2007HCI国际会议中提到的概念设计批评,设计批判是创造设计知识和实践的—种方式,这种方式是交互设计实践中—个良好的工具,并且与艺术体验—样匹配,所以我们利用选择好的图片在机器学习的相关的软件上进行了多次实验。
观众被邀清进入第三个视角,观察装置的左侧,会看到两个web页面,它们使用不同的数据库作为信息库使两台机器扫描装置的同一侧但输出不同结果。
访问者进入Observation装置的左侧查看两个使用不同数据库的网页。以此作为两个机器不同的输出,输出的结果有所偏差甚至大比例是输出蘑菇结果。Observation装置允许参观者体验和思考机器视觉和偏见的过程。机器系统的信息通过客观性或形象的美学和意识形态运行。因此,机器世界发展了一种特别有害的超级意识形态,因为它要求客观性和平等。
然而,由于对于对象识别任务存在着复杂性,这就意味着即使是像lmageNet这样大的数据集也无法准确的指定结果,因此我们的模型也应该具有大量的先验知识来补偿我们没有的所有数据。综上所述,即使是卷积神经网络这种模型也存在着局限性,尤其是在假设事件的能力方面。
最后,我们将装置的第三个角度作为一个关于终极设计的传达和效果的多层次论述过程。经过左侧的实验我们发现并且学习到设计批评可以看作为一种研究的方法,利用干扰和概念框架作为结构的支撑机制。虽然该过程仍然存在争议,因为这其中涉及理性,感性,伦理和美学形式对人类文化的影响。
Observation装置更像是一种感知体验,这种体验的途径是多感官协同合作的,并加以整合反应对于机器视觉的理解。具体而言,Observation项目仍然需要充分考虑机器视觉以及机器学习对于人类日常生活的影响,辅以在展览中以及从观众口中得到的反馈作为反思基础。在信任机器类辅助行为之前,人类的主观思维一定要提前涉及到位。
本作品没有单一性的批判人工智能黑暗的一面,理由是机器视觉的应用加速了人类和机器人协同合作的进程,如果没有机器视觉技术将大量的设备、机器和人类连接在一起,简化原始劳动力的科技行为将不会发生。综上所述,在进行探索未知事物的同时也要善于利用人造科技作为有利的理性支撑。设计师要全面的考虑即时发生的社会现象,以及环境影响下的人类意识的未来,这对于用户也是必要并且期望着的。
此外,诵过本文的研究,带领着观众以—种旅程的叙事方式更容易被非专业人士所接受,因此Observation装置的模式将被定义为—种良好的服务于观众理解的体验形式,以一种多感官体验方式潜移默化的影响观者思绪。尽管由于研究的焦点群体缺乏相关领域的知识,但以一种干扰性的方式提高了人们对机器学习以及机器视觉的理解。
综上所述,与大多数数字技术—样,通过展览的实施过程来考虑Observation项目产生的影响,尽管它仍然是根据机器学习的理念所产生的后续发展,但我们仍然需要考虑不同环境下的清况,考虑受众以及用户体验的反馈过程。Observation项目的设计理念了激发对于替代性人类视觉的反思以及批判性思考。虽然机器视觉会被认为是人类视觉的替代品,尤其在工业自动化流程的主流意识下,但仍然需要根据不同的清况进行里体的应用。考虑到此项发明的合理性,受益于人类生产活动而不是取代人类的自我感知。
03 彩蛋
张威,在听到康老师采访你的消息之后,我就在旁边听着你们之间的对话,我没有打断,还是选择了用一种传统的方式给你稍微写些什么...
从视觉传达转到交互设计的这一年里,很欣慰能够看到他对这个专业课程的热爱,希望你能够一直保持热情保持好奇,勇于去尝试,就像我一直说的:你无论想要做什么,起码一直都会有我的支持哦!
——你的老师,Falin
Falin老师标准微笑
如果大家有艺术留学问题,欢迎向康石石通过今日头条私信提问