书城计算机体感交互技术
4996300000021

第21章 基于体感交互的书空临摹学习(2)

本书选择建模能力更为精细的连续HMM作为识别模型,算法包采用GHMM0.7.0(http://ghmm.sourceforge.net/)。经过反复实验确定了各个参数:每个HMM包含三个隐藏状态,每一个状态包含的混合高斯分布数目也为三。每个模型的初始参数为零均值,单位方差,相同的初始转移概率,训练时每个模型的参数估计被重复调用了5次。假设总共有个HMM包含三个隐藏状态,每一个状态包含的混合高斯分布数目也为三。每个模型的初始参数为零均值,单位方差,相同的初始转移概率,训练时每个模型的参数估计被重复调用了5次。假设总共有M种手势,其对应的HMM模型组成了一个HMM向量,算法步骤如下:

Step1.用Baum-Welch算法训练得到每个HMM(λi)的参数:状态之间的转移概率,初始状态概率,每个状态i的参数(i=1,2,3):数学期望μim,协方差Uim以及每个高斯混合模型的权值cim(m=1,2,3);

Step2.用Forward-Backward算法计算P(O|λi),该值最大的手势即为识别出的手势,即:

在训练阶段,用户手持运动传感设备为手势集合中的每个动作采集示范样本,并通过添加噪声的方法自动生成一系列训练样本143,这将大大减轻用户采集训练样本的劳动强度;这些经过预处理后的传感样本被用于离线的训练每种手势的隐马尔科夫模型。在识别阶段,用户做出某种手势后,系统遍历所有的手势的隐马尔科夫模型,计算这些模型产生该手势序列的概率值,该值最大的模型所对应的手势即为识别出的手势。接着系统调出该手势对应的笔画,完成书空作画的第一步。

7.4基于用户输入差异的笔画变形

为了使书空临摹有一定的趣味性,并增强临摹结果中变化的美感,并且带有个性化的表现特色,需要根据用户手势的差异性对绘制的笔画进行一定的变形处理,而不是呆板地根据所识别出来的书空手势来简单再现笔画。本书是基于用户输入手势与标准笔画手势在加速度量值中的差异,来确定当前笔画变形参数的阈值范围,基于预定义的笔画锚点生成所期望的笔画变形结果。

在处理旋转时,如图7.4所示,当原始笔画根据WiiRemote捕获的数据围绕图像左上角旋转了θ角后,为保持画面效果,要在画面中锚点不变并做平移变换,平移的矢量为DB。

处理缩放时,如图7.5所示,输入训练和识别得到的两组WiiRemote的加速度值,通过分别计算其加速度平均值并比较大小,得到两者的差异值来控制笔画图片的缩放,输出缩放后的笔画。与旋转一样,在画面中要保持锚点不变需平移向量DB(x"-x"s,y"-y"s)。

DB的计算如下:

B点坐标为(x,y)

经过缩放s倍后,D点坐标为(xs,ys)

所以平移矢量DB=(x-xs,y-ys)

7.5实验与可用性分析

基于以上的交互方式和技术,设计和实现了基于书空交互的水墨画临摹实验系统,并进行一系列的用户体验实验,实验在一台IntelCoreDuoCPU,4G内存的PC机上进行。

实验选择了10幅简笔水墨画作为临摹样例,提炼每个半透明的笔画,获得笔画的路径、轮廓,确定锚点,编号后放在笔画数据库中。如图7.6所示,左图是提取的水墨画《兰花》的毛笔笔画,中间是手势的轨迹,右边是提取的轮廓和框架。分析每个笔画的执笔特点,设计手势轨迹,作对应的标准手势采样,具体方法为邀请有水墨画功底的人做手势采样,系统以他们的手势作为预设的标准手势,每个笔画做一次采样即可,每幅水墨画大约在10分钟内可以做完采样。为了减轻手势的训练强度,可以通过添加噪声等手段半自动的生成一系列训练数据。

儿童使用时直接做手势,与预设的手势作对比识别,然后量化采样与实际操作时的手势的强度和方向的差异率来对毛笔笔画进行变形。

在界面设计时充分考虑到儿童用户与计算机交互时相对随意,不精确并且追求自然的特点,交互界面简单明了。突出了样例的整体提示、笔画和手势提示、体感交互虚拟化身的操作正误的提示等。界面如图7.7所示,左上角是样例提示,中间是当前和下一步的毛笔笔画和手势提示,最下面是操作正误提醒。通过Wii手柄上的一个按钮来控制手势(即笔画)的起始和结束。一个手势结束后,系统对其进行识别,并将识别结果映射为预定义的笔画。从某一笔画到下一笔画之间的间断是按作画步骤来处理,当手势识别正确就绘制出来,反之就通过体感交互虚拟化身的表情和声音,在提示区报错重做,直到识别正确后更换到下一个笔画。

本书实验的体感交互虚拟化身使用了最简单的卡通头像,可以做出正误的表情,并且发出提示声音。

测试了算法的执行效率,用户完成某个手势后,识别算法的计算时间少于1ms,满足实时计算的要求。

为了对书空临摹交互的可用性进行评估,本书作者邀请了喜爱绘画涂鸦的10名7-13岁的儿童参与了书空交互实验的测试,这些儿童中有5名是具有一定的水墨画绘画基础,另外5名是没有水墨画绘画基础,据此分为专业组和业余组。图7.8记录了参与书空临摹实验的这些儿童绘画后的结果示例,最左边是样例图像,后面两幅是实验的部分截图。

实验除了本书的书空临摹实验,还对比了传统笔墨纸砚的水墨画临摹,在Adobephotoshop中用鼠标做绘画交互,以及用压力感应笔的触摸板交互的绘画测试,其中鼠标绘画属于GUI界面范式,触摸板和触摸笔代表笔式交互界面的范式。可用性分析综合了主观的使用评价和客观的实验数据,通过对比这四种水墨画绘画方式,得到了可用性评价,如下所述。

7.5.1操作绩效

图7.9为实验记录的其中几幅水墨画的绘画平均时间,时间单位为分钟。图7.10为实验记录的书空临摹的平均手势识别错误率,单位为从0%到100%百分制,专业组的儿童在手势识别错误率上(平均约为30.5%)比业余组(平均约为34.8%)的稍低些。通过以上完成绘画任务的平均时间和错误率得出几种交互方式的操作绩效的对比,运动传感的操作绩效最高,笔式绘画交互的操作绩效较低,鼠标和传统水墨画的操作绩效则最低。本书的书空临摹有上下文信息的提醒和实时信息反馈,以加强对水墨画程式的记忆。实验结果表明在操作绩效上书空临摹的优势是明显的,由于本实验采用直接操纵的方式,遵循书空隐喻,因此儿童能以日常绘画经验熟练运用。

7.5.2用户体验

体感计算也体现了以用户为中心的设计思想,其中包含了把用户的体验性认知和体感运动行为列入考虑的范围。用户体验总是体现在细微之处,但是却非常重要。创建吸引人的、高效的用户情感体验的方法被称为以用户为中心的设计(User-CenteredDesign)144。

如图7.11所示,记录了儿童用户使用书空临摹实验后的主观的情感体验,在易学习、直观自然、有趣和主观效率方面的用户体验的评价,评分标准为从0%到100%百分制。

儿童的实验评价表明,书空临摹在趣味性方面的优势是非常明显的;相比传统水墨画、GUI绘画交互和笔式绘画交互,书空临摹具有更强的游戏性,书空临摹可以用模糊的、3D的交互方式寓教于乐,于潜移默化中加强对水墨画运笔方法等程式的记忆。

7.5.3满意度

满意度是参与实验的孩子们在对比几种绘画交互方式后得到的主观评价。在对儿童水墨画学习交互媒介的偏好统计中,大约有70%的儿童用户选择书空临摹实验,10%的儿童倾向传统水墨画,10%的用户倾向笔式绘画交互,10%的用户倾向GUI绘画交互,如图7.12所示,书空交互方式使儿童有满足感,乐于使用。

实验的可用性分析结果表明,借助水墨画样例,应用计算机技术来模拟毛笔笔画,以隔空作画的交互方式来做水墨画的创作研究,儿童不需要太多的指导和讲解即能很快掌握水墨画的书空临摹方法。对掌握书空临摹功能和交互技术,儿童表现出了很大的信心和兴趣。与笔式用户界面和GUI绘画交互相比,基于运动传感的书空临摹更适合水墨画学习前期的对临阶段,便于兴趣培养,能有效调动儿童学习水墨画的主动性。

7.6本章小结

当前已经有很多研究机构在进行儿童绘画交互的研究,为儿童学习水墨画提供更加良好的身体运动交互的学习方式是数字化学习和人机交互领域的很多学者孜孜以求的目标之一。多数的研究是利用鼠标或者手写笔等输入设备在平面上进行交互,或者综合应用笔势和语音识别进行多通道的交互,然而对于水墨画学习的交互是比较特殊的问题,比如要解决必要的上下文信息的步骤提醒等。本章的实验作为一个面向个性化学习的体感计算的案例,以交互绘画为例,初步探讨了个性化学习中的体验性认知与行为计算的可能性,重点探索了当前儿童绘画学习中的3D、自然的体感交互方式和样例信息的可用性等问题,并为基于体感计算的个性化学习交互的实现提供了一个综合性的解决方案。实验结果表明通过激发儿童用户身体运动感觉,促进艺术行为符号的体验性认知,在潜移默化中掌握水墨画绘画步骤和构图技巧,提升对中国传统水墨画艺术的美学感受,面向个性化学习的体感计算能让儿童用户更好的感受和体验绘画艺术的学习趣味性,有助于他们增强艺术的感知记忆。

本实验的不足是没有使用空间深度信息,主要因为使用Wii的红外线传输接口144,在获得空间深度的信息时需要进行复杂的调整对齐。

本实验作为体感计算的一个案例,主要支持面向个性化学习的行为计算和体感交互模型的假设,以及支持面向儿童的创造性体验的假设。本实验证明了技术上具有切实可行性,核心技术主要是基于手势本身的运动特性(加速度)和运动幅度来识别个性化书空体感的笔画特征,这样用户在通过带有个性化的书空手势作画时可以更加自由。此外,本交互实验的方法对其他的个性化学习有一定的相似性,比如书法,因为都需要练习和记忆毛笔笔法和步骤,但是如果要做书法的书空练习,需要研究面向书法的毛笔笔画变形的算法。未来在探索基于运动传感的体感计算和笔墨纸砚的综合使用方面有待进一步深入的研究,比如继续探讨手势的体感语义、笔画模型、水墨的比例、纸的纹理等技术的综合使用。