1 探析人机自然交互研究的最新进展-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探析人机自然交互研究的最新进展

mK5P_AItists 来源:cc 2019-02-25 14:15 次阅读

随着信息技术的发展,在传统物理键盘之外,触屏、虚拟现实等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能。如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。

在信息技术领域,“胖手指”这一术语专指由于手指本身的柔软,以及点击时对于屏幕显示内容的遮挡,在触屏上点击时往往难以精确控制落点位置的问题。随着信息技术的飞速发展、新型交互方式的不断涌现,在人机交互研究领域,这类问题日益成为研究的热点。

近日获得中国计算机学会(CCF)优秀博士学位论文奖的研究成果中,清华大学博士易鑫试图以深化的贝叶斯方法解决人机自然交互行为噪声带来的意图推理难题,为解决“胖手指”问题带来了新的思路。

易鑫的导师——清华大学计算机系教授、全球创新学院院长史元春告诉《中国科学报》:“这算是我们向让机器理解人类行为迈出的一小步。”

兼顾交互的自然性和高效性

贝叶斯方法也称为贝叶斯定理,它所呈现的公式可以让人们通过已知的条件概率(通常是因果方向的)计算未知的概率,因而成为很多进行概率推理的现代人工智能系统的基础。

而对于易鑫来说,在他以人机交互研究为主题的博士学位论文中,与贝叶斯方法相关的关键词是“文本输入”。易鑫告诉《中国科学报》:“文本输入是人机交互中最基本的任务之一,是人向计算机表达交互意图的重要途径。”而在进行文本输入意图推理时,目前最常用的方法——经典统计解码方法,其本质也是贝叶斯方法。

随着信息技术的发展,在传统物理键盘之外,触屏、虚拟现实等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能。“如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。”易鑫说。

人机交互研究的一大特点是与实际需求或应用场景联系非常紧密。在数十年以前,人机界面就经历了从命令行界面到图形用户界面的演变。

易鑫介绍说,命令行界面的优点是由于物理键盘输入相对较高的准确率,以及几乎不需要冗余的操作,所以熟练的用户可以达到非常高的交互效率。但是,其缺点在于交互非常不直观,用户需要记忆大量的指令,有时甚至需要具备计算机领域的专业知识和技能,才能达到较高的使用效率。

为了改进这一问题,研究者提出了图形用户界面。图形用户界面的一大优势是摆脱了抽象的命令,显著降低了用户的学习和认知成本。然而,由于图形用户界面的基本操作是指点,即用户需要使用鼠标操作屏幕指针来选择交互目标,因而其往往对用户指点操作的精度有较高的要求。

易鑫告诉记者,多年来人机界面的发展趋势是越来越强调交互的自然性,即用户的交互行为与其生理和认知的习惯相吻合,并随之出现了触摸交互界面,以及近年来的体感交互、虚拟现实等三维交互界面。三维交互界面的优势是进一步提升了人机界面的自然性,但其挑战则在于完全缺乏触觉反馈,导致用户动作行为中的噪声相对较大,难以进行交互意图的准确推理,从而限制了交互输入的准确度。

“此前,也有研究者尝试采用贝叶斯方法解决文本输入中兼顾交互的自然性和高效性这一难题,但往往仅考虑了落点位置信息,作用有限。”易鑫告诉记者,为此,他在自己的研究中面向多种输入接口,从点击模型精度优化(提升计算精度)、面向不确定性输入映射的计算方法扩展(扩展计算方法)和文本输入手部动作建模(扩充先验知识)等方面优化了文本输入的基本贝叶斯方法,相应的技术也大幅提高了自然文本输入的交互性能。

触屏设备上的模型优化

易鑫在其研究中,针对触屏软键盘这一文本输入接口上的胖手指难题,提出了触屏软键盘上精度优化的点击模型。

他告诉《中国科学报》,在日常生活中,虽然智能手机智能手表等触屏设备正变得越来越普遍,但由于触摸操作的不准确性,在触屏上点击小尺寸目标仍然十分困难。而其不准确性主要来自两方面原因:一是用户点击行为中的噪声,也常常被称为“胖手指”问题,二是点击位置识别算法的误差。

为了测量用户在智能手机上触摸时的落点偏差,易鑫和他的同伴从校园招募了多名被试人员。在实验中,他们主要关注两个问题:一是落点偏差是否随着目标位置的不同而不同,二是拇指和食指两种点击姿势下的偏差模式是否一致。最终,他们发现,在使用食指和拇指点击时,点击偏差都会受到目标位置的影响,其中后者受到的影响更为显著。

基于触摸落点位置的高精度识别方法,易鑫在论文中进一步建立了接口尺寸与输入速度、准确率和落点分布的作用关系,提升了软键盘输入贝叶斯方法中点击模型与输入行为的吻合程度,定量描述了当用户在宽度为2.0到4.0厘米的超小尺寸全键盘上进行文本输入时的行为特征。

用户实验结果证明,基于该精度优化的点击模型的贝叶斯方法能支持用户在宽度仅为3.5厘米的智能手表全键盘上达到与智能手机软键盘相当的、每分钟35个英文单词的输入速度和近100%的准确率。此外,点击模型的精度优化也能将手机软键盘的文本输入错误率降低23%。

另外,易鑫还在研究中定量分析了点击模型和语言模型的能力分别对文本输入的贝叶斯方法识别效果的影响,为点击模型的精度优化提供了依据和理论指导。

在行为中发现知识

“如果单纯就文本输入问题而言,特别是涉及自然的人机交互方式,易鑫所做的工作在国际上是领先的。”在对易鑫的研究进行评价时,史元春用词十分严谨。

可以作为佐证的成果之一是,易鑫对于空中文本输入的研究。空中文本输入对于后桌面时代交互(如虚拟现实、移动手机)是一个有潜力和被期待的交互需求。在这方面,虽然十指盲打是人们在日常生活中最高效和最习惯的输入方式,但针对基于该能力的空中裸手十指盲打技术的研究,此前尚没有人取得很好的效果。

而易鑫在研究中提出了一种使得空中裸手十指盲打成为可能的新型技术ATK。结果证明,ATK在输入速度和准确率方面都超过了已有的空中文本输入技术,第一次较好地实现了这一已经提出数十年的交互概念。

对于下一步的研究,易鑫的设想之一是,研究贝叶斯方法与大数据机器学习类方法的融合。他表示,虽然贝叶斯方法在目前的研究中取得了不错的效果,但是其模型的参数还是基于少量(数十人)的样本训练而来。随着原型的迭代和可用数据的增多,大数据机器学习类方法将有机会在意图推理中发挥重要的作用。然而,为了保持模型的可解释性与可推广性,需要探索贝叶斯方法与大数据机器学习类方法的有机融合方法,将“黑盒子”与“白盒子”结合起来,以达到精度和推广性的同步优化。

史元春告诉记者,与人机交互领域贝叶斯方法的应用相比,机器学习领域的贝叶斯方法主要是在数据中发现知识,而人机交互则是在行为中发现知识。她正主持进行的一项“十三五”国家重点研发计划中的前沿基础类研究项目,就是开展人机交互自然性的计算原理的研究,致力于探索使机器可以理解人类表达方式的能力。“易鑫的研究也是我们这项研究中的一部分。”史元春说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1206

    浏览量

    55380
  • 虚拟现实
    +关注

    关注

    15

    文章

    2287

    浏览量

    94977

原文标题:向机器理解人类行为迈出一小步

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    上海交大团队发表MEMS视触觉融合多模态人机交互新进展

      近日,上海交通大学电子信息与电气工程学院微米纳米加工技术全国重点实验室刘景全团队和上海交通大学人工智能学院卢策吾团队在人机交互领域取得重要进展,相关成果以“Capturing forceful
    的头像 发表于 11-28 10:50 648次阅读
    上海交大团队发表MEMS视触觉融合多模态<b class='flag-5'>人机交互</b><b class='flag-5'>新进展</b>

    揭秘超以太网联盟(UEC)1.0 规范最新进展(2024Q4)

    近期,由博通、思科、Arista、微软、Meta等国际顶级半导体、设备和云厂商牵头成立的超以太网联盟(UEC)在OCP Global Summit上对外公布其最新进展——UEC规范1.0的预览版本。让我们一睹为快吧!
    的头像 发表于 11-18 16:53 354次阅读
    揭秘超以太网联盟(UEC)1.0 规范<b class='flag-5'>最新进展</b>(2024Q4)

    Qorvo在射频和电源管理领域的最新进展

    了半导体行业的重大变革,还成功引领Qorvo成为射频技术的领导者。在本次专访中,Philip将为大家分享Qorvo在射频和电源管理领域的最新进展,并探讨HPA事业部如何通过技术创新应对全球电气化和互联化的挑战。
    的头像 发表于 11-17 10:57 458次阅读

    芯片和封装级互连技术的最新进展

    近年来,计算领域发生了巨大变化,通信已成为系统性能的主要瓶颈,而非计算本身。这一转变使互连技术 - 即实现计算系统各组件之间数据交换的通道 - 成为计算机架构创新的焦点。本文探讨了通用、专用和量子计算系统中芯片和封装级互连的最新进展,并强调了这一快速发展领域的关键技术、挑战和机遇。
    的头像 发表于 10-28 09:50 391次阅读

    AI大模型的最新研究进展

    AI大模型的最新研究进展体现在多个方面,以下是对其最新进展的介绍: 一、技术创新与突破 生成式AI技术的爆发 : 生成式AI技术正在迅速发展,其强大的生成能力使得AI大模型在多个领域得到广泛应用
    的头像 发表于 10-23 15:19 407次阅读

    5G新通话技术取得新进展

    在探讨5G新通话这一话题时,我们需首先明确其背景与重要性。自2022年4月国内运营商正式推出以来,5G新通话作为传统语音通话的升级版,迅速吸引了公众的目光,并引起了社会的广泛关注。它基于5G网络,代表了通信技术的新进展
    的头像 发表于 10-12 16:02 592次阅读

    中国科学院西安光机所智能光学显微成像研究取得新进展

    近日,瞬态光学与光子技术国家重点实验室在智能光学显微成像研究方面取得新进展研究成果在线发表于国际高水平学术期刊《光电进展》(Opto-Electronic Advances,IF:
    的头像 发表于 09-29 06:20 363次阅读
    中国科学院西安光机所智能光学显微成像<b class='flag-5'>研究</b>取得<b class='flag-5'>新进展</b>

    中国科学技术大学科研团队取得量子计算研究新进展

    中国科学技术大学科研团队取得量子计算研究新进展 据央视新闻报道,中国科学技术大学科研团队利用自主研发的关键设备,利用“自底而上”的量子模拟方法,在国际上首次实现光子的反常分数量子霍尔态。 据中国科大
    的头像 发表于 05-08 16:40 705次阅读

    广东的5G-A、信号升格和低空经济,又有新进展

    了两地的5G/5G-A、智算等数字基础设施建设,深入了解了他们在信号升格和低空经济方面的最新进展。活动一共持续了三天,前后跑了8个项目,虽然很累,但收获满满。接下
    的头像 发表于 04-19 08:05 821次阅读
    广东的5G-A、信号升格和低空经济,又有<b class='flag-5'>新进展</b>!

    百度首席技术官王海峰解读文心大模型的关键技术和最新进展

    4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能体、代码、多模型等多项文心大模型的关键技术和最新进展
    的头像 发表于 04-18 09:20 690次阅读
    百度首席技术官王海峰解读文心大模型的关键技术和<b class='flag-5'>最新进展</b>

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 418次阅读

    四个50亿+,多个半导体项目最新进展

    来源:全球半导体观察,谢谢 编辑:感知芯视界 Link 近日,半导体行业多个项目迎来最新进展,其中浙江丽水特色工艺晶圆制造项目、浙江中宁硅业硅碳负极材料及高纯硅烷系列产品项目、晶隆半导体材料及器件
    的头像 发表于 02-27 09:35 1009次阅读

    清华大学在电子鼻传感器仿生嗅闻方向取得新进展

    近日,清华大学机械系在电子鼻仿生嗅闻研究中取得新进展,相关研究成果以“Sniffing Like a Wine Taster: Multiple Overlapping Sniffs (MOSS
    的头像 发表于 02-20 10:57 992次阅读
    清华大学在电子鼻传感器仿生嗅闻方向取得<b class='flag-5'>新进展</b>

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 676次阅读

    语音识别技术最新进展:视听融合的多模态交互成为主要演进方向

    多种模态(声学、语言模型、视觉特征等)进行联合建模,基于深度学习的多模态语音识别取得了新进展。   多模态交互的原理及优势   多模态交互技术融合了多种输入方式,包括语音、手势、触摸和眼动等,使用户可以根据自己的喜好和习惯
    的头像 发表于 12-28 09:06 3837次阅读
    语音识别技术<b class='flag-5'>最新进展</b>:视听融合的多模态<b class='flag-5'>交互</b>成为主要演进方向