人工智能科普|超实用的人机交互解决方案!

2023-05-31 0 689

「AIUI」术语评注

AIUI是华大基因新一代的可视化式软件控制系统,结合了抛物面辨识、串行可视化、音频合成、语法认知、专有语法等sizes潜能,逐步形成了全信道的协同发展软件控制系统。

从现代可视化式到AIUI

可视化式的产业发展是一个艰难的操作过程。

从PC黄金时代的按键+滑鼠可视化方式,到移动互联黄金时代的远距轻触可视化,再到物联网黄金时代音频+听觉的新式可视化,可视化式渐渐与以电脑为服务项目中心可视化方式,迈向以数人服务项目中心的可视化方式。

音频可视化在这前述的变革起到了重要促进作用

人工智能科普|超实用的人机交互解决方案!

音频可视化从移动互联网黄金时代已经开始蓬勃发展,从一已经开始出现的具备音频潜能的app到那时多逻辑控制系统交互的电脑人,音频可视化的产业发展控制技术也是历经了急速地插值和预览。

现代人工智慧音频可视化的信道各个环节是先由使用者对电脑讲出市场需求,电脑将使用者的音频辨识成文本结论,再通过语法认知服务项目译出使用者的市场需求,聚合适当的语法协定,最后将聚合的音频文档体育新闻出。

人工智能科普|超实用的人机交互解决方案!

现代音频可视化式信道主要就倚赖3大核心控制技术:音频辨识、语法认知、音频合成,总的来说信道商业模式没有太大问题,但彼时的控制技术产业发展比不上那时成形,在前述应用领域操作过程中难受主观自然环境的影响。

音频辨识率相对较低、语法认知不对、网页内容严重不足、控制系统积极响应单个…这是现代音频可视化式所遭遇的主要就控制技术症结。

为了解决这些控制技术症结,自然可视化式信道在现代的信道基础上增加了音频唤醒控制系统,同时对3大核心控制技术进行插值升级,比如在音频辨识控制技术中增加麦克风阵列和无效拒识控制技术;在语法认知中增加对话管理和上下文认知、纠错等控制技术;在音频合成中加入情境和情感分析。

人工智能科普|超实用的人机交互解决方案!

3种不同功能可视化的控制技术原理分析

AIUI的可视化式流程分为感知、认知、处理、表达四部分。

在讲它的控制技术原理之前,我们先来看个简单的例子:

使用者A对着电脑说:“我要去北京”,如图所示,音频助手在辨识、认知出使用者A的意思,会有3种的不同类型的反馈。

人工智能科普|超实用的人机交互解决方案!

这三种反馈在可视化式中都是比较合理的,至于最终采用哪种类型的反馈,还是取决于产品的定位和特性。

了解了三种不同类型的可视化反馈,我们来学习下这三种可视化中所涉及到的相关控制技术。

任务完成型的可视化认知

任务完成型的可视化认知,主要就是电脑帮助用户解决某些问题,完成适当的任务。

使用者B问音频助手:“有没有明天从合肥到北京的航班?”音频助手通过设定好的语法协定框架抓取出这句话中的认知要素:使用者意图、使用者操作、起点、终点、日期。

借助这些基本认知要素,音频助手便可以将查询结论一一反馈给使用者。

这个操作过程中主要就的控制技术症结就是语法抽取,语法信息单元的抽取一般有2种方式,一是显规则;二是基于深度学习模型的语法抽取

我们来讲下第二种语法抽取的方式,比如将使用者输入的文档“刘德华电影”看成一组序列,每个字都是一个单独的序列,在序列的基础之上电脑会做适当的预测,通过深度学习控制技术建立适当的抽取模型比如RNN或CNN模型,得出每个字符对应的标记。

人工智能科普|超实用的人机交互解决方案!

基于知识图谱的知识问答类型

关于知识图谱,之前我们已经科学普及过一次,没看过的同学请戳:困于答题游戏无法自拔?AI有一招让你百战百胜!

基于知识图谱的问答类型其实操作过程并不复杂,使用者输入问题文档之后,电脑会按照语言学方式去认知分析这个问题,然后再知识图谱种检索相关的知识,同时将语法认知的结论和检索出的知识做一些推理,最终得出控制系统答案。

人工智能科普|超实用的人机交互解决方案!

基于问答库的闲聊或问答

闲聊类型的可视化操作过程其实也很简单,电脑收到使用者所问问题,在适当的问答知识库中计算出相似度较高的几个问答,然后在利用句子语法匹配算法找出最相似的问答,最终输出结论。

这个操作过程的控制技术症结是在于如何利用深度学习控制技术,训练出合适的CNN或RNN模型去计算2个问题之间的相似性。

人工智能科普|超实用的人机交互解决方案!

在闲聊问答操作过程中,除了在问答库中匹配相似问答之外,还有一种比较常规的是

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务