88看书>网络游戏>黑科技超级辅助>第192章 唤醒词

智能音箱最核心的东西是什么?

其实这个答案很明显了,从它的名字上就能看出来,智能音箱最重要的肯定是智能。

也有的人说是音箱二字,其实能被成为音箱的,音质都很重要。

就像如果去参加全国厨艺大赛,人们的聚焦的点肯定是做出来的美食好不好吃,而不用考虑做出来的东西到底能不能吃一样。

如果不能吃的美食那还叫美食吗?智能音箱也一样,如果都不能成为音箱,再高的智能又有什么用。

智能音箱最终是靠声音体现它自身的价值,如果唱个歌曲还带着刺刺拉拉的电流声,高音上不去,低音下不来,除了能制造噪音,别无用途。

之前林奇见过某互联网公司在制造智能音箱之前做的一个问卷调查,里面有一个问题是这样的:

对于一款智能音箱,您最看重的项目依次点击排序。然后下面给出来了几个选项,内容丰富;支持控制的智能家居设备多;音质好;品牌有名;外观好看;价格便宜;反应速度快;功能多。

林奇反复了确认了一遍,没有智能这个选项,林奇想破了脑袋也想不明白,为什么智能音箱的问卷调查没有智能。

难道是他们认为这个是智能音箱的标配,就像音质那样吗?那去掉的也应该是音质而不是智能好吧,每个公司的造出来的智能音箱里面的智能可是天差地别。

所以林奇决定先编写智能音箱的最核心的东西——智能模块。

与所有的智能音箱一样,林奇决定把智能模块放到服务端。

如果智能音箱不联网,它可以使用一些简单的功能,比如可以定时,可以定闹钟什么的。

但是如果涉及到交互就不行了,比如你问他一个简单的问题后天的天气是什么,“他”(拟人化,有的时候“它”、“他”会混着用)就回答不上来。

智能音箱可以分为智能和使用方面还有硬件三部分。

智能是所有的智能音箱赖以生存的土壤,硬件是他的载体,使用方面则是一些使用方面的定义等(比如唤醒词,比如周围的环境音干扰……)。

林奇在写智能软件后端的时候就要考虑到一些使用方面的问题,比如第二智慧科技的智能音箱是否需要唤醒词。

现在所有的智能音箱都有一个唤醒词,不论是4字5字还是6字的。

为什么会有“唤醒词”这个奇怪的东西,唤醒词是怎么来的。

经过查询资料,林奇了解到了唤醒词的故事。

和智能音箱在对话的时候,就像你和一屋子的同事在说话,有问有答。

你对同事喊道“小明。”

小明听到了就会抬头看着你,表示在听。

你接着问,“今天我们叫什么外卖?”

小明打开手机翻看了一圈,“要不我们吃黄闷鸡米饭。”

“我昨天刚吃过。”

小明……

人们和智能音箱的对话也类似,可以分为五个步骤——唤醒、相应、输入、理解、反馈。

第一个环节就是唤醒,智能音箱是实时的在那里待命,就像一个警戒的“猫鼬”。

“小黑。”你叫了他的名字,他就会把耳朵竖起来听你讲话,否则你说其他什么任何话语他都处于神游的状态,这是在假设现在的智能音箱都遵守隐私,不会实时监听我们说话。

因为这个是第一个环节,所以唤醒环节的体验在整个语音交互的流程中起着至关重要的作用,它的体验好坏将直接影响用户对产品的“第一印象”。

林奇对此深有感触,他买了很多的智能音箱,有的音箱他喊了好几次才有回应,而其他的响应比率就比较高。

在长期测试下来,林奇更倾向于使用唤醒率高的那些智能音箱,而唤醒率低的慢慢就被林奇遗忘了。

其实上面的举得那个例子也不是特别恰当,如果办公室里面就你和小明两个人,你就不需要先叫小明的名字,然后在问出来问题,否则会显得很别扭。

办公室明明就他一个人,你还在叫一遍名字,会显得多余。

智能音箱之所以一定要有唤醒词,归根到底还是因为他不够智能,如果他足够智能的话,就能自己判断是否是在和他对话,他就知道改如何响应了。

关于唤醒词这个东西,市场上还有专门的研究人员对这个做了研究。

除了唤醒词本身的含义外,他们还从多个方面入手研究。

比如“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢,还有“小+字”的名字最受用户喜欢。

甚至还从声调、声母和韵母这几个方面都做了调研研究。

研究了这么多的唤醒词,林奇发现扳手公司对此有自己“独特的理解”,他们发布的智能音箱,除了用语音唤醒之外,还能支持触摸式和遥控器式的唤醒。

虽然这种方式是一种创新,但是林奇并不赞同这种“创新”,本来智能音箱就是一个语音交互,为了让人们省事。

可以想象,在家中你想换一个唤醒音箱的方法,然后就跑去音箱旁边摸它一下,把他唤醒了,但是反正都要说话,还不如直接就叫它名字。

这也还好吧,多一种选择,无非多一些设计多一些钱。

但是遥控器唤醒就有点……

语音交互的本质是为了节省用户时间,让用户感觉到舒服,这倒好,给配了一个遥控器。

遥控器是一个容易丢


状态提示:第192章 唤醒词--第1页完,继续看下一页
回到顶部