您的位置首页  科技生活  人工智能

充满语音的未来是什么样子?

  语音是很多刚刚想涉足人工智能领域的人所忌惮的,因为从多个角度来说,语音的发展进程较为波折,有几个现状:

  现在移动互联网时代还是人们生活的主要解决问题的方式,而媒介是手机,使用界面来传递信息的,这几年人们已经习惯这种方式,突然之间换到没有界面,传递信息相对单一而且缓慢的语音方式,就会有很多抵触的地方,使用起来感觉很奇怪,让不少产品横尸街头。

  人工智能虽然被大力支持,但开始的时间还较短,人才供应难以满足企业的需求,企业想要短时间内可以将技术产品化的成熟工程师,消耗的财力物力巨大,处于转型阶段的工程师,或者读相关专业的学生还不足以达到这个标准,语音尤为明显,所以市场上处于一个浮躁,焦虑的状态。

  但是意味着语音会在发展中慢慢淡化,甚至只能成为一场泡沫么,我认为不仅非但如此,语音才是人们接受人工智能真正的入口,而且也是将来应用范围最平常,也最广泛的场景。现在的界面给了人们挑选的空间,多样性,信息输入的多样性,但是人们越来越受其影响,效率低下,疲于选择,易于沉迷。

  如果你问一个普通人,你认为在一张图片中检测出车牌号,手机APP给你推送你最喜欢的新闻,商品,这是人工智能么,他可能也说不清楚是与否,可能他都没有察觉出这些变化,但是你要问他,机器像和人一样对话,是人工智能么,他会毫不犹豫的肯定,因为说话是判断一个人最直观,也最自然不过的方式,人们不懂算法,也不懂数据,就知道我面前的这台冷冰冰的机器能和人一样与我交流,在交流中为我服务,那就是智能,所以,语音是最合适的入口。

  随着对模型的不断训练,医院可以通过扫描过大量图片的机器判断疾病,可以通过人脸检测判断嫌疑犯,金融可以通过相关算法预测股票,但是语音最合适的场景却是贴近人们再平常不过的生活,教育,法律,生产虽然都会加入语音,但是机器真正解决人们需求的关键点并不在此,它放在具体的这些领域就是换了一种输入输出方式,其实是可有可无的,但是在普通人的生活中,可以随着语音在各类场景的全覆盖,经过长时间的体验,适应,改变解决问题的方式,会潜移默化的让人们从屏幕上解脱出来,摆脱地点的限制,随时随地用最直接的方式接收输出信息,控制生活的一切,最终享受于只要说话就可以解决生活很多问题的状态。

  再向前进一步想象,语音的普及状态会是什么样的,那将会是一个万物互联的社会,最近总频繁听到这个描述着未来的词,那么怎么一个互联的方式呢?泛泛而谈比较抽象和枯燥,也有点一直给语音打广告的嫌疑,那我用你将来平常的一天说说这个用语音互联起来的生活。

  未来的一天,早上六点整,智能音箱叫醒还在熟睡的你,你随口询问今天的天气情况,报告天气后,它顺便提醒你今天是冬至,别忘了吃饺子,你们简单的探讨了一下什么馅更好吃之后,让音箱在附近的饭店定了一盘水饺外卖,并备注让店家40分钟后送来,因为跑步是你每天要做的事。出了门你戴上配套的智能耳机,唤醒了助手,让他放几首平时爱听的歌。跑着跑着,看见几只小猫在公园里,忍不住去逗逗它们,竟忘记了时间,耳机提醒,还有5分钟外卖就要送到了,你开始往家跑,还是迟了,外卖小哥打来电话,用耳机直接接听后,叮嘱他放在门口。回到家,摘下耳机,洗漱过后,唤醒了音箱,让它播送最近的新闻,一边听,一边吃饺子,口令换了几个频道,没有什么感兴趣的,就关掉了。

  吃饱后,开车去上班,上车后唤醒了车载语音助手,让它给自己导航现在不堵的路线,毕竟是早高峰。刚要启动,突然想起家里的灯没关,就让助手赶紧把家里的灯关了,并让它检查了一遍还有什么没有关,确认无误后,安心上路。开了一会,车载助手提示你有人给你发微信,你让它把内容念一下,原来是在家读书的妹妹今天过生日,忙于工作的你竟然忘记了,就让助手选一只价格在200元左右的钢笔,选好颜色后,助手把图片发到了车载屏幕上,感觉不错,就口令支付购买了,然后让助手给妹妹发一条“给你准备了一个小礼物”的回复,算是有惊无险。

  到了单位,唤醒办公室的音箱,询问了一下你今天有几个任务要完成,怕自己偷懒,你让它给你为每一件事设定了完成的时间,到时提醒。其中有一件是你需要给其他的同时发邮件,你就直接一边想内容,一边说给助手,让他给同事发去了,省去了界面切换的繁琐步骤。正在埋头苦干,领导突然让下周去外地出差,于是急忙让助手订一张前一天的机票,同时订了一家机场旁边的酒店,简单选择好房型,价格后迅速预订,继续工作。中午吃饭回来,老板通过助手叫你们开会,你们一边听,一边交流,效率很高,会议室的助手已经把会议记录转写了文字,发到了邮箱里,不用担心错过或者忘记什么内容。

  下班回家,出了公司,戴上耳机,询问了下给妹妹买的钢笔发没发货,顺便让助手把家里的热水器打开,操作和等待变成了一句话。开车到了家,一个人的生活难免比较无聊,就习惯了叫助手陪着聊会天,他什么都知道,也会给你打开一些工作中的心结。聊着聊着,心情不错,让它看看冰箱里有什么菜,给你推荐了几个对应能做的菜谱,选了一个简单的,它一边念,你一边做,并贴心的放起了平时爱听的歌,别有惬意。睡觉之前,和它交代了一下明天的工作任务,就睡了,明天又是重新开始的一天。

  故事讲述起来是平淡无奇的,但是这平淡无奇的一面就是大多数人生活的样子,而语音在这种平淡无奇的生活中,才能发挥它的极大价值。(故事没有描述快递是无人车送达,吃饭的服务员都是自动化餐桌或者机器人服务员,楼道里的清洁人员已经是扫地机器人,公司或马路上配备的自动诊疗仪可以随时检查身体状况,我们主要说语音的应用)。

  通过故事可以看出,虽然只是一个普通的上班族,在使用语音设备为其服务时,都会包括但不限于上面提到的,物流,外卖,电商,记事,提醒,发信息,导航,读文本,家居,闲聊,听歌,接听电话,支付,新闻等等众多领域,我们总说互联网应用场景的丰富给了人工智能更多的发展空间,但正因为应用场景多了,要想满足人们生活里再平常不过的需求也变得不那么容易,一旦场景的丰富度不够,那么体验效果就会有所下降,如果硬件环境不能随着场景一起覆盖,不能完全发挥语音的便利性,所以语音的这条路还要有很多事情要完成。

  我们借用语音的意义就在于增加我们解决问题的效率,多样性和趣味性,不是刻意的使用语音,而是在随时想要快速完成一件事情时,只要自然地,习惯性地说一句话,就可以解决,而这需要机器将前期工作做到极致,也需要搭建起软硬件丰富的生态圈。

  1.如何将多种硬件(耳机,音箱,家电)互相之间建立联系,彼此控制,软件是互通的,并且实时在更新内容

  5.如何根据用户一段时间的生活习惯,主动为其推送消息,或者主动服务一些功能,以什么形式,什么时间点呈现?

  7.闲聊时候不能总是用兜底回复的方法,如何解决百科问题,专业问题,甚至情感上需求的问题,态度中立,理性分析,这可能不只是技术上的事

  8.由于场景的多样性,不能一直处于唤醒的状态,如何在没有唤醒的状态下也能提醒用户日期,日程,新消息等信息

  11.说出去的话,泼出去的水,语音这种即时性的使用方式,如何设计才能给用户以确认的时间。提示?还是重复?

  语音因为受众面是每一个普通人,所以对于产品的体验要比其他方向更看重,反倒对技术的精准性达到人们满意的程度就好,这样对交互设计师,产品经理的要求也就更高。

  带着上面这些问题,接下来我对现在AI各公司的应用,芯片,开放平台等布局进行总结以及分析,看看哪些问题已近解决,那些仍有很长一段路要走,哪些更侧重于技术,哪些更侧重于设计,这对于各公司找准定位,竞品,发展方向,找到解决问题的思路都有一定益处。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐