证券时报官方微信公众号

扫描上方二维码关注微信公众号

证券时报官方新闻客户端

扫描上方二维码下载客户端

您所在的位置:首页 > 专栏 > 刘远举

财经作家,FT中文网等媒体开设有专栏。

语音会是下一个家庭互联网入口吗?2019-11-29 15:34作者:刘远举

当下互联网的入口,如果从交互方式来区分,主要是键盘+鼠标以及触摸两种方式。键盘+鼠标是最古老的方式,触摸从智能手机时代开始,越来越重要,成为所有移动设备的标准交互方式。随着技术的发展,语音也开始崭露头角。

触摸在手机上的大获成功,让很多人想进一步的用手机、安卓去取代PC。2018年7月,锤子公司发布了“TNT工作站”。在罗永浩眼里,TNT运用“全局手势+语音组合输入”实现了新的交互方式,简化了传统办公软件在语音交互,实现制表、计算等方面的繁琐操作,带来了效率提升。但现实却是残酷的,有着自己的客观规律,TNT彻底的失败了。实际上,在TNT之前,华为、三星DeX也推出过基于安卓的桌面办公系统,但都未成功。

归根到底,这与灵长类的结构有关。灵长类动物存在一种名为“大猩猩臂效应”的身体结构局限——人们根本无法在手臂往外展开的姿势下长时间操作。不妨切身体会一下,把手一直平举着,试试能坚持多久,是否能精确的定位?所以,用双臂进行触摸式操作,并不适合长时间的、精确的定位。

鼠标运动,是手放在桌面上,手腕运动,再加上五个手指,一共6轴才能精确的控制屏幕上的鼠标。这种定位优势,是鼠标系统作为生产力工具、创造性工具的优势所在。所以,在需要高精度操控的创造力场景下,PC+鼠标仍然会是主流。

但是,虽然语音与触控,并不适合用于高度创造力的场景,但在其他场景中,却是一种天然的交互方式。

手指触摸,是人类与世界的天然交互方式。米开朗基罗的名画《创世纪》中,上帝将手指伸向亚当,通过指尖的接触将灵性传递给亚当。2、3岁的幼儿,不会用鼠标,不识字,但平板电脑出现之后,却能够用手指在平板电脑上玩游戏。值得一提的是,小孩子更喜欢苹果的IPAD,小孩并没有品牌意识,更喜欢苹果,是因为苹果有更好的触控、交互界面,反过来,这样反映了人类对交互效率的天然敏感。

语音是人类的另一个天然交互方式,这不必赘述,所以,在某些场景下,用语音代替敲击,是顺理成章的。比如电影《Her》,作家西奥多就爱上了一个叫“萨曼莎”的人工智能女声,这个女声(不是女生)不仅有着一个略微沙哑的性感嗓音,并且风趣幽默、善解人意,让孤独的男主深陷其中。

科幻小说并不能作为判断未来的依据,但随着技术的发展,语音成为下一个入口的前提条件也在逐步成熟之中。人工智能的发展,使得语义理解成为可能,声纹识别的成熟,使得凭借语音,人工智能就能鉴别身份,安全高效的支付也成为可能。还有一个被人忽略的前提就是:需求,以及支撑这个需求的生态。

苹果的siri、微软的Cortana,还是亚马逊的Echo和谷歌的音箱,都是朝人工智能入口的方向在走,但在与合作伙伴共创价值这一点上,都有所欠缺,难以反哺技术发展,打造生态。在这一点上,中国不但不落后,反而领先于美国。

作为阿里LoT(物联网)和家庭战略的“棋眼”,天猫精灵就是一个典型例子。今天双十一天猫精灵推出一种新的电商模式“语音购物”。依靠强大的生态,超500万人体验了这种“说话下单”的新方式,最终有105万笔订单交易成功。通过语音购物,总共销售了140万吨大米、81万个鸡蛋、76吨洗衣液。今年双十一也成为语音购物元年。

此外,今年双十一,天猫精灵还定制发布了50余款智能产品,更是通过IoT生态的开放合作,助力家电企业实现增长破局。截至目前,天猫精灵可连接的设备总数达到2.35亿,覆盖20多个行业、60多个消费品类,合作品牌近千家。可以说,围绕天猫精灵,在客厅之中,购买商品,控制家居的客厅语音互联网生态已经开始运作起来了。

某种程度上,语音一直在人类的消费行为决策中,占很大比例。以向朋友推荐餐馆为例,这个过程涉及情感、价格、路程、食材、味道等等,很多时候,都是对话中进行。如果用人工智能来完成这个过程,在很多场景下,比如地铁、客厅,最佳的呈现方式,就是智能语音。

当然,应该看到的是,上述情景,还比较科幻,现在的天猫精灵语音购物,还集中于没有淘宝账户的老人与小孩,相当于家中的成年人把自己的账户开放给家中的老人与孩子,通过免密支付完成,商品也集中于有较高复购需求的“柴米油盐酱醋茶”,以弥补目前语音购物功能上的缺陷。但是,对于新技术的发展而言,技术与相关产业结合,在真实场景中落地,打造新的商业模式,价值就会迅速显现出来。而获得价值,就能反哺技术发展,进入一个良性循环。在这个循环之下,技术自会飞速发展,让城市更美好,让未来更美好。

语音会是下一个家庭互联网入口吗?2019-11-29 15:34作者:刘远举
刘远举 财经作家,FT中文网等媒体开设有专栏。

当下互联网的入口,如果从交互方式来区分,主要是键盘+鼠标以及触摸两种方式。键盘+鼠标是最古老的方式,触摸从智能手机时代开始,越来越重要,成为所有移动设备的标准交互方式。随着技术的发展,语音也开始崭露头角。

触摸在手机上的大获成功,让很多人想进一步的用手机、安卓去取代PC。2018年7月,锤子公司发布了“TNT工作站”。在罗永浩眼里,TNT运用“全局手势+语音组合输入”实现了新的交互方式,简化了传统办公软件在语音交互,实现制表、计算等方面的繁琐操作,带来了效率提升。但现实却是残酷的,有着自己的客观规律,TNT彻底的失败了。实际上,在TNT之前,华为、三星DeX也推出过基于安卓的桌面办公系统,但都未成功。

归根到底,这与灵长类的结构有关。灵长类动物存在一种名为“大猩猩臂效应”的身体结构局限——人们根本无法在手臂往外展开的姿势下长时间操作。不妨切身体会一下,把手一直平举着,试试能坚持多久,是否能精确的定位?所以,用双臂进行触摸式操作,并不适合长时间的、精确的定位。

鼠标运动,是手放在桌面上,手腕运动,再加上五个手指,一共6轴才能精确的控制屏幕上的鼠标。这种定位优势,是鼠标系统作为生产力工具、创造性工具的优势所在。所以,在需要高精度操控的创造力场景下,PC+鼠标仍然会是主流。

但是,虽然语音与触控,并不适合用于高度创造力的场景,但在其他场景中,却是一种天然的交互方式。

手指触摸,是人类与世界的天然交互方式。米开朗基罗的名画《创世纪》中,上帝将手指伸向亚当,通过指尖的接触将灵性传递给亚当。2、3岁的幼儿,不会用鼠标,不识字,但平板电脑出现之后,却能够用手指在平板电脑上玩游戏。值得一提的是,小孩子更喜欢苹果的IPAD,小孩并没有品牌意识,更喜欢苹果,是因为苹果有更好的触控、交互界面,反过来,这样反映了人类对交互效率的天然敏感。

语音是人类的另一个天然交互方式,这不必赘述,所以,在某些场景下,用语音代替敲击,是顺理成章的。比如电影《Her》,作家西奥多就爱上了一个叫“萨曼莎”的人工智能女声,这个女声(不是女生)不仅有着一个略微沙哑的性感嗓音,并且风趣幽默、善解人意,让孤独的男主深陷其中。

科幻小说并不能作为判断未来的依据,但随着技术的发展,语音成为下一个入口的前提条件也在逐步成熟之中。人工智能的发展,使得语义理解成为可能,声纹识别的成熟,使得凭借语音,人工智能就能鉴别身份,安全高效的支付也成为可能。还有一个被人忽略的前提就是:需求,以及支撑这个需求的生态。

苹果的siri、微软的Cortana,还是亚马逊的Echo和谷歌的音箱,都是朝人工智能入口的方向在走,但在与合作伙伴共创价值这一点上,都有所欠缺,难以反哺技术发展,打造生态。在这一点上,中国不但不落后,反而领先于美国。

作为阿里LoT(物联网)和家庭战略的“棋眼”,天猫精灵就是一个典型例子。今天双十一天猫精灵推出一种新的电商模式“语音购物”。依靠强大的生态,超500万人体验了这种“说话下单”的新方式,最终有105万笔订单交易成功。通过语音购物,总共销售了140万吨大米、81万个鸡蛋、76吨洗衣液。今年双十一也成为语音购物元年。

此外,今年双十一,天猫精灵还定制发布了50余款智能产品,更是通过IoT生态的开放合作,助力家电企业实现增长破局。截至目前,天猫精灵可连接的设备总数达到2.35亿,覆盖20多个行业、60多个消费品类,合作品牌近千家。可以说,围绕天猫精灵,在客厅之中,购买商品,控制家居的客厅语音互联网生态已经开始运作起来了。

某种程度上,语音一直在人类的消费行为决策中,占很大比例。以向朋友推荐餐馆为例,这个过程涉及情感、价格、路程、食材、味道等等,很多时候,都是对话中进行。如果用人工智能来完成这个过程,在很多场景下,比如地铁、客厅,最佳的呈现方式,就是智能语音。

当然,应该看到的是,上述情景,还比较科幻,现在的天猫精灵语音购物,还集中于没有淘宝账户的老人与小孩,相当于家中的成年人把自己的账户开放给家中的老人与孩子,通过免密支付完成,商品也集中于有较高复购需求的“柴米油盐酱醋茶”,以弥补目前语音购物功能上的缺陷。但是,对于新技术的发展而言,技术与相关产业结合,在真实场景中落地,打造新的商业模式,价值就会迅速显现出来。而获得价值,就能反哺技术发展,进入一个良性循环。在这个循环之下,技术自会飞速发展,让城市更美好,让未来更美好。

  • 证券时报APP
  • 微信公众号