世界先进制造技术论坛AMT—领先的高科技先进制造产业服务平台

发表于 2016-6-16 08:46:44 | 显示全部楼层 |阅读模式
  



2016053042.flvbig.jpg
  
  日本绝密实验室曝光:机器人与人类一样行走工作


ico_video.png
  
  苹果为什么现在才开放Siri的语音搜索API?
  1、开放给开发者需谨慎
  Siri Kit开放了Siri的语音搜索API,机制跟Google Android Voice类似,后者都已经上线两年并早已支持十几种领域,远超Siri Kit现在发布的7个领域。而国内的出门问问,因有Ticwear智能手表操作系统作为入口,早在去年年初就开发了类似的语义API,滴滴、支付宝、阿里小智智能家居等第三方厂商早已通过这种形式落地其手表操作系统。
  在语音搜索API上,一般公司的做法都是极其谨慎的。不同于以科大讯飞为代表的"应用内"语音、语义API,苹果、Google、出门问问这些API属于"入口级"语音搜索API,即语音搜索是系统发起的而非在应用内发起,系统识别语音意图并分发给第三方应用。
  一般这类"入口级"语音搜索API,会非常谨慎地先做好领域分类(Domain Classification),然后根据分出来的领域导流给不同的应用。所以,领域和领域内意图,一般要由系统事先定义好、并且优化好语音、语义识别模型之后,才开放给第三方开发者使用。
  2、现有语音识别API存在哪些技术瓶颈?
  由于众所周知的技术难度,现有的语音识别API还存在以下技术瓶颈:
  首先,语音识别方面,训练一个可靠的语音识别需要领域内的大量语言模型。
  例如如果不将北京地名词典这样的领域知识输入进语音识别引擎,语音识别根本无法正确输出类似于"簋(gui)街"这样的不常见词语。
  其次,由于是"入口级"语音搜索,还要处理好不同领域之间的歧义。
  例如"发微信给小苹果让她帮我打电话订一辆出租车",这句话对人类来说是再简单不过了,但是对于现有的语义识别系统来说都是极具挑战性的:这到底是要发短信呢?还是打电话?还是叫车?怎么还提到了歌曲"小苹果"啊!
  3、发布会上没有提到的特色
  不过,笔者也从官方文档中惊喜地发现一个未在发布会上提及的特色。不同于Google Voice Action,Siri Kit发布第一版就允许开发者在一定程度上自定义语音命令。Siri Kit允许开发者通过配置文件的方式自定义某一些词的读音、上下文例句、甚至语义含义,当然,这些必须限定在这7大领域22个意图框架内。
  如下面图中例子所示:


2016061509.jpg
  图中展示了一个名为"Cardio Bonaza"的健身应用,其应用支持一个名为"Cardio Craze"的健身项目,用户可以通过Siri直接启动Cardio Bonaza应用并开始Cardio Craze健身项目上图的配置文件通过以下几方面帮助Siri识别有有关命令:
  定义Cardio Craze是开始健身(IN Start Workout Intent)这个意图下面的workout Name这个属性(注意,这个意图以及意图的指令都是包含在Siri Kit那7大领域和22意图内的)。这样一但识别出来,Siri会把Cardio Crazes识别成workout Name属性传给Cardio Bonazay应用
  定义Cardio Craze的发音以及可能出现的上下文,这有助于帮助Siri更准确的语音识别这些不常用词
  通过定义Intent Phrase的一些例句,甚至可以影响Siri入口的领域分类(Domain Classification)
  苹果一向谨小慎微,这次Siri Kit仅仅开放了7个领域,应该是经过充分的用户调研和模型调优。但实际使用中是否能够胜任复杂的用户自然语言,还需要等到真正发布之后好好体验。不过,Siri Kit确实做了充分的准备,准备和开发者一起保证良好的语音交互体验。
  
  什么是用户真正需要的语音搜索?
  除此之外,苹果今天还发布了Mac OS版本的Siri,可以在Mac上通过Siri去完成手机上的一些基本功能。比如听歌、查天气,以及一些为Mac笔记本开发的语音命令,比如查找某个文件、或者看看电脑还有多少剩余空间。
  连同Siri Kit,这应该是Siri自从2012年发布以来最大的一次更新。
  但我认为,这次更新仍然乏善可陈。竞争对手Google本身拥有强大的AI研发能力和长期以来的技术积累,Siri Kit做的这些事情从技术上来讲都只是一直在追赶Google而已。
  要做到如同Google Now一样的智能,比如百科类问题的问答、智能推送,苹果还有很长的一段路要走。当然当前,不管是哪家的语音识别技术,从能力上来讲并没有质的区别,人工智能语音搜索仍然是一个新鲜玩意,他的能力远低于人们的预期。在短期人工智能技术难以进行质的突破的情况下,像苹果这样谨小慎微地一步步往前走,慢慢地加入新的功能,让更多的开发者加入这场游戏,总体来说也是推动了整个行业的发展。今天凌晨发布的时候,苹果宣布Siri Kit已经得到众多主流App的支持,包括微信、支付宝、滴滴、Whats app、Skype等,这也许正是苹果作为一个后来者的优势。
  这让我想起了4年前第一次发布Siri的时候,无声无息地发布,在沉寂了十几年的人工智能圈,确确实实地掀起了一阵浪潮。
   2016061510.jpg
  
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies

本版积分规则

主题 682 | 回复: 699

QQ|联系我们|法律声明|用户协议|AMT咨询|商务合作|会员入驻|积分充值|积分商城|积分奖励规则|TradEx全球购|加入QQ技术群|添加企业微信|加入微信技术群|文章投稿| 世界先进制造技术论坛™(简称AMT™, 制造知网™) ( 沪ICP备12020441号-3 )

GMT+8, 2025-1-7 10:26 , Processed in 0.315160 second(s), 35 queries , Redis On.

论坛声明: 世界先进制造技术论坛(制造知网) 属纯技术性非赢利性论坛,请勿发布非法言论、非法广告等信息,多谢合作。
本论坛言论纯属发表者个人意见且会员单独承担发表内容的法律责任,与本论坛立场无关;会员参与本论坛讨论必须遵守中华人民共和国法律法规,凡涉及政治言论、色情、毒品、违法枪支销售等信息一律删除,并将积极配合和协助有关执法机关的调查,请所有会员注意!
本论坛资源由会员在本论坛发布,版权属于原作者;论坛所有资源为会员个人学习使用,请勿涉及商业用途并请在下载后24小时删除;如有侵犯原作者的版权和知识产权,请来信告知,我们将立即做出处理和回复,谢谢合作!

合作联系: 双日QQ客服:3419347041    单日QQ客服:3500763653    电话021-37709287    合作问题投诉:QQ:2969954637    邮箱:info@amtbbs.org    微信公众号:AMTBBS

 

快速回复 返回顶部 返回列表