26岁的王小强刚做爸爸,还沉浸在初为人父的喜悦中,怎么看怎么喜欢,拿着手机噼里啪啦一顿乱拍,亲亲脚亲亲手。但是,当婴儿开始哭闹不休时他就彻底没辙了,到底是饿了、尿湿了还是哪里不舒服…… 正常婴儿在2周大时,每天约哭闹1.5小时;出生后第6周,则平均每天达2.5小时;到3个月时,正常婴儿哭闹的时间减少到每天1小时。婴儿每天都在哭泣,如何懂得婴语无疑是对新生父母的一大考验。 美国的Ariana Anderson博士也是如此,她是4个孩子的母亲,抚养前2个孩子时,她常常搞不懂孩子大哭的原因,直到抚养第3个孩子时才能轻松辨认孩子哭声背后的意义,基于这种经历,她研发了一款用算法理解婴儿哭声的婴语翻译APP——Chatterbaby。 婴语难理解 AI当自强 婴儿哭闹的原因很复杂,一般分为生理性哭闹和病理性哭闹。生理性哭闹常见的原因有饥饿、排尿、排便、疲倦困乏、生活规律紊乱、衣着不适、出牙,要求或欲望未得到满足;病理性哭闹常见的原因有如维生素 D 缺乏性佝偻病、感染性疾病、腹痛、猫叫综合征、维生素A、D中毒及新生儿甲状腺功能亢进症、头痛。 区分生理性哭闹和病理性哭闹是儿科医师经常遇到的难题,这也从侧面解释新生父母要正确理解婴儿哭声有多难。 美国、日本、台湾都有团队对婴儿哭声做过相关研究,各团队都声明可覆盖95%以上的宝宝哭啼原因、准确度比人提高3倍等,但是至今并没有看到具体的产品,起码在内地没有。Chatterbaby通过收集婴儿在不同感受下的哭声,并通过机器学习对这些哭声频率和特征进行分析学习,从而告知父母,他们的孩子为什么而哭。现阶段,这个APP可以分辨孩子的哭泣是因为饥饿、烦躁还是疼痛。 图片来自智东西 布朗大学风险儿童研究中心的心理学家StephenSheinkopf认为,婴儿的哭声中确实隐藏着许多神经学线索,尤其是在哭声的声调、声量、共鸣等声学特征中,这些特征能被量化和可视化。但是仅仅通过声音对婴儿进行检测显然远远不购,将声音、行为、其他生理数据整合进一个模型,无疑会比通过单一声音特征检测准确得多。 今年3月31日,阿里云发布了一款婴语贴纸,据说产品经理是月嫂。这款贴纸无毒无味,形状近似便利贴只需要轻贴在婴儿任何部位即可运行,对于0-1岁的宝宝识别准确率达到了95%。能够轻易识别多种婴儿30多种行为如:饥饿,疲倦,害怕,开心,撒娇等行为。 这款产品依托阿里云物联网IOT套件,AI智能语音分析,生物识别反馈系统,情绪建模等等,通过APP实时对宝宝的哭声进行分析与反馈。贴纸不仅可以检测婴儿的哭声的分贝与尖锐程度,对心率或体温等也能进行检测。 听上去,这些依托人工智能的婴语翻译机似乎给奶爸奶妈们带来了的福音。对经验少的父母而言,婴语翻译机在早期无疑会派上用场。但随着宝宝逐渐适应周围环境,婴语翻译机的准确率会下降,除此至外,依然有一些不得不面对的问题。 路漫漫其修远兮 婴语与AI相互求索 AI现阶段的发展依然还是处于婴幼儿阶段,那么AI服务于婴儿这一问题上到底还有哪些考量呢? 1.技术未满,能用而已 某种程度上来说,识别婴儿的生理性哭闹可能较为容易,但是识别病理性哭闹可能就不那么简单了。毕竟,将哭闹不休的小孩带去儿科,医生也要通过各种检测才敢下定论,仅仅通过测体温量心率并不能作为唯二的依据。 而且,一旦“婴语“翻译机将病理性哭闹误诊为生理性哭闹,会耽误最佳的治疗时间,其后果不言而喻。 这并不是类似于普通消费升级的产品,可以通过不断迭代来优化产品性能。这是一项容错率非常小的技术,一旦出错可能就是一个悲剧。 需要技术的高度成熟,否则就显得尤为鸡肋。 2.先看手机还是先看孩子,这是一个问题 有专家(砖家?)认为,手机在发射微波的同时也存在“极低频磁场”,由于婴儿的头骨较簿且不完整,脑部发展不完善,如果婴儿接触太多手机,会对身体造成影响,可能引致癌症、神经及发展障碍等。且不论这种说法是否有骇人听闻的嫌疑,但是绝大分父母都不愿意冒这样一个风险,因而他们会将手机放在远离婴儿的位置,一旦婴儿哭泣,父母该怎么办? 是先去抱小孩还是先看手机? 这一行为很微妙。如果是两代人同时照看,先看手机无疑会引起家庭纠纷。一般人的反应是孩子哭立马去抱小孩哄他,然后去抱着他看手机看他怎么了,再然后注意力又被分散,这显然不是这一特殊场景下理想的交互方式。 那么,通过声音辨别疾病就只能这样了吗? 它可能不适合确诊某些婴儿的病理性哭闹,但是通过声音识别疾病,甚至适用于成人预防一些难以治愈或不易发现的疾病。 现有研究结果表明,声音变低哑可能是胃酸反流,当患了慢性鼻窦炎,则会出现鼻塞一样的声音。声音变得低沉很可能是甲状腺疾病。而声音变得没有起伏,很可能是患了帕金森症。 事实上,美国麻省理工学院的马克斯·李特博士近年来就在研究这一课题——利用声音诊断帕金森病。现有医学研究表明,人类患帕金森病是因为大脑的中脑部位的一群神经细胞发生了变性死亡,这种细胞死亡会带来的症状是肢体颤抖,除此之外,没有更多新的进展,至于如何治愈更是无从说起。 相比于动辄扎针化验的检测方法,这种方法极大的减少了对人身体的接触,他通过大量数据分析,建立起一套声音分析系统,只要留下30秒左右的录音,他就能让电脑自己判断患病与否,实验室阶段准确率高达99%。 这项技术最终可以帮助他客观地掌握症状的进展情况,从而可以更有效地控制用药量,甚至是准确搞定吃药时间。 实际上,Chatterbaby的另外一大目的就是通过哭声来诊断不同类型的自闭症。医学界和教育界都认为,自闭症越早发现越好,如果在早期对这些孩子的特殊需求进行满足与鼓励,就会增加他们最终成长为正常人的机率。可惜的是,患上自闭症谱系障碍的孩子却往往在多年后才会被确诊。 根据权威数据表明我国已确诊自闭症患病人数约在1000万以上,而0-14岁的儿童患者已经超过200万,并以每年20万+的速度在增长。如果能通过一项简单的指标就能对孩子的发展做出预测,给父母敲个警钟,这无疑是一项值得推广的技术。 总结 事实上以现阶段AI 发展阶段,显然不能搞定所有的问题,只要能搞定一部分,提升解决我们的效率,就可以发挥其应用价值,毕竟这项技术对于大多数像王小强这样的年轻父母来说,不失为一种安慰剂。 文|雷宇
|