近日,亚马逊人工智能招聘软件因收到大多简历来自男性,而做出了对男性候选人的偏好选择,据说它曾接受了十年的人工智能算法的数据训练。 据路透社报道,亚马逊于2014年开始开发自动化系统,为求职者提供一到五颗星。但去年,该公司在看到它已经开始偏爱技术角色的男性候选人之后取消了该项目。 因为AI工具接受了公司收到的10年简历的培训。由于科技是男性主导的行业,大多数简历来自男性。导致该系统无意间接受了选择男性候选人而不是女性候选人的培训。据报道,它将对包含“妇女”一词或某些全女子学院名称的简历进行处罚。尽管亚马逊做出了改变以使这些术语保持中立,但该公司仍然失去了对该计划在所有其他领域确实性别中立的信心。 什么是数据训练? 这里可以拿两件事作为案例,一个是“飞猪大数据杀熟”事件,另一个是淘宝的“用户画像标签”。 近日,作家王小山在微博发问表示,在飞猪购买机票时遇到“杀熟”问题。飞猪上售卖的机票价格高于其他订票平台,且订票价格远高于查票时显示的价格,对此,飞猪回应称,“绝无此事”。双方各执一词。苍蝇不叮无缝的鸡蛋,对于OTA行业而言,杀熟,价格陷阱成了所有玩家的习惯性套路,类似的事件也不止一起: 就在去年的国庆假期后,演员韩雪在微博怒斥“携程旅行网”捆绑销售,多次反馈未得到妥善处理。 去年清明节,据用户爆料,在携程上面,iPhone8 plus手机预定酒店的价格要高于安卓机华为mate 8,随即引起广泛热议。 当然大数据的使用也不只是反面例子,利用“大数据”当然也不止这一个行业,如果大数据引导消费者,被更好地利用为用户创造价值,对于双方都是一件利好的事,比如电商淘宝在建立“用户画像标签”煞费苦心,根据检测用户对不同活动与产品的敏感度来判断用户的喜好,在建立起“淘气值”会员衡量标准体系后,将其作为用户最重要的用户画像标签,每个用户都只有一个数值。通过这个数值,阿里可以直接进行用户分层,实现精细化运营。不同淘气值,不同服务。 亚马逊和以上两则都是关于“大数据”使用的结果,可能最大的差距就是一个被动一个是主动的。 大数据与人工智能 大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,真正产生价值。随着大数据的发展,其应用已经渗透到农业、工业、商业、服务业、医疗领域等各个方面,成为影响产业发展的一个重要因素。 当前人们所说的人工智能,是指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术以及应用系统的一门新的技术科学,是由人工制造出来的系统所表现出来的智能。 在“深度学习”被提出后,其通过深层神经网络算法来模拟人的大脑学习过程,通过输入与输出的非线性关系将低层特征组合成更高层的抽象表示,最终达到掌握运用的水平。 数据量的丰富程度决定了是否有充足数据对神经网络进行训练,进而使人工智能系统经过深度学习训练后达到强人工智能水平。因此,能否有足够多的数据对人工神经网络进行深度训练,提升算法有效性是人工智能能否达到类人或超人水平的决定因素之一。 随着移动互联网的爆发,数据量呈现出指数级的增长,大数据的积累为人工智能提供了基础支撑。同时受益于计算机技术在数据采集、存储、计算等环节的突破,人工智能已从简单的算法+数据库发展演化到了机器学习+深度理解的状态。 针对最开始的“人工智能偏见”事件,我们不能将人工智能视为内在的无偏见。在有偏见的数据上训练系统意味着算法也会变得有偏见。如果这样的不公平的人工智能招聘计划在实施之前没有被发现,它们将使商业中长期存在的多样性问题长期存在而不是解决它们。
|