1月30日消息,据外媒CNBC报道,IBM发布了一个包含100万张人脸图像的数据合集,用于训练面部识别系统,从而提升识别的公平性和准确性。
据理解,这一数据合集是来源于雅虎的超大Flickr数据集,这一数据集共包含1亿张图片和视频,并且图片中标注了特征标签,例如颅面测量,面部对称,年龄和性别等。这将非常有助于开发者们解决此前发现的问题,即识别软件会基于目标的年龄、性别、种族等反馈出不同的准确性表现,这属于技术偏见。
IBM的研究员兼首席科学家约翰史密斯表示,“面部识别技术应该是公平和准确的”,“我们需要通过各种培训数据来让技术进步”。
值得一提的是,去年,麻省理工学院研究员Joy Buolamwini发表一篇论文,论文显示,IBM Watson的视觉识别平台在识别深肤色女性时,错误率为35%,而识别浅肤色男性时,错误率补刀1%,相差甚多。