恢恢“天网”,效率杀人,冤魂知多少?

“你觉得政府情报部门使用的人工智能工具最可能干些什么?”

“嗯……杀人?”

美国知名科技博客媒体Ars Technica报道称,由于美国国家安全局所使用的“天网(Skynet)”计划因其算法的瑕疵,可能已导致数千名无辜的巴基斯坦人因被视为恐怖分子,甚至因此遭误杀。

什么是“天网”?

这个“天网”并非《终结者》中那个派出终结者进行时空穿越,企图消灭人类叛军首领约翰的人工智能。而是,美国国家安全局用来甄别恐怖分子的大数据系统。

据“棱镜门”揭秘者斯诺登披露,“天网”计划始于2007年。该系统通过对地理空间、地理时间、生活模式以及旅行分析对大规模的DNR(拨叫号码识别)数据进行分析,以识别出可疑活动,从而实现对恐怖分子的识别和跟踪。

从一份名为《Skynet Courier Detction via Machine Learning》的泄密材料中看,“天网”利用的是随机森林算法。

什么是“随机森林”算法?

顾名思义,“随机森林”就是利用随机的方式建立一片森林,森林里面有许多的决策树。而每一颗随机决策树之间并没有关联。当一个样本进入森林的时候,就让每一棵决策树分别进行一下判断,看看样本应该属于哪一类,然后看看哪一类被选择最多,就预测这个样本为那一类。

打个不恰当的比方就是,每棵决策树就是体检时每一个科室的医生,有的精通内科,有的精通眼科。当你进入体检中心,每一个科室的医生都会对你的身体某一部分进行诊断。而综合每个科室的结果,就能对你身体状况有了一个全面的认识,最后得出你是“非常健康”,还是“需要进一步检查”,亦或者“需要立即治疗”这样的身体综合判断结果。避免出现,因为只检查了牙科,而不知道患有肠胃炎的情况。

当然“随机森林”算法,除了分类,还可以进行回归。火箭君在这里就不继续展开了。

“天网”都干了些什么?

理论上说,这样一个系统看起来非常牛逼。但是Ars Technica的报告称,天网计划的判断能力距离“万无一失”非常遥远。在揭秘的文档中,可以看到该计划的错误率是0.008%,但是如果乘上5500万被监控的人口,那么大约4400个巴基斯坦人会被错误的标记成恐怖分子。

最为逗逼的是,半岛电视台记者艾哈迈德·穆法克·扎伊丹(Ahmad Muaffaq Zaidan)被该系统列为重要的恐怖分子。这哥们是半岛电视台驻伊斯兰堡分社主任,曾经采访过基地组织、塔利班组织的多数要员,因此掌握了大量恐怖组织的重要信息。由于时常与恐怖组织打交道,艾哈迈德的行动方式比较类似恐怖分子,于是乎他被“天网”计划列为恐怖分子。当然,他是肯定不会承认的。

我们认为

火箭君认为,如同“天网”计划一样,任何的工具都存在一定的误差。但当这样的误差和生命关联在一起的时候,我们是不是应该投入更多的资源来减少或者避免这样的误差呢?

在不断追求高效率低成本的当下,我们是不是该时不时地去审视一下自己所创造和在使用的这些个所谓的“工具”,它们真的有带给我们所希望的结果吗? 这个问题,就留给每位小伙伴自己去思考吧!