大数据与美国波士顿爆炸案的侦破

作者:szlvyouanquan|时间:2019/4/11 9:13:26|浏览次数:183

大数据与美国波士顿爆炸案的侦破

  2013年4月,不太平的世界使得奇怪的气候变得不值一提,当地时间4月15日下午2点49分,波士顿马拉松赛的爆炸案不仅造成了3人死亡(其中有一名中国,150人受伤的惨案,更重要的,它是 911事件后美国人好不容易花了十余年修复的脆弱心理又打到了谷底。如何破案,特别是如何快速破案是摆在波士顿警察局以及美国联邦调查局(FBI)面前的巨大挑战。

  事实上,波士顿警察局顶住了巨大的压力,在3天后的4月18日,公布了嫌犯焦哈尔?萨纳耶夫的名字,并发布了他的相片,19日凌晨发现嫌犯在水镇(Watertown),并包围了水镇,19日上午10点公布了嫌犯的车牌号,晚上8:45在一艘小船里将嫌犯捕获,一个全球关注的事件得以安全告一段落。

  当然在这个事件的整个过程中,我最关注的事情还是和大数据有关:crowdsourcing,中文翻译为,“众包”,这个词来自2006年Wired杂志的一篇着名文章,意思是和outsourcing(外包:把任务分包给第三方来完成)相似,只是众包:1,分包对象更广,2,几乎完全(只能)通过互联网连接,3,几乎无法预估任务完成的时间与质量(因为无法预估有多少人接受分包)。

  在波士顿爆炸案的破案过程中,FBI使用了众包的手段:

  保留Copley广场附近的所有监控录像以供比对、查找,波士顿警察局的官员称“将仔细查看所有录像的每一帧画面”

  走访事发地点附近12个街区的居民,收集可能存在的各种私人录像,照片,无论他们来自摄像机还是私人的手机,右边的相片就来自于当天参赛的马拉松选手Jennifer Treacy的随身录像机,清晰地显示了爆炸地点

大数据与美国波士顿爆炸案的侦破

  大量收集网上信息,包括像Twitter,Facebook,Vine,Youtube等社交媒体上出现的相

  关相片、录像等

  向公众提出了收集相关信息的请求

  这样一个似乎非常公开的案件的侦察及侦破工作使用了各种高科技的手段,充满了大数据的味道,无形中符合了大家对大数据理解中着名的4V原则:

  Volume(数据量):来自各方的数据量是非常大的

  Variety(数据种类):各种数据源,特别是来自各种社交媒体上的图像、影像类的非结构化数据非常丰富

  Velocity(速度):在事件发生数分钟之内,已经有大量信息发布在各种社交媒体上。另外对这样高曝光度的社会事件的侦破,速度本身就是最重要的

  Value(价值):这个价值可能远远不同于我们相对熟悉的企业应用,这是必须解决的问题,其社会价值是无法简单估量的。

  当然,这样的众包也带来了高科技的挑战,如何处理从各个数据源收集来的信息,包括对信息的真伪进行鉴定,对同一地点不同距离、不同视角、不同清晰度、不同时间的有用信息的综合利用是从未完成过的挑战。现实地说,在这个领域中,电脑似乎还远远不能代替人脑,但是一个可能的中间目标是:电脑帮助筛选从众包获取的巨大信息,以供专业的分析师做进一步的人工分析。这一技术可以称为“图像数据挖掘”或“可视化数据挖掘”,在国家安全,社会安全等领域具有无限的想象空间和发展前景。

在这个领域中,在美国旧金山的一家创业公司CrowdOptic走在了前面,

大数据与美国波士顿爆炸案的侦破

  他们利用众包信息中来自智能手机、平板电脑甚至实景眼镜的大量地理位置信息,以及相机的方向来综合分析物体/事物的准确信息,可以提供丰富的能力,包括数码信息的整合、增强现实(Augmented Reality)和分析,焦点感知的营销等等。(注:CrowdOptic公司并未在波士顿爆炸案中直接参与)

当然,回到波士顿爆炸案的侦破上,最终的效果还是非常不错的,FBI基于高科技的信息,特别是利用红外线摄影拍到的热敏相片,准确定位了嫌犯的位置,并且迅速包围,并捕获了嫌犯焦哈尔?萨纳耶夫,一桩轰动全世界的爆炸案得以侦破,人们能够因此回到平日的宁静。

大数据与美国波士顿爆炸案的侦破


lyanquan.com???苏州市旅游局 苏ICP备16047532号-1