1. 首页
  2. 移动互联网

微软的预测系统:利用媒体报道预言未来事件

微软的预测系统能根据历史数据预测未来。

微软的预测系统能根据历史数据预测未来

  微软和以色列理工学院的研究人员已开发出一款软件,能根据过去20年《纽约时报》的文章以及其他在线数据预测传染病可能会于何时何地爆发。

  微软研究院杰出科学家及联合主管Eric
Horvitz表示,这一系统未来可能将帮助相关机构更积极地应对传染病爆发或其他社会问题。他表示:“这一系统能预测未来将发生的事。这样的工作将对人们遭遇的事情产生影响。”Horvitz与以色列理工学院博士研究员Kira
Radinsky合作进行了这项研究。

  在利用历史数据进行测试时,该系统的表现十分惊人。例如,根据2006年对安哥拉干旱的报道,该系统预测安哥拉很可能发生霍乱。这是由于,通过此前发生的多起事件,该系统了解到在干旱出现的几年后霍乱爆发的可能性将上升。此外,该系统根据对2007年初非洲大型飓风的报道,再次对安哥拉发生霍乱做出预警。而在不到一周之后,报道显示安哥拉确实发生了霍乱。

  在其他测试,例如对疾病、暴力事件及伤亡人数的预测中,该系统的准确率达到70%至90%。Horvitz表示,该系统的出色表现证明,进一步改进的版本完全可以用在实际环境中,帮助政府救援机构更好地准备救援活动。

  该系统的信息来自过去22年中《纽约时报》的报道存档,具体时间为1986年至2007年。不过,该系统也利用了网络上的其他一些数据,了解什么样的事件会带来特定的社会问题。

  Radinsky表示:“DBpedia是一个有用的信息来源,这是一个采用众包模式,将维基百科信息结构化的服务。凭借该服务,我们可以了解或查看新闻事件发生的地点,当地人的收入,甚至是关于政策的信息。”其他的信息来源还包括帮助软件理解语义的WordNet,以及常识数据库OpenCyc。

  这些信息来源提供了不存在于新闻文章,但却有价值的内容,有助于确定不同事件之间的因果关系或前后关系。例如,该系统能够推断卢旺达和安哥拉城市之间所发生事件的关系,因为这两个国家都位于非洲,有着类似的GDP,其他一些因素也很相似。根据这种方法,该系统认为,在预测霍乱爆发方面,应当考虑国家或城市的位置,国土面积有多少是水域,人口密度和GDP是多少,以及近几年是否发生过干旱。

  Horvitz和Radinsky并不是最先思考利用网络新闻和其他数据来预测未来事件的人,不过他们使用了超过90个数据来源,这使得他们的系统更适用于一般目的。

  此类预测工具的市场正在形成。例如,一家名为Recorded
Future的创业公司根据网上的前瞻性报道和其他信息来源预测未来事件,该公司的客户包括政府情报部门。该公司CEO Christopher
Ahlberg表示,利用“硬数据”来进行预测是可行的,但从原型系统到商用产品还有很长的路要走。

  微软目前还没有计划将Horvitz和Radinsky的研究结果商用。不过Horvitz表示,这项研究仍将继续。他希望将信息来源扩大至更多报纸,甚至是电子书。

  Horvitz表示,近几十年来,世界的许多方面都发生了改变,不过人类的本性和环境的许多方面仍然未变,因此软件可以从以往的数据中了解事情发生的模式,从而预测未来会发生什么。他表示:“对于回溯更久之前的数据,我个人很感兴趣。”

发表评论

登录后才能评论