关于这方面的研究最近超级火爆,对于会处理大型数据的人这个方向应该不难,有兴趣的可以看看下面几篇文献,
1,Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, et al. (2009)
Detecting influenza epidemics using search engine query data. Nature
457(7232): 1012–4.(已经被引用600+,另外从网站找到了这篇nature的中文翻译,《利用查询数据探测流感传播》,中国计算机学会通讯、第 7 卷 第 8 期 2011 年 8 月。)
2,Signorini A, Segre AM, Polgreen PM (2011) The Use of Twitter to Track Levels
of Disease Activity and Public Concern in the U.S. during the Influenza A H1N1
Pandemic. PLoS ONE 6: e19467.
3,Salathe M, Khandelwal S (2011) Assessing Vaccination Sentiments with Online Social Media: Implications for Infectious Disease Dynamics and Control. PLoS Comput Biol 7(10): e1002199. doi:10.1371/journal.pcbi.1002199
google流感预测(转载http://www.google.org/flutrends/intl/zh_cn/about/how.html)
它的工作原理是怎样的?
我们发现,某些搜索字词非常有助于了解流感疫情。Google 流感趋势会根据汇总的 Google 搜索数据,近乎实时地对全球当前的流感疫情进行估测。
全球每星期会有数以百万计的用户在网上搜索健康信息。正如您所预料的那样,在流感季节,与流感有关的搜索会明显增多;到了过敏季节,与过敏有关的搜索会显著上升;而到了夏季,与晒伤有关的搜索又会大幅增加。所有这些现象均可通过 Google 搜索解析进行研究。 但是,搜索查询趋势能否为实际现象建立一个准确可靠的模式而提供依据呢?
保护用户的隐私权
Google 深知用户对我们的信任,而且致力于保护用户的隐私。我们以匿名方式统计某些搜索查询在每星期的出现次数,因此 Google 流感趋势绝不会被用来确定个人用户的身份。我们依据的是长期以来发送至 Google 的数以百万计的搜索查询,而我们观察到的数据模式只适合 Google 搜索用户这个庞大的群体。要详细了解这些数据的使用情况以及 Google 如何保护用户的隐私权,请访问我们的隐私权中心。