从大数据看“科学”流言

来源:    发布日期:2018-01-30 22:55:11   阅读量:0

演讲嘉宾:张娜(百度搜索用户运营总经理)

随着互联网的发展和移动设备的普及,中国的网民规模现在已经达到了7.51亿,有90%的网民看到过流言,而且有60%参与过真正的流言传播。并且,百度每年需要处理超过30亿次可能涉及虚假信息的用户求证请求,可见我们制止流言、传播科学的必要性和紧迫性。

在我们用百度搜索的大数据里面,我们也得到了一些有趣的数据。针对这十大“科学”流言背后的人群,首先从地域上来看,可以说真是已经遍布了中国的大江南北,只要人口多的地方人群都有被谣言击中,无论经济是否发达,是沿海还是内陆,均已经被波及到了。

不过值得欣喜的是,大多数的人遇到谣言或者是看到被传播谣言时,很多会首先来百度搜索问询流言的真实性。他们可能会搜索问,塑料食材是真的吗?或者说这个塑料大米能不能食用,我怎么辨别?他们还是有一些主动的意识,想得到相关的答案。

至于性别和人生阶段画像,这个非常有趣,家里有小孩的远远要多于他自己还是学生的,这可能是由于身为家长的责任心,当他遇到一个大家传播的信息,却不知真假的时候,他会主动来搜索询问,而且可能会意识到自己身为家长教育孩子的重任,不能随便胡说。

还有一组数据大家比较认同,就是网民的受教育程度和科学素质与搜索量是相关联的。当低学历的人遇到问题无法进行判断和辨别时,他会搜索寻找答案以及背后真正的原因。

刚刚所有数据都是十大“科学”流言整体人群的画像,不同的流言背后,不同行业和学科下面拥有的人群特征表现又会不一样。接下来再看看“塑料紫菜”这个具体的例子,搜索塑料紫菜的人群年龄偏高,30-39岁人群占比达到65%,可能三四十岁正好是上有老、下有小的时期,他们需要关注自己家庭所有成员的身体健康。

而跟刚才整体的数据不一样的是,“塑料紫菜”的搜索人群里面男性朋友远远多于女性,这可能是因为女性在家庭生活中承担了更多,尤其是厨房里的工作,她可能已经积累了一些基本的生活辨别常识。反而男性对这个塑料紫菜的困惑更大,会不知道怎么来辨别。

同时,百度也一直在利用AI进行破解流言的工作。我们大概的工作原理是,在全网范围内抓取疑似流言或不真实的信息,利用辟谣的技术专门建立一套模型,针对提取它的核心、大数据自然语言处理等方法,我们把它定位成一个谣言,并且反向拽取出有关它的权威信息。如果全网信息不够,我们也会主动向相关的一些机构、专家学者求助,请他们帮忙补充这部分的信息。我们再把它推送到业务层上面,通过百度百科、百度知道、百度经验以及搜索的结果页,甚至我们可以主动布设一些人群让他们看到这个信息,做到“智止流言,传播真知”。■