学生
贴一下近代史实践课的成果。
当代中国“呲必中国”现象的研究
陈德龙 程鹏 黄新宇 瞿林娟 孙晓杰 周然
指导老师 董大亮
(河海大学 计算机与信息学院 计算机科学与技术专业)
摘要:2014年11月17日,辽宁日报刊发公开信《大学老师,请不要这样讲中国》,第一次指出大学老师“呲必中国”的现象。文章提到,部分高校哲学社会科学老师在授课时a)戏谑地讲授思想理论课,解构历史,肆意评价;b)“赞必西方”,追捧西方的优越性,质疑中央的重大政策,片面夸大贪污腐败,社会公平的问题;c)有意将中国社会渲染地黑暗,险恶,劝导学生“厚黑保身”。我们以当今中国人(不限于高校教师)为对象,研究当代中国人“呲必中国”的现象。
关键字:“呲必中国”
一、“呲必中国”现象
2014年末,辽宁日报记者在深入北京、上海、广州、武汉、沈阳5座城市的20多所高校,用了半个月的时间,听了近百堂专业课之后,总结出大学教师“呲必中国”的现象:在课堂上说中国坏话,骂这个社会甚至成为了时尚。这篇文章的发表引起了舆论的讨论,我们把主要的几种反对观点列出:
- 辽宁日报对高校的调查形同“文化特务和间谍之行”,这一报道是“抓右派”的先声,文章的口气让人联想起“路线斗争”。
- 爱中国就应当骂它,爱之深所以恨之切。
- 这是大学教师的批判权和学术自由。
辽宁日报发表这篇文章之后,多家媒体发表文章,就此事进行讨论,一度有很高的热度。我们搜集了各个门户新闻网站的新闻、各类报刊文章、微博、微信公众号文章,统计了自2014年11月至今,每个月中,包含“呲必中国”的条目数量,绘制了图一。
这些包含关键词“呲必中国”的文章,总共1,418,854字。过百万字的内容我们无法直接阅读分析,所以我们对这份样本进行词频分析,去掉停用词(如“的”、“一个”、“因为”),绘制了图二。
作为对比,我们在图中保留了“中国”一词,在其后,这些文章最为关心的几个词语是:意识形态、思想政治工作、历史、西方、互联网。可以说,这一词频统计也为我们接下来的讨论指明了方向。 “美国”一词在这些文章中出现了千余次,词频排名12。根据统计数据,每八次使用“中国”一词,就要提及一次“美国”。这是值得我们注意的,因为“呲必中国”一事本身与美国其实并没有关系,然而美国一词吸引了文章作者们如此之高的注意力,因此在下面的工作中,我们引入了中国与美国的对比。
可以看出,在辽宁日报发文一年的时间里,“呲必中国”这一新词热度很高,甚至在2015年2月这一个月时间内,就有过百篇关于它的文章。
- 调查问卷
上一部分中,辽宁日报指出的“呲必中国”现象,是只局限在大学课堂中的。为了研究当今中国整个社会“呲必中国”的现象,我们进行了问卷调查。线上和线下两种途径收集到的一共620份问卷中(关于问卷更具体的信息,见附录A),我们首先关注问卷中两个问题:
·(第四题)现实生活中,您是否遇到过喜欢抱怨中国的人?
·(第七题)在网络中,您是否遇到过抱怨中国的言论?
两问题中,明确表示没有遇到过的人仅占一成。
此外,问卷第12题:您是否曾发表过这类抱怨中国的言论?选择没发表过的占比
75%,由于本次问卷调查受众不够均匀,不能很客观地反映中国社会现状,而这项数据没有办法进行除偏,故对此不再赘述。
需要指出的是,为了问卷回收率,以及确保做问卷的人能完全理解问题,问卷中我们没有直接提问“您是否遇到过‘呲必中国’的人”。毕竟这个词对于普通民众来说较陌生,我们在问题设置时将“呲必中国”更换为“抱怨中国”。实际上,“呲必”和“抱怨”并不完全等价,我们所说的“呲必中国”指的是:无论是非曲直青红皂白,对于中国的一概全盘否定,而客观地指出、分析中国的种种不足,不包含在“呲必中国”的范围。因此,普通民众遇到“呲必中国”言论的概率是要小于90%的。考虑到,能够客观地指出、分析中国缺点的人并不多,我们认为这组问题的结果可以大致反映普通民众遇到“呲必中国”言论的概率。
下面,我们就现实生活中和网络中这两方面进行讨论,研究谁在“呲”中国,他们“呲”的是什么。
(1)现实生活中
在问卷中第四题“现实生活中,您是否遇到过喜欢抱怨中国的人?”随后,我们的第五题设置为:“他们的年龄为”。我们试图通过这个问题揭示“呲必中国”言论与年龄的关系。由于填写问卷的人群样本不服从中国整体的分布(在读大学生偏多),我们需要对所得数据进行除偏。
用问卷第五题的年龄分布,减去问卷第二题统计的填写问卷者的年龄分布,作为自然对数e的指数,所得结果作为权重,赋予问卷第五题的结果,得到的真实年龄分布。
其中,根据问卷设置,i = ( 0-18, 18-30, 30-50, 50+ )
经过上述加权后,“呲必中国”的年龄分布如下:
类似地,问卷关于学历的第六题,进行加权除偏后,得到“呲必中国”的学历分布如下:
容易发现,中年人(30-50岁)“呲”中国最多;学历上,学历越高,“呲”中国越少。另一方面,图五也可以证明之前的假设:能够严肃地论证指出中国缺点的负面言论较少,即大部分“呲”中国的人受教育程度较低,客观分析的能力较弱。
(2) 网络中
接下来,我们关注在网络中,人们在哪些渠道接触关于中国的负面言论较多。问卷第八题:“您在哪些渠道接触这些言论较多?”选项分布如下:
(3) “呲”的内容
问卷第九题,我们设其为“回想您遇到的这些负面言论都是针对中国的哪些方面的?”设置选项时,我们选出了人民对于国家的八方面评价指标(下称领域),选项为:
□文卫科教(文化、医疗卫生、科技发展、教育)
□衣食住行(房价市场、交通出行、食品安全等)
□贫富差距
□工作就业
□国家实力
□社会制度
□人民素质
□贪污腐败
经过统计,选项分布图如下:
言论所“呲”的领域中,排在前三的分别是:衣食住行、人民素质、贫富差距
对于工作就业问题以及国家实力,负面言论并不多。
2. 数据挖掘
我们在线上与线下收集了620份问卷,但是要准确反映中国社会整体的舆论趋势,仍存在局限性。为此,我们收集大量数据,采用多种方法来揭示当代中国人究竟在“呲”什么。
(1)情感分析与消极度得分
我们以新浪微博作为研究对象,爬取微博自2008年1月1日以来的所有信息。检索其中关于中国各个方面的信息条目数。对所得结果进行情感分析,可以获得其中正面和负面的条目数(全部 = 正面 + 负面 + 中立)。例如,搜索同时包含关键词“中国”和“教育”的条目数共有3239046条,其中正面1591450条,负面668795条。纵观获得的各个领域(如教育,医疗,就业等)的数据,我们发现绝大部分数据组符合这样的一个统计规律,即全部>正面>负面。
得到这些数据之后,我们要建立消极度得分的概念。显然地,消极度得分是用于反映民众对于特定话题的情绪的负面程度,即消极度得分越高,不满程度越大。最简单地,我们可以设定:
但是考虑到:全部 = 正面 + 负面 + 中立,中立言论的数量决定着公众对于特定话题的情感投入程度,所以我们要对所得的商进行赋权。再者,所有领域词本身不全是中立的,比如“贫富差距”一词就有着很强的负面情绪。为了去除词语本身的偏差,我们还需要再添加一个权重,这些权重是各领域词的词向量(见附录B)的在正面情绪方向夹角的余弦自然底数的幂。
取负对数的操作使得消极度得分有这样的特性:中立的言论越多,得分得到的惩罚越大,即消极度得分偏向于突出那些公众言论情感投入更大的话题。再添加余弦项,使得词语本身负面程度越大,获得的惩罚也越大。同时,全部言论(正面、负面、中立)数量越多,获得的权重越大
根据上述定义,我们计算新浪微博中,关于中国的各个领域言论的消极程度:
(2)词向量计算
我们使用的词向量的语料比上一部分的微博语料更加丰富(百度百科800万余条,搜狐新闻400万余条,小说90GB左右,见附录B),同时,词向量模型,通过机器学习也学到了更多的词汇之间的关系。所以,单独就词向量进行研究是有价值的。我们希望通过词向量的计算来发掘在中文语料中是否有着对于中国的偏见。
如图11,我们首先求得下面十个领域词的词向量(绿色),组成矩阵后求其特征向量,以特征向量作为“领域轴”,计算各个领域词在这个轴上的投影。类似地,用多个国家名称的词向量(蓝色)求得中国与美国在“国家轴”上的投影。接着,用正面情绪词与负面情绪词(见附录B)计算出“偏见轴”。最后,求前两个投影向量之和(代表某国的某领域)在“偏见轴”上的投影,其值记录在图12中。
我们以美国作为中国的对比,发现上图中绝大多数都是负值,说明在我们使用的中文语料中,存在着对于中国的偏见,认为中国的很多方面就是要劣于美国。
3. 小结
在上文中,我们介绍了“呲必中国”一词的起源。这一词语原本用于大学教师,我们将对象群体扩充至全体中国人,从问卷与数据挖掘两个途径做分析。我们现在可以总结出以下结论:
a)“呲必中国”现象是广泛的,绝大部分中国人都接触过这类言论,
b)现实中,中年人(30-50岁),与学历较低的人群,“呲必中国”较多,
c) 社交媒体与微博中,“呲必中国”言论较多,
d) 衣食住行、人民素质与贫富差距是被“呲”得最多的领域,
e) 在大语料库中分析,贫富差距、人民素质与衣食住行仍然是言论消极程度最高的前三位,
f) 在中文大语料库中,可以发现言论对于中国相对于美国的(负面的)偏见普遍存在。
二、 事实探究
- 举例:贫富差距
上文中d)、e)两个结论中涉及的三个领域,我们挑选出其中最容易以科学指标衡量的领域:贫富差距,探究“呲必中国”的相关言论是否客观、正确。
文献[1]显示,中国的中产阶层绝对值达1.09亿人,为全球最多,但仅占全国成年人口的11%,低于全球平均水平15.9%,即目前中国仍有九成人口生活在中产阶级水平之下。因此,我国的社会结构更像是金字塔型而非均衡合理的橄榄型。
下面,我们分别用收入基尼指数与财富基尼指数来探究中国贫富差距的现状。同时,我们需要对比其他国家贫富差距的现状,才能更准确地判断中国贫富差距的严重性。因为在上文提到的,论及“呲必中国”的文章中,“美国”一词频繁地出现,我们在下面加入了中国与美国的对比。
(1) 收入基尼指数
收入基尼指数是衡量贫富差距的一个指标。收入基尼指数在0.2-0.3时,收入相对平均;在0.3-0.4时,收入相对合理;在0.4-0.5时,收入差距偏大;而超过0.5时,表明收入分配严重不均。
由图13可知,中国的收入基尼指数呈上升趋势,逐渐追及美国。在图14中,从全球范围来看,就收入基尼指数而言,中国的收入差距偏大,但在国际上仅为中等差距。
(2) 财产基尼指数
财产(财富)基尼指数衡量的是财富分配的不均程度。文献[2]指出,同收入基尼指数一样,中国的财产不平等程度在迅速升高:1995年我国财产的基尼系数为0.45,2002年为0.55,2012年我国家庭净财产的基尼系数达到0.73,顶端1%的家庭占有全国三分之一以上的财产,底端25%的家庭拥有的财产总量仅在1%左右。
如此观之,中国的贫富差距非常严重。但是在美国,前10%的富人大约占有80%的社会总财富,前1%的富人占有40%的财富,前0.1%就是20%,前0.01%仍然占有10%。美国的这一组数据都是高于中国的,即从财产基尼指数的角度看,美国的贫富差距问题,要比中国更加严重。
图14展示了世界各国财富基尼指数的分布情况,我们看到,同收入基尼指数意义,中国的财富基尼指数在国际上处于中等偏高的位置,但美国的收入基尼指数要高于中国。
需要指出的是,国土面积较大的国家,基尼指数容易偏高,因为不同省份之间的收入差距对基尼指数贡献较多。
收入基尼指数与财富基尼指数都是衡量一个国家贫富差距的指标(收入基尼指数稍常用),而从这两个指标来看,中国的贫富差距现状,在世界上处于中等偏高水平,但尚可接受。与美国相比,中国的贫富差距并没有更加严重,甚至美国的差距更甚。因此,“呲必中国”言论中,那些鼓吹美国社会的优越性,认为社会主义制度的弊端导致了中国严重的贫富差距,赞扬西方公平体制和财富分配平均的言论,是站不住脚的,是不够客观的。
2. 更多例子
除贫富差距外,其他各个领域“呲必中国”的言论也很多,但是经过分析发现,其中真正客观、真实的文章或言论少之又少。大部分存在以偏概全,虚假捏造、夸大事实、缺乏思考的现象。
以偏概全者,例如凤凰网一著名时评人又借助“大陆人在香港路边给婴儿提尿”一事疯狂抹黑中国人的整体素质。却口不提婴儿的母亲是使用了纸尿裤并装进塑料并提走的事实,也绝口不提婴儿父母激动是因为一个“ 职业港闹”用手机拍摄婴儿私处的事实,而是长篇大论地贬低和挖苦中国大陆人素质低和不文雅。
虚假捏造者,例如,《联合国公布全球国民素质排行榜,日本排名第一,中国倒数第二》,经过核实,联合国根本没有发布过这一排名。但是,这篇文章在完全捏造的这个排行榜上,冠以联合国的名义,再添加煽动性的言论与图片,获得了很大的点击量,对民众认知的影响很大。
夸大事实者,例如,《大家别去美国!一个愚蠢而落后的国家!》。陈丹青在其微信公众号以此为题,内容却是对美国的极其过度的美化,同时有极强的诱导性,暗讽中国社会的方方面面。
缺乏思考者,例如新闻《武汉高铁辐射大半个中国》的评论:“高铁辐射的铁证!五毛狗快来洗地。”抑或新闻:“北大医院接到卫计委紧急任务指示,普通外科姜勇医生已飞赴昆明指导参与暴恐事件的救援工作”的评论:“都什么时候了,还只是派普通外科医生驰援昆明,为什么不派高级一点的外科医生?卫计委出面从北京调普通外科医生,拿得出手吗?高级外科医生都留在北京伺候那些‘皇虫’吗?”
3. 小结
不可否认,当今中国必然存在着大量问题。但我们发现,关于中国的言论中,能够准确指出中国社会的确有,但是数量不多。更多的是煽动性、诱导性的,博人眼球,借题过度发挥的不实言论。
三、 原因剖析
- 现存矛盾
中国要在三十年内走完西方三百年才走完的现代化道路,就一定会遇到三百年来所有问题的总和。我们必须承认,当今中国,作为发展中国家,存在着方方面面的不足。诸多社会矛盾造成社会中个体的不满也是必然的。人们在内心积累了一些负面体验和情绪,一旦遇到某些诱因,就极容易爆发。考虑到网络与移动通讯结合日益紧密,微博、微信成为最活跃媒介,以及现存的偏消极的舆论氛围,“呲必中国”现象的出现,某种程度上讲是情有可原的。
2. 心理学角度
(1)负面偏好
负面偏好使得人们更愿意接触“呲必中国”这样的负面言论。文献[3]的实验表明,新媒体受众偏好阅读负面新闻,参与负面新闻的评论互动明显高于正面与中性新闻。而这正是上文问卷调查中“新闻评论区”途径中滋生“呲必中国”言论的重灾区。北京社科院研究员刘东的文章《“负面偏好”的内涵、本质及客服路径》指出:研究表明,人群中有一种分享和发表负面信息的现象,即所谓“负面偏好”。也就是说,人往往会更多地注意负面的信息和事物,并且强化这种体验。神经学的研究表明,大脑对坏刺激的反应比对好刺激更强烈,而且留下的痕迹更深,这是因为负面的信息和事物对人类生存和繁衍的影响更大。
由文献[4],相对中性和正面新闻报道来说,受众更加关注负面新闻报道,这种负性偏向往往影响了人们信息获取的客观性。负面新闻报道对受众的情绪唤醒度更高,进而引起主观判断的偏差。文献[5]指出,受众阅读消极性文章时对风险出现的可能性会做出更加悲观的判断,即对风险发生的可能性估计偏高,这即是“呲必中国”的不良影响的体现方式。
(2)心理补偿
做出贬低的行为,与个人的心理防御机制也有关系。贬低环境或者他人抬高自己以求自己的满足在心理学中称作心理防御机制的心理补偿。当人心里产生不愉快时,但又不能向对象直接发泄,便会利用转移作用,向其他对象以直接或间接的攻击方式发泄,或把自己的不是转嫁到别人身上,并判断他人的对错。即将对某个对象的情感、欲望或态度转移到另一较为安全的对象上,而后者完全成为前者的替代物。通常是把对强者的情绪、欲望转移到弱者/或者安全者身上[6]。在本文范畴内,整个国家就是弱者/安全者。不像“呲必他人”,“呲必中国”不会显式地对发言者的利益造成损失或受到报复。《新世界》中曾有“当我们批评和指责别人的时候,我们觉得有优越感,觉得自己更加强大。”其中后半句就是我们所说的“心理补偿”。
(3)群体心理
“呲必中国”现象的传播,还有群体心理的因素。由文献[7]群体由个体组成,在面对突发性的、冲突性的群体事件中,个体对待现场所发生事件的心理受到现场环境中其他个体影响。在面对社会热点问题时,每个个人的观点常会不自觉地跟随着舆论氛围。如果舆论氛围是负面、消极的,再综合上文的其他因素,“呲必中国”的言论就会爆炸式地增长。
另一方面,群体心理导致“沉默的螺旋”现象,使得群体主导心理相异的观点难以传播,从而造成群体从众性越来越强,群体成员更乐意采取一致的行动,而不去思考行动本身是否符合自己的一贯行为。在研究中,举例来说,我们经常看到,在某条新闻的评论区中,如果“呲必中国”的言论占大多数,消极言论充斥着评论区,这时若有某条言论为中国辩护,反对“呲必中国”,就一定会被“群起而攻之”。
3. 境外势力的介入
境外势力频频借用重大公共突发事件和网络舆情危机渗透并破坏中国互联网舆论生态环境,尤其通过资本控制掌握舆论话语权,干扰我国互联网经济社会结构。近年频发的反PX项目示威游行、反垃圾焚烧项目、反发电工程扩建等群体性事件中,就屡屡出现境外势力的踪影,将舆情事件推向“街头政治”,事态演变甚至往袭警破坏、打砸抢烧、罢课罢市等极端方向发展。利用互联网煽动群众,尤其是蛊惑对项目科学性不甚了解的基层群众,是境外势力最惯用的手段。此外,利用外媒、国内非主流媒体造谣曲解,指使网络第五纵队煽情传播谣言,也是境外势力频繁使用的手段。例如仅在2015年,在“柴静雾霾”、“加多宝烧烤”、“文登7•22事件”等多起典型网络舆情事件中,我们都能看到幕后资本与网络公知、舆论平台,和境外势力合流炒作的踪影。[10]
(1)台湾“奉天专案”
中国台湾在两蒋时代,在国安局名下的各种秘密预算,可经由当时的中华民国总统直接批准后动用。在李登辉执政期间,以‘奉天专案’等计划,将国安局各项秘密预算集中,加以法制化。‘奉天专案’是国安局编列专供元首使用的秘密费用,国安局在奉天专案下再编列以学术合作支援外围单位的‘当阳专案’、对美日外交的‘明德专案’等,经费估计约新台币三十亿元。“奉天专案”是台湾当局在上个世纪用于对外外交的一笔秘密费用,部分用于台湾在中国大陆的布局。实际上,在许多热点事件背后都有台湾势力对舆论氛围介入的影子。早期主要通过散布虚假信息,编造谣言等方式抨击中国。后期则渗透中国互联网,通过在网上发布反动言论,扶植意见领袖等方式影响中国大陆的舆论氛围。
(2)美国心理战
第一次世界大战时,美国开始有了现代意义上的心理战,即现代科学技术与传媒手段的结合运用。在一战中,美国首次组成由战争部、海军部和国务院参加的公告信息委员会,负责内外宣传,并在战争部情报处以及欧洲远征军司令部分设了两个部门负责战争宣传。二次大战中,心理战一词正式使用。一开始是指纳粹的宣传,第五纵队的活动以及欧战前的各种恐怖活动。后来美国军方和情报部门把心理战扩展为运用心理学和社会心理学解决战时问题,包括阵地宣传,对友军的意识形态训练,鼓舞士气和加强纪律。在二战结束以后,美国的心理战机构不仅没有取消,反而被制度化并进一步增强了权力。[8]
“心理战要运用一切手段来影响敌心。心理武器在于它们所产生的效果而不在于它们的特点。因此,公开的(白色),秘密的(黑色)以及灰色宣传,颠覆,阴谋破坏,特别行动,游击战,间谍战,政治,文化,经济和种族压力等都是有效武器。其所以有效不在于宣传心理和心理战机构本身,而在于能在敌人中产生内部纷争,互不信赖,恐惧和绝望。”[9]
从一战开始美国就在进行心理战的研究,并取得了许多效果,在冷战时期, 其组织机构,行动方式和目标范围都进一步发展。由于今年来的高速发展,中国也成为了美国心理战的一个重要目标。美国通过对中国进行大量的文化输出来引导社会舆论方向,打击中国民族自信心。并通过宣传、经济发展援助,美国训练和资助反暴行动等方式来影响民众思想从而破坏中国的稳定与发展。
(3)境外媒体的新闻报道
在直接影响中国国内舆论大环境之外,许多境外势力还致力于通过媒体的报导来抹黑中国,抹黑中国国际形象,并同样侧面地影响了中国国内的舆论氛围。
此类报导主要有两种形式,一是对中国国内重大热点事件进行报导,表面上以公正、探究的精神去进行分析,但却夹藏私货,在重要细节上歪曲事实,大力鼓吹阴谋论,试图引导中国民众质疑政府,打击政府公信力。例如2017年在国内舆论引起轩然大波的“红黄蓝虐童”事件,在事件仍然处于调查阶段时,许多境外媒体就无根据地对事件进行报导,使事件持续发酵,引导民众抨击政府,严重影响社会氛围。
二是通过故意歪曲事实,或夸大事实的方法来抹黑中国的国际形象,例如一篇发表在“世界之声”上的文章《新疆强制干部入住穆斯林家,‘一家亲’运动引关注》:“这个也被称为 “结对认亲”的做法,是强制穆斯林家庭接受中共官员经常到家里‘同吃同住’,接受党的教育和社会主义价值观宣传。中国当局在新疆展开的‘一家亲’运动要求干部每两个月至少在穆斯林家居住5天,监督穆斯林家庭成员的私生活。受访家庭还必须让中共干部了解家属的生活状况和政治观点,并接受政治思想灌输。” 该报导将新疆干部实行的“三送四同”民族帮扶政策歪曲为中国当局侵犯少数民族文化权利,蓄意抹黑中国形象,并蓄意挑起民族矛盾。
而根据我们发放的问卷调查结果分析显示,此类报导确实对民众产生了不小的影响,各种鱼龙混杂的新闻报导使得民众对于政府公信力产生了怀疑。
问卷最后一题:对于同一社会热点事件,下列媒体的不同报道,您觉得哪一个更可信?选项包括:国内官方媒体,国内非官方媒体,国外媒体,都不信。
经过统计,选择国内官方媒体的占比最多,为66%,其次是国外媒体10%,最后是国内非官方媒体,9%。选择都不信的占比为27%。
可见,在国内官媒没有发声之前,国外媒体对于人们的影响还是很大的,甚至人们认为国外媒体的报道比国内非官方媒体的还要可信。若此时国外媒体在新闻中故意扭曲事实,势必会对国内的舆论氛围造成很大影响,助长“呲必中国”的势头。
四、结论
本文首先发现人们在生活中,普遍遇到“呲必中国”的言论,进而讨论了现实生活中,“呲必中国”者的特点,发现“呲”中国者中,中年人(30-50岁)和受教育程度较低的人居多。网络上,社交媒体与微博是此类言论分布最多的途径。贫富差距、衣食住行和人民素质是被“呲”得最多的领域。此外,在中文言论中,普遍存在着对于中国的(负面)偏见,认为中国在多个方面比美国差。
我们接着探究了“呲必中国”言论的真实性。选取贫富差距一项,我们从多种数据中发现,中国贫富差距的现象并没有比美国严重,从世界整体的角度来看,中国的贫富差距在中等偏高的水平。我们接着研究了“呲”其他领域的言论,有大部分的不具备参考价值的言论,他们具有以偏概全,虚假捏造、夸大事实、缺乏思考等特点。
第三部分中,我们尝试分析“呲必中国”现象形成的原因。首先,我们承认中国社会确实有不少现存社会矛盾,他们某种程度上导致或加剧了“呲必中国”的现象。从心理学的角度分析,负面偏好,心理补偿和群体心理可以成为这一现象的原因。此外,境外势力的介入也影响了中国国内的舆论氛围。
当今中国,是一个正在蓬勃发展的年轻国家。上文曾提到,年轻的中国要在三十年中走完西方三百年的现代化道路,势必会遇到这三百年来所有问题的总和。而作为一个大国,中国一定是能够容得下各种的声音。本文研究的目的,不是为了消灭这些“呲必中国”的声音,而是为了客观地呈现出“呲必中国”的现象,探究其广泛性与严重性,从而使人能更加理性地对待这样的言论。
五、致谢
感谢董大亮老师对于本文的启发与指导。
感谢所有参与问卷填写的人为本文做出的贡献。
感谢第谷数据、来自CSDN@免点兔的词向量模型。
参考文献:
[1] Credit Suisse. World Wealth Report 2015[J]. 2015.
[2] 北京大学中国社会科学调查中心. 中国民生发展报告2014.
[3] 谢艳军. 新媒体受众负面新闻偏好及其影响研究——基于手机新浪网54天594条新闻的内容分析[J]. 新闻知识, 2016(10):23-26.
[4] 李强, 苏慧丽. 网络新闻受众负面偏向的关注度研究——基于传播心理学视角[J]. 当代传播, 2014(1).
[5] Johnson E J, Tversky A. Affect, Generalization, and the Perception of Risk[J]. Journal of Personality & Social Psychology, 1983, 45(1):20-31.
[6] 颜刚威. 试论心理防御机制理论[J]. 黑河学刊, 2017(6).
[7] 周瑾. 论群体事件中的信息传播与群体心理[J]. 科技创业月刊, 2011, 24(10):111-112.
[8] 许静. “心理战”与传播学——美国冷战时期传播学研究的一大特色[J]. 国际政治研究, 1999, Vol.36(1):128-136.
[9] U.S. Department of the Army, Joint Strategic Plans Committee, JSPC862/3, August2, 1948, Appendix “C” &O352TS(sectionI,case1), RG319, U.S. National Archives, Washington, DC.
[10] 察网. 境外势力深度渗透中国互联网意识形态领域[J].
附录A 调查问卷
问卷系统wj.qq.com
附录B 词向量
词嵌入(word embedding)是广泛应用于自然语言处理的技术,其核心思想是通过机器学习,将每个词语转化为一个高维向量。
- 近义词向量夹角小
如图,“河海”和“水利”密切相关,所以两个词向量之间夹角很小,而“河海”和“白色”一词关系不大,夹角就很大。图中的只是二维空间中的词向量,通常工业上使用的词向量的维数高达几十甚至几百维。对于高位空间中的夹角,人类不容易直接理解,但是这夹角可以通过余弦定理求得:
.
2. 特定方向的含义
我们将“好”,“不好”,“优秀”,“差劲”四个词通过奇异之分解进行降维,得到右图。我们发现,大致上,由上指向下的方向为“积极”的方向。
为了文章工作的需要,我们需要建立正面情绪方向的概念。使用正负面情绪词表,两表的开头部分如下:
正面情绪词表
负面情绪词表
受益匪浅
礼品
礼物
看好
很漂亮
超赞
获奖
霸气
干劲
…
共10190词
坑爹
歧途
做贼心虚
作梗
罪孽深重
盲目
懊悔
丧胆
淫邪
…
共13705词
分别计算所有正面情绪词和负面情绪词的平均值,再用正面平均值减去负面平均值,即得正面情绪方向。文中我们在消极度得分时使用了领域词在正面情绪方向上余弦值的概念,下表列出了这些余弦值。
教育教学
0.0725826657289905
医疗卫生
0.06794773680104424
科学技术
0.2174455406391283
衣食住行
0.190836071152329
贫富差距
-0.26641422264350256
工作就业
0.061557180287248006
社会制度
-0.09085118206074846
人民素质
0.16668758570974282
贪污腐败
-0.4872704326636023
国家实力
0.11499446770945776
3. 本文使用的词向量模型
本文使用的词向量信息如下:
训练语料
百度百科800w+条,20G+
搜狐新闻400w+条,12G+
小说:90G左右
技术细节
使用gensim训练,jieba分词,HMM标记新词,剔除中文字符
词典大小
6115353词
维度
64
来源
沒有留言:
張貼留言
留下你的想法