移动互联网改变了人的日常交往,重新定义了新时代联络情感与互动的方式。从社会交往的深度与数量级上看,社会交往在打通线上线下的同时,其密度在日益加深、即时性在无限叠加,社会沟通的“在场感”得到了巨大的延展。一方面,这是传统交往方式所不具备的;另一方面,即便是传统的互联网也无法具备这种即时的现场感。从这个角度看,在移动互联网的基础上,社会连接的方式与内容在大幅度拓展,同时移动互联网也整理了人们日常交往的秩序。
互联网上每时每刻都会产生大量文本,这其中也包含大量的用户直接参与的、对人、事、物的主观评价信息,比如微博、论坛、汽车、购物评论等,这些评论信息往往表达了人们的各种主观情绪,如喜、怒、哀、乐,以及情感倾向性,如褒义、贬义等。基于此,潜在的用户就可以通过浏览和分析这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。
针对通用场景下带有主观描述的中文文本,自动判断该文本的情感极性类别并给出相应的置信度,情感极性分为积极、消极、中性等。例如电商里一条评论中涉及到关于价格、服务、售后等方面的评价,需要区分各自的情感倾向。
芯大脑舆情系统的最核心需求,是能够精准及时的为客户甄别和推送负面,负面识别的准确性直接影响信息推送和客户体验,其中基于文本的情感分析在舆情分析中的重要性不言而喻,下图简要展示了文本分析以及情感分析在舆情体系中的作用。舆情数据通过底层的大数据采集系统,流入中间层的
ETL
数据处理平台,经过初级的数据处理转化之后,向上进入数据挖掘核心处理环节;此阶段进行数据标准化、文本深度分析,如地域识别、智能分词、情感判定、垃圾过滤等,经过文本处理的结果,即脱离了原始数据的状态,具备了客户属性,基于客户定制的监测和预警规则,信息将在下一阶段实时的推送给终端客户,负面判定的准确度、召回率,直接影响客户的服务体验和服务认可度。