让我们以讨论的电话诈骗相关话题为例,考虑一下品牌分析系统如何帮助解决监测公众情绪的日常任务。
创建主题
品牌分析系统中对社交媒体和大众媒体的监控和分析始于创建主题。
主题 是一个工作环境,用于聚合消息、收集消息统计信息并生成自动报告。主题是根据搜索查询针对特定监控对象创建的。
搜索查询由关键词、否定词以及指定操作的特殊运算符组成。例如,如果我们只查找所有提及电话诈骗者的内容,那么在关键词中我们会这样写:
“电话诈骗者”~0
此运算符称为“词间距离搜索”。将所需短语放在引号中,~(波浪号)后表示短语各部分之间的最大单词数。0 表示不存在这样的单词。1 表示短语可以用另一个单词分隔,例如,包含短语“电话银行诈骗者”的消息也会被收集到主题中。
由于我们的主题范围更广,我们将主要使用按距离分组的关键字。该运算符如下所示:
( )/N( ),其中,相交和组成短语的单词将在括号中注明,N 为它们之间的最大单词数。
作为研究的一部分,我们交叉检查了“call”动作的 WS 电话列表 所有拼写变体,因为用户可能会输入错误或只是写错,以及欺诈和欺骗的各种同义词和变体:
(打电话,打电话,电话,他们打电话……)/7(诈骗者,骗子,骗子……)
我们排除了所有提及“奥特佩特耶·莫申尼基”乐队的信息,以免收集到演唱会公告或纪念品销售主题(这些主题中也会提及电话号码),以及任何与销售和订单相关的信息。销售领域总有骗子,但我们对他们不感兴趣,但这些信息会占用品牌分析的部分流量。
搜索词和否定词是一个动态设置,可以在初始收集后,在主题工作过程中进行补充。某些用户行为模式只能在大型数据集上识别。因此,如果您无法立即收集到理想的否定词集,这很正常。
在创建和编辑主题时,设置来源、过滤、指定收集渠道和调性对象也很重要。
频道 是评论网站、地图、市场、社交网络、应用商店等上的品牌或公司页面,设置后可用于接收来自该主题的选定页面的消息流,无论它们是否提及搜索查询的关键字。