上下文,图像和数字方法的局限性

我目前在阿姆斯特丹的奇妙的数字方法倡议(DMI)暑期学校里,致力于气候变化视觉语言的“使气候成为社会”项目。 不久之后,但我想在项目中提出一些针对数字方法的关键方法挑战:视觉传达在社交媒体上的重要性日益提高,这意味着仅基于关键字搜索的研究便面临越来越大的风险。 依靠关键字搜索来研究社交媒体平台可能会忽略高参与度的帖子。 我可以预见到可以大规模搜索图像中相关内容的数字方法。 但是,在可预见的将来,[数字方法+数字人种志]的双轨方法可能仍然是最佳的。 下面,我将参考Twitter上的一些最新示例(感谢Sabine Niederer在TCAT上的工作)进一步解释。

美国退出《巴黎协定》的决定引发了许多社交媒体活动,特别是在Twitter(与“突发新闻”事件最相关的平台)上。 我们使用DMI-TCAT工具搜索了2017年5月24日至6月7日(美国公告前后大约一周)之间的推文,其中包括四个关键术语(气候,气候变化,全球变暖,全球变暖)。 然后将结果与在美国做出决定前后的人种志研究“气候变化Twitter”的人种学研究期间手动收集的推文进行比较:对气候变化感兴趣的众多Twitter用户,涵盖科学,政策,政治和怀疑论社区。

立即清楚的是,数字收集的推文(TCAT)与手动收集的(民族志)推文之间存在一些差异。 至关重要的是,与《巴黎协定》的撤消相关的一些非常共享的内容没有出现在数字数据中,因为它不包含任何搜索词作为文本。 例如, 法国总统马克龙 ( Macron)发布了一条推文 (上图),其中没有任何文字,而只是带有类似模因的运动模因图像,其中包含着“再次造就我们的星球”的口号。

显然,这是对美国政府决定的回应,也是特朗普总统竞选口号“让美国再次伟大”的一幕。 解释与气候变化有关的推文不取决于特定的搜索词,而是取决于许多上下文因素的知识:时间安排(围绕巴黎决定),特朗普的角色(气候变化怀疑论者),马克龙的角色(亲气候行动)和特朗普2016年竞选口号。 这很重要,因为Macron推文比TCAT数据库中的任何推文共享得多,撰写本文时(240/6/17),共有240323推文。

解决关键字搜索缺点的一种潜在数字方法是从主要的气候变化Twitter用户那里收集其他推文。 具有该领域背景知识的研究人员可以设置要监视的相关Twitter用户列表。 在上述情况下,人们可能已经预见到马克龙会根据自己的总统竞选活动对美国有关《巴黎协定》的任何行动发表评论。 但是,另一条高度共享的推文来自一个用户,这是我们无法合理预期的。 在撰写本文时,一条包含幽默的模因文字并排放置的推文 (“与男孩一起开冷面”和图片(与美国官员和冰山一角的特朗普))在撰写本文时获得了62,445条转发:

再说一次,与TCAT“气候变化”关键字搜索中出现的任何内容相比,它的共享程度更高,但该消息是由关注者少于1000名且没有关于气候变化的推文历史的用户发布的。

尽管使用现有的数字方法工具避免了这种检测,但将来可能会设计出可以捕获此类推文的方法。 与Macron推文一样,该推文中也没有与气候变化明显相关的文字。 但是,图像内容更直接相关,并且可能有助于采用计算机视觉API (例如Google Vision)的方法,该方法可以将图像内容检测为Trump和iceberg。 这种数字策略的有效性既需要改善视觉API的性能,又需要将图像搜索术语扩展到一系列可能相关的术语,例如“ iceberg”。 即使能够克服这些挑战,也不清楚它们是否能抓住马克龙的推文。

传统关键字搜索方法未捕获这两个高度共享的推文,这突出了数字方法的某些局限性。 当然,数字方法在大规模分析内容中仍然发挥着至关重要的作用。 但是,以上示例说明了视觉内容和上下文知识在社交媒体传播中的重要性 。 Macron和“冷单”推文比包含相关关键字的推文受欢迎得多,这引起了一种有趣的可能性:与包含问题关键字或主题标签的推文相比,需要一些上下文知识进行解释的推文具有更大的参与潜力。 如果我们将上下文和图像视为更广泛的“非文本”通信类别(以及视频)的一部分,那么很显然,如果社交媒体研究要保持强大和相关性,我们应该考虑扩大数字方法的范围。