blog

解释者:互联网如何知道你是快乐还是悲伤

<p>想想你今天在Facebook上与朋友分享的内容是“压力”还是“失败”,或者“喜悦”,“爱”或“兴奋”</p><p>每次我们在社交媒体上发帖时,都会留下我们心情的痕迹我们的情绪是有价值的商品,许多公司正在开发自动化工具,在称为情绪分析的过程中识别它们最近,一份泄露的报告显示Facebook可以识别年轻人虽然该公司坚持不使用该分析来针对广告用户,但他们仍然感到很脆弱Facebook也在2014年为“情绪感染”的实验道歉,其中“积极”或“消极”情绪的帖子被用户过滤掉了显然,社交媒体公司和广告商都非常关注从文本中检测情绪的能力</p><p>但情绪分析如何运作,为什么它有用,有什么危险</p><p>尽管Facebook的算法细节尚未公开,但大多数情绪分析技术分为两类:监督或无监督监督方法依赖于标记数据换句话说,这些是手动分类为包含正面或负面情绪的帖子统计方法是然后用于训练模型根据预先识别的单词或短语的存在自动分类新帖子 - “强调”或“放松”,例如,无监督方法,另一方面,通常依赖于为不同的分数建立分数字典单词由我的合作者开发的一个这样的字典要求人们给不同的单词给出1到9的幸福分数,然后对结果进行平均:例如,“彩虹”得分为806,而“无用”得到252个短语的总体情绪然后可以通过查看帖子中的所有单词得分</p><p>例如,帖子的平均分数“我的妈妈总是说'生活是有趣的根据这本词典,一盒巧克力“是一个高于平均水平的602,表明它表达了一种积极的感觉营销人员越来越多地使用情绪分析来研究趋势并提出产品推荐想象一下新手机的发布;关于手机的社交媒体帖子的情绪分析可能会让公司有价值,实时地了解它的表现如何情绪分析也有更广泛的应用研究人员最近追踪唐纳德特朗普在他担任总统的头100天内的Twitter情绪并建立了机器人当他对特定公司做出积极或消极的推文时,市场交易也是如此</p><p>科学家们也可以跟踪其他文本中的情感趋势</p><p>例如,我们使用情绪分析来通过他们的电影剧集研究超过1,000部电影的情感弧度2013年迪士尼电影“冰雪奇缘”的弧线如下图所示许多电影都显示出类似的模式:正常的高峰和低谷的张力和释放,接着是80%的特别大的低谷通过电影(所有的希望都失去了!),在最后的决议和快乐的结局之前应用类似的对小说的分析,我们发现大多数故事都遵循六个基本故事中的一个</p><p>鉴于情感分析通常依赖于min社交媒体的帖子,它提出了重大的道德问题,这场辩论只是开始然而语言和意义的复杂性使其容易出错使用“愿力与你同在”这句话,使用我们的字典分析得分535对于任何星球大战的粉丝来说,它当然是一个非常积极的短语但它在我们的测试中得分谦虚,因为“力”这个词被评为低于平均值40这在单独评价这个词时是可以理解的,但在上下文中它更少因此,有必要对Facebook的情绪分析能力的有效性持怀疑态度完全可以想象,在Facebook上描述一些“完全生病”的东西,这是一个口语认可的短语,可能会导致个人的情绪状态被错误分类</p><p>要理解情绪分析的时间和不起作用,重要的是检查驱动特定结果的单词要做到这一点,我们使用“单词移位”图,就像一个对于“冰雪奇缘”而言,这显示哪些词语使得剧本的高潮比其快乐的结局更令人悲伤:更多地提及“悲伤”和“恐惧”,但奇怪的是,更“美丽”的情感分析是一种强大的工具,但它只是一个年轻人科学,必须谨慎使用 科学家们必须开发出一些工具,让我们能够“深入了解”并了解为什么某些算法可以产生他们所做的结果</p><p>这是用不同方法诊断问题的唯一方法,更重要的是,教育公众了解该领域的可能性和局限性情感分析研究主要建立在大型公共数据集上,特别是来自社交媒体</p><p>重要的是,我们这些人无意中提供了数据,了解它能够和不能用于什么,

查看所有