内盖夫本古里安大学的研究人员设计了一个能够识别社会规范违规行为的人工智能系统
Researchers at the University of Negev in Be'er Sheva have developed an AI system that can identify social norm violations.
《APA心理学词典》对社会规范进行了全面的定义,将其定义为在特定社会背景下指示典型和适当行为的社会确定标准。这些规范可能是普遍的,广泛适用于各种文化,也可能是情境的,特定于特定的文化环境。
尽管社会规范在不同的文化和环境中有所不同,但社会规范的违反通常可以分为几个常见的类别。这些类别捕捉了超越文化界限的共同主题。
自动识别社会规范及其违规行为是一个重大挑战。为了有效应对这一挑战,首先要确定表明社会规范被违反时的特征、信号或变量。
内盖夫本-古里安大学的研究人员研究了自动识别社会规范违反的问题,一位研究人员设计了一个可以检测社会规范违反的AI系统。该研究旨在弥合社会科学和数据科学之间的差距,认识到整合这两个领域以深入了解人类行为和社会动态的潜力。
研究人员使用了零样本文本分类(零样本分类是自然语言推理的一种专门形式,其目标是确定给定的类标签可以从文本前提中推断出或包含的可能性),GPT-3(用于生成合成数据并通过人类领域专业知识识别违反的社会规范)和自动规则发现构建了这个系统。他们所制作的系统使用了十种社会情绪作为类别的二进制。由于社会规范的数量庞大,研究人员将它们分为有限数量的社会情绪。
研究人员训练了一个系统来检测这十种情绪,它们是:能力、礼貌、信任、纪律、关心、亲和力、成功、遵从、正派和忠诚。他们制作的系统可以将给定的文本分类为这些情绪之一,并进一步将其分类为积极或消极。
研究人员首先使用零样本分类自动识别短文本数据中的社会情绪。然后,他们使用GPT-3生成合成数据,并通过人类领域专业知识识别违反的社会规范,从而得到由十个顶级类别表示的高级规范分类。此外,他们开发了七个简单模型,基于衡量社会情绪、规范违反和其他因素的特征,用于分类涉及规范违反或确认的案例。这些模型在两个不同的大规模短文本数据集上进行了测试。
该系统的表现相当出色,零样本分类器的最高情绪与人类受试者识别出的情绪之间有64%的匹配度。为了实现这一点,研究人员利用了EmpatheticDialogues数据集,其中包含了大约25,000个对话,标有32种不同的情绪。他们的重点是涉及规范违反和情绪的情况。
通过利用这些标记数据,他们训练了模型来自动识别社会规范并将其分类为顶级群体。结果相当令人鼓舞,检测规范违反的准确率约为94%,精确度约为96%。
谈到这项研究,研究人员表示,这是初步工作,但它提供了强有力的证据,证明他们的方法是正确的,并且可以扩展以包括更多的社会规范。