《如何让计算机学会品味的味觉》

《计算机学会欣赏的味觉美学指南》

Tastry如何使用新颖的化学和人工智能来预测消费者的喜好。

从一开始,我们想要回答的问题是:“我们能否解码基于感官的产品的独特风味矩阵和消费者的独特生物偏好,以准确预测喜好?”简短的答案是肯定的。

然而,在我们的研究初期,我们发现现有的化学分析方法和现有的消费者喜好数据没有提供统计上显著的相关性或预测性。我们知道我们需要创造自己的数据才能取得进展。

首先,我们需要创建一种分析化学方法,该方法能够尽可能透明地提供化学成分(包括挥发性物质、非挥发性物质、溶解物、光谱数据等)的信息。我们还需要以一种可以帮助近似人类在味蕾上体验化学成分的方式解码风味矩阵。

其次,我们需要创建一种方法来持续而准确地获取、增补和跟踪一大群多样化且不断增长的实际消费者的生物感官偏好,作为我们的基本真相。

当前方法为何无法预测基于感官的产品的消费者偏好

当我们在2015年开始研究时,我们的假设是关于葡萄酒的风味,也就是味道、香气、口感和颜色的一切都存在于化学成分中。然而,缺少的是一种更全面的分析方法。

为了解释这个局限性,重要的是要理解基于感官的产品的化学成分主要侧重于质量控制,即这种混合物中有多少分析物?焦点通常不是评估所有分析物、它们的相对比例,或者它们在人类味蕾上如何相互作用以生成风味。这是我们需要揭示的盲点,因为在人类味蕾上发生着数百个化合物之间的动态相互作用。人类味蕾同时体验“化学汤”中的多个风味化合物,而不是像机器那样逐个化合物。这些多个化合物之间的相互作用,再加上每个消费者的独特生物学特征,将对化学成分在个体身上得以表达这一方面提供关键的背景。

在考虑感官的程度上,简而言之,典型的方法如下:

  • 调查数据显示人们喜欢黄油。
  • 酪醇是与黄油风味相关的化合物。
  • 如果我们制作一种酒中酪醇含量更高的霞多丽葡萄酒,更多人会喜欢它。

这种方法的核心问题:

  1. 单纯通过化合物的定量无法预测风味。在一个葡萄酒或年份中,给定浓度的酪醇可能被感知为黄油,而在另一个葡萄酒或年份中则不会。这是因为葡萄酒中还有其他数百种化合物,并且根据其浓度和比例,酪醇可能被掩盖或表达。与机器不同,人类同时感受所有的化合物,他们的感官并不分析每个化合物,因此任何个别给定的定量并不一定具有预测性。

 

  1. 人类感知和描述风味各不相同。即使在专家小组中,一半的专家可能描述一种味道像苹果,另一半可能描述它像梨子。而一般消费者的预测性更低。根据我们的研究,我们不认为人的味觉通过简单的语言传达给其他人,以使其准确感知。我们的描述太过于笼统,而且我们的定义会根据个人的生物学和文化经验而变化。例如,在美国,大多数消费者将苯甲醛的感知描述为“樱桃”,而在欧洲,大多数消费者将其描述为“杏仁酱”…即使是同一种葡萄酒。

 

  1. 消费者感知的风味与他们是否喜欢无关。在我们的研究中观察到,消费者不会因为一种葡萄酒的味道像樱桃而决定购买。他们只是判断他们喜欢这种葡萄酒,并且很可能再次喜欢。

例如:这种不理解并不局限于葡萄酒领域。我们曾与全球一些最大的香精和香料公司的高管和研究人员会面。其中一位高管描述了他在最近一项制作新型薰衣草巧克力的项目中的沮丧之处。该公司花费了数百万美元与特别喜欢巧克力、薰衣草和薰衣草巧克力的消费者举行座谈和焦点小组会议。最终的结果是,被调查者同意这是薰衣草巧克力,但他们也一致认为他们不喜欢这种特定的薰衣草巧克力。

基于这些见解,我们得出结论,我们应该把研究重点放在预测消费者喜欢的化学成分矩阵及其程度上,而不是他们所感知的味道。

我们的方法有何不同

垃圾进,垃圾出。当涉及到数据质量时,我们意识到不能从现有的商业或众包数据中生成有效的训练数据集。我们将不得不自己在内部创建。

我们需要的第一件事是一种化学方法,能够在一个快照中提供对葡萄酒的挥发性、非挥发性、溶解固体、光谱数据等的细微平衡的可见性,以便与人类的味蕾更相关。

多年的实验研究产生了一种方法,每个样品生成了超过100万个数据点。然后,我们的数据科学团队设计了机器学习算法来处理这种精细和大量的数据,并解码分析物和分析物组的比例之间的相互依赖关系,从而影响到人类的感知。

在我们证明该方法的有效性后,我们开始分析和解码全球数以千计的葡萄酒的风味矩阵,并已开发出了全球葡萄酒的综合风味矩阵数据库。

将消费者偏好与化学相关联

接下来,我们需要了解各种消费者喜欢的风味矩阵,因此让他们品尝并评价我们所分析的葡萄酒。多年来,我们一直进行定期的双盲品酒活动,吸引了数千名消费者参与,每个人品尝了数十甚至数百种葡萄酒。受访者包括新手、普通葡萄酒饮用者、专家、酿酒师和侍酒师。

众包系统通常会忽视重要的数据或忽略它们。例如,在帕克评分中,大多数人甚至不会给出低于80分的评分。但是我们已经了解到消费者更加讨厌他们不喜欢的东西,而不仅仅是喜欢他们喜欢的东西。因此,全面了解偏好(尤其是负面偏好)非常重要。

我们利用我们的新型机器学习算法来了解消费者对葡萄酒中各种类型风味矩阵的独特偏好。随着时间的推移,这使我们能够准确预测他们尚未品尝过的葡萄酒的偏好。在这个过程中,我们还了解到个别葡萄酒以及个别偏好在其独特性中几乎是独特的。我们得出结论,与行业的传统做法相反,消费者和葡萄酒不能准确地分组或协同过滤成概括。

例如:两个女性可以有相同的地理位置、文化、族裔、教育、收入、汽车、手机,两个人都喜欢金宝卡克赛文翠司康利奥葡萄酒;但一人可能喜欢晨雾霞多丽白葡萄酒,另一个人可能讨厌它。唯一可靠的预测能力在于他们的生物味蕾。

如何推广这一创新?

我们所创建的东西非常棒,但品酒小组很昂贵且耗时。要了解24800万美国21岁以上的人的口味,每年举办一次品酒小组是不可能的。

我们希望设计一种可扩展工具,具有预测消费者偏好的同等功效,而无需他们参与品酒小组或表达对大量之前品尝过的葡萄酒的偏好。

我们的解决方案是让AI选择与葡萄酒具有共同化学特性的简单食物。参与我们品酒小组的受访者回答了关于非直接相关于葡萄酒的食物和口味偏好的数百个问题,例如“你对青椒有什么感觉?”或“你对蘑菇有什么感觉?”

这些问题被TastryAI用作与葡萄酒潜在化学成分的类型和比例类似物的比较。作为人类,我们无法解读或理解这些复杂的相关性和模式,但是将这些复杂的关系梳理出来正是机器学习解决的一个绝佳问题。

通过这些数据,TastryAI学会根据受访者对食物偏好调查的回答预测消费者对葡萄酒的偏好。结果是我们能够消除消费者提供任何特定的葡萄酒数据来预测他们对葡萄酒的偏好的需要。

我们需要多少数据来了解消费者的偏好?

尽管我们从数百个食物偏好问题开始,越多问题被回答,结果就越准确,但在回答了9-12个问题后,收益递减。通过帕累托原则的作用,最好的食物偏好问题提供了大约80%的消费者口味理解。

截至今天,一般来说,对于红葡萄酒通常有一个10-12个问题的调查问卷,对于白葡萄酒、玫瑰葡萄酒和起泡酒,也有一个10-12个问题的调查问卷。

这提供了一种可扩展的解决方案。自几年前我们在不同试点中推出以来,现在在电子商务网站上有很多类似的别致问卷。消费者用30秒的时间回答关于他们喜不喜欢黑莓或咖啡的问题,然后得到葡萄酒推荐。不同的是,那些问卷最多只是品酒笔记过滤器,即如果你喜欢黑莓,你会喜欢被描述为具有浓郁水果味道的葡萄酒;如果你喜欢咖啡,你会喜欢被描述为具有收敛性的葡萄酒。但我们已经了解到,如果这些描述符合个体的口味,它对于他们是否喜欢这种葡萄酒没有预测能力;但这种问卷方式很吸引人,消费者喜欢。

Tastry的推荐与葡萄酒的风味矩阵相关。TastryAI不是品酒笔记过滤器,它不会问你是否喜欢葡萄酒中的蘑菇香气或味道,它试图根据你的生物口味偏好来理解你喜欢或不喜欢的化合物比例。每个问题提供了许多层面的见解,因为每个问题都与其他问题重叠和互补。所以,在问到蘑菇后,接下来可能的问题是“你对青椒的味道感觉如何?” AI可能知道,例如,一个给定比例中一般负责蘑菇感知的化合物有33个,负责青椒味道的化合物有22个- 但重要的是,其中一些化合物两者都存在。如果你说你喜欢蘑菇,但是讨厌青椒,那么AI会更有信心地认为你喜欢某些化合物,更有信心地认为你不喜欢其他化合物,并且那些重叠的化合物可能具有上下文关联。

所以,你可以想象一个多维的维恩图,AI正在揭示出你喜欢或不喜欢的化合物与其他化合物的组合。

通过这种口味偏好调查和消费者反馈,我们从世界各地收集匿名的口味数据。电子商务网站或大型零售商可以在应用程序上推出Tastry Quiz,并在短短几小时内从全美各地的消费者获得数千个回应。我们获取的唯一其他数据是邮政编码。我们使用邮政编码应用了贝叶斯脊回归的衍生方法,它考虑了我们收集和监测的已知消费者口味的地理分布以及其他数据,并预测了美国其他2亿多个可行消费者口味。我们使用这个增强的数据集作为真实情况的来源,并预测葡萄酒在市场、商店、本地或区域层面的表现。

Tastry虚拟焦点小组

在分析葡萄酒、解码其风味矩阵,并评估其与实际和虚拟口味的可口性相比,AI目前的预测美国消费者对葡萄酒的评级的准确度为92.8%。换句话说,AI可以在星级评分的平均值上预测葡萄酒的五星评级,误差范围在正负1/10个星级之间。

最容易将AI看作消费者偏好的“虚拟焦点小组”。

酒庄使用TastryAI来模拟消费者对他们的葡萄酒的感知,甚至在他们投入多年和数百万美元之前。批发商使用TastryAI确定不同葡萄酒表现最佳的地区。零售商使用TastryAI优化他们货架和在线的产品组合。而消费者使用TastryAI避免购买他们不喜欢的葡萄酒的风险。