自动零售结账台如何识别未标记的农产品?了解伪增强计算机视觉方法
自动零售结账台如何识别未标记农产品?了解伪增强计算机视觉方法
随着机器学习和深度学习技术的进步,各个领域的自动化程度也越来越高。自动化逐渐减少了人类在日常生活中各个例行事务中的干预,尤其是在零售领域。
它们使我们能够跟踪自然资源,并有助于环境的可持续性。自动化系统通过优化供应链,提升库存管理、需求预测和物流协调能力。然而,有些情况下自动化是困难和复杂的。例如,没有条形码的商品的识别就是一个例子。
为了正确计费,自助结账站需要能够识别带有重量的物品。这样的系统必须能够识别各种类型的散装农产品、谷物和其他商品。通常,在许多零售店中,顾客需要记住产品代码,并在部门内称重商品以识别水果或蔬菜的类型。
为了解决这个问题,Skoltech和其他机构的研究人员设计了一种在超市中区分带有重量的商品的新方法。研究人员利用计算机视觉来促进这个过程。这种方法可以在引入新品种的情况下加快神经网络的训练速度。
为了促进这项研究,研究人员收集了不同类型的图像。他们收集的图像在各个地点拍摄,包括花园、当地杂货店和实验室环境。他们每个类别收集了1000张自然图像,总共5000张自然图像。他们还使用了包含从顶视角观察的容器图像,其中有很多物体在顶视图中。他们每个类别使用了70张顶视图图像,平均每张图像上有7.1个物体。他们结合了不同的图像和背景,应用了各种变换,并生成了比裁剪的物体数量更多的训练图像。
研究人员还通过确保检测质量的降低远低于没有PseudoAugment的情况来增强了这些图像。
研究团队表示,早期的处理方式存在一些限制。他们说困难在于超市中有许多外观相似的水果或蔬菜,而且经常出现新的品种。经典的计算机视觉系统需要在每次引入新品种时进行重新训练。他们进一步表示,这是一项耗时的工作,因为我们必须收集大量数据并进行手动标注。
为了检验这种方法的准确性和性能,研究人员对五种不同类型的水果进行了分类,并发现当自然训练照片数量低于50时,默认的流程输出基本上是猜测。他们强调,当原始训练图像少于250时,这种方法的优势才能得以体现。研究人员进一步测试了这种方法在水果分类问题上的准确性,并观察到这种方法在没有自然训练图像的情况下可以达到98.3%的准确率。