
一项于周二发表在《Discover Applied Sciences》上的研究发现,用于支持地理标志的机器学习工具,包括葡萄酒产区及其他与原产地相关的食品和饮料产品,往往在内部测试中表现良好,但在与独立空间数据进行核验时则会减弱。
该论文探讨了作者所称的“数字风土”——一种数字层,用于将产品宣称的品质与可测量的环境条件联系起来,例如土壤、气候、生物多样性、土地管理和地方实践。研究人员认为,地理标志的可信度日益取决于能够以可验证证据审计这些主张的系统。
这项研究由与巴西多家机构有关联的研究人员主导,包括塞尔希培联邦大学、费拉迪桑塔纳州立大学和伯南布哥联邦农村大学。研究回顾了2010年至2025年间发表的、与地理标志和生态系统服务审计相关的机器学习方法科学文献。
研究团队按照PRISMA-ScR综述指南开展工作,最初检索到272条记录,并通过一个自动加权评分系统进行筛选。论文称,该系统的主题准确率达到94.2%。这一过程最终形成了包含148项研究的主题语料库,用于描述性、多变量、网络和元分析。其中文献中有25项达到更深入定性审查所需的完整方法学质量门槛,依据是经调整后的MMAT得分至少为20,以及0.87的一致性测量值,即ICC。
研究人员发现,内部验证中报告的高准确率与更具挑战性的外部检验结果较弱之间存在明显差距。在所审查的研究中,分类器在内部验证中的准确率通常为80%至100%。但未经过空间独立验证的模型在外部稳健性测试中的平均性能下降了11.8%,而经过空间验证的模型下降幅度为5.6%。论文报告的效应量为d = 0.95。
作者还发现,该领域的方法论碎片化程度很高。他们报告模块度Q = 0.62、异质性I² = 58%,并称这些数值表明方法不一致,可能限制可比性和监管用途。对FAIR数据原则的遵循度平均为34.2分(满分100分)。
论文指出,这些弱点造成了其所描述的验证不对称,可能限制监管机构或第三方审计员使用这些系统。作者表示,数字风土的机器学习模型应当从静态分类系统转向经过空间验证且可解释的自适应模型。
他们为未来研究提出了完整性基准,包括外部性能衰减不超过8%、能够识别模型决策背后地域标记的可解释人工智能工具,以及至少60分(满分100分)的FAIR合规度。
这些发现可能对依赖地理标志的饮料生产商具有重要意义,尤其是葡萄酒产区,也包括其他基于原产地的类别,因为更强大的数字审计工具或可借助可追溯证据支持可持续性和风土主张。这可能降低与地名相关的环境营销超出实际可验证范围的风险。
该文章于6月23日以开放获取形式发表。作者表示未获得外部资助,并称不存在竞争利益或利益冲突。
Vinetur® 是 VGSC S.L. 公司的注册商标,成立于 2007 年,在葡萄酒行业有着悠久的历史。
VGSC,S.L.(CIF B70255591)是一家在西班牙圣地亚哥-德孔波斯特拉商业注册处注册的实体。
电子邮件:[email protected]
总部和办事处位于加利西亚的 Vilagarcia de Arousa | Spain