首页 >> 正文

斑马限定笔正品鉴定

来源：baiyundou.net 日期：2024-08-04

Pine 发自凹非寺

量子位 | 公众号 QbitAI

明明是只斑马，AI为什么说它是一条狗？

分类模型在归类图像时有时会错误地判断类别。

经过学习的AI，还会搞砸一些预测，肯定是在其中的某个环节出现了纰漏。

斯坦福大学的两位博士生和教授James Zou在一篇论文中，带我们探究了分类模型犯错的原因。

随后，论文提出一种方法——反事实的概念性解释（Conceptual Counterfactual Explanations），并评估了它的效果。

通过这种方法，我们就能重新定义模型的分类标准，从而解释AI犯错的原因。

一起来看看吧。

AI为什么会犯错？

想要提高分类模型后续预测的准确性，就先得整明白这个模型在哪里出了岔子。

一般来说，AI搞砸预测是以下原因造成的：

首先是在模型实际预测的过程中，分类标准可能会与预训练时有些偏差，使得训练模型在实际预测的过程中效果不佳，进而降低预测结果的准确性。

比如说，病理学家使用预先训练好的模型来分类组织病理学图像，但效果在他的图像上却不是很好。

这就可能是在他的图像中，色调与原始训练数据中不同导致的。

其次，在模型学习的过程中，可能会学习到一种叫做“伪相关性”的东西，即将一些看似无关的要素与被识别的图像关联起来。

可以看这个例子：

在这个模型训练过程中，样本里所有狗的照片里都有雪，这导致该模型将雪与狗联系在一起，并错误地预测：没有雪的狗不是狗。

这可能是用的数据集，都是在同一场景下收集的，会阻碍模型的泛化。

除此之外，也可能是在训练模型时，人为制造的一些偏差。

例如，某一皮肤科专家利用训练好的AI来分类图像中的皮肤病，但其他同事使用的效果却不尽如人意。

这可能是因为在训练的样本中，皮肤的肤色单一、且年龄段分布窄。

了解了AI“犯错”的原因后，我们要怎样才能准确地判断模型哪里出现了错误呢？

AI犯错，它来解释

James Zou在论文中提出了一种叫反事实的概念性解释（CCE）的方法。

具体来说，就是通过这种方法，来探究输入数据与预测结果之间的联系，最终找到模型的错误之处。

那CCE是怎么来解释的呢？

定义概念库

首先要做的，就是设置并细化一个概念库C，即制作一个分类标准。

具体来说，概念库C中的各个概念可以用来分类图像，如装置c1（街道、雪等）、图片质量c2（清晰、模糊等）······

这样，就能获得一组可解释的概念库C={c1，c2，…}。

然后，需要给其中的每个概念找对应训练数据。

具体的，就是收集与其相符（Pci）和不符（Nci）的例子，一般来说数量上要一样（Pci=Nci=100）。

对于每个概念，CCE都要学习它们的分类方法和“思维方式”。

分别通过两种方法：

一个是通过学习支持向量机（SVM），来寻找可以区分两种事物最优方式的算法（线性分类器）。

另一个是学习相应的概念激活向量（CAV），它可以用来解释图像被错误分类的具体原因。

就像下图，都是斑马的图像，归类错误的原因却不一样。

这一步只需要对每个想要评估的模型做一次，之后CAV便可以用来解释任意数量的错误分类。

给定错误分类标准

我们可以通过改变不同概念在模型中的比重，对其分类标准进行相应的调整，这些调整要满足以下原则：

1、正确性：如果一个分类标准达到了预期的结果，那么它就被认为是正确的。

2、有效性：分类标准不能违反人类的基本认知。

3、稀疏性：最终目标是向用户传达模型的错误之处，太多的变量不利于有效传达信息。

我们的目的是尽可能地使预测结果贴近训练结果，即最小化交叉熵损失。

因此就要不断优化模型预测的标准，通过调整待修改的标准，对其进行加权，最终达到纠正错误分类的效果。

了解之后，我们通过一个实际例子来看看，怎么用CCE“探测”分类模型出错的地方。

在这里，分类模型错误地将斑马图像识别为非洲猎犬。

于是，我们首先生成这个模型将斑马识别成狗的一系列标准。

然后，对这些标准进行评分，如果评分为正，则代表在图像中增加这个概念，将会提高正确分类的概率，反之亦然。

在这个例子中，如果增加stripes（条纹）这个概念，识别出它为斑马的概率就会大一些。

在c）图中，通过CCE分析也可以直观地看到，“Polka Dots”（斑点）和“Dog”（狗）是导致模型预测错误的原因。

CCE效果怎么样？

看到这里，想必大家对CCE的原理都有了初步的认识。

那它判断得到底准不准确，效果究竟如何呢？

CCE的目的，主要是揭示模型在训练过程中学习到的“伪相关性”，用它就可以捕获图像中出现的其他“无关要素”和图像的伪相关性。

测试发现，在大多数情况下，该模型在超过90%的错误分类的测试样本中识别出伪相关。

看看这个表格，相较于其他方法，使用CCE，识别出样本中伪相关的概率最高。

CCE能够精准地识别出样本中的伪相关，可以看这个例子：

改变苹果图片的颜色（使图片变灰），分类模型识别错误的概率增大时（黑线），CCE辨别出“绿色”为伪相关的分数也就越高（绿线）。

除此之外，CCE也有用在医学领域的潜力。

像Abubakar Abid等人就使用CCE，在皮肤病学（皮肤状况分类）、胸片图像中的心脏病学（气胸分类）中都做了相关测试。

CCE使用学习到的偏差和图像质量条件来解释模型犯错，也已被专业的皮肤科医生证实——这些因素，确实很大程度上是导致皮肤图像难以分类的原因。

此外，CCE的速度也很快。

概念库只需要使用简单的支持向量机学习一次，每个测试示例在单个CPU上花费的时间小于0.3s。

重要的是，它可以很简单地应用到任何深度网络，在不需要训练数据的情况下检测到模型犯错的原因。

如果你对这种方法感兴趣，想亲自试试的话，可以戳下文链接查看。

作者介绍

James Zou ，论文通讯作者，是斯坦福大学生物医学数据科学系的助理教授，计算机科学与电气工程系的助理教授。

于 2014 年获得哈佛大学博士学位，曾是微软研究院成员、剑桥大学盖茨学者和加州大学伯克利分校西蒙斯研究员。

他的研究得到了 Sloan Fellowship、NSF CAREER Award 以及 Google、Amazon 和腾讯 AI 奖项的支持。

Abubakar Abid （前）、 Mert Yuksekgonul（后）论文第一作者，均为斯坦福大学博士生。

参考链接：

1、https://arxiv.org/pdf/2106.12723.pdf

2、https://github.com/mertyg/debug-mistakes-cce

3、https://twitter.com/james_y_zou/status/1541452062344417280

— 完 —

量子位 QbitAI · 头条号签约

","force_purephv":"0","gnid":"9807994a18a31bb6f","img_data":[{"flag":2,"img":[{"desc":"","height":"250","title":"","url":"https://p0.ssl.img.360kuai.com/t01bc86c74f408f9a9c.jpg","width":"1080"},{"desc":"","height":"450","title":"","url":"https://p0.ssl.img.360kuai.com/t01706e2970f1bccded.jpg","width":"1080"},{"desc":"","height":"720","title":"","url":"https://p0.ssl.img.360kuai.com/t01c926994fdc9f2ea6.jpg","width":"859"},{"desc":"","height":"473","title":"","url":"https://p0.ssl.img.360kuai.com/t01329eae7439ff1bd5.jpg","width":"1080"},{"desc":"","height":"289","title":"","url":"https://p0.ssl.img.360kuai.com/t013930ff0aef1c884f.jpg","width":"737"},{"desc":"","height":"962","title":"","url":"https://p0.ssl.img.360kuai.com/t01325292f7be4d6a21.jpg","width":"1104"},{"desc":"","height":"450","title":"","url":"https://p0.ssl.img.360kuai.com/t017c337d2ea5e1dd94.jpg","width":"1080"},{"desc":"","height":"1284","title":"","url":"https://p0.ssl.img.360kuai.com/t01353d3e3f2dd59140.jpg","width":"922"},{"desc":"","height":"580","title":"","url":"https://p0.ssl.img.360kuai.com/t010ae524697e63dedc.jpg","width":"1156"}]}],"original":0,"pat":"mass_adver_offline,art_src_3,fts0,sts0","powerby":"hbase","pub_time":1656824280000,"pure":"","rawurl":"http://zm.news.so.com/43313ca6db364a5ff5edaca7fcf3fdef","redirect":0,"rptid":"556fc0ac18683092","s":"t","src":"量子位","tag":[{"clk":"ktechnology_1:斯坦福大学","k":"斯坦福大学","u":""},{"clk":"ktechnology_1:斑马","k":"斑马","u":""},{"clk":"ktechnology_1:斯坦福","k":"斯坦福","u":""}],"title":"斑马识别成狗，AI犯错的原因被斯坦福找到了丨开源

寿荆淑2110如何鉴别日本进口笔的真假 -
柳翟江18770798790 ______ 看价格啦~~ 日本进口的最便宜的也要5元,绝对不会低于4.5 再看笔上面写的是不是那几个牌子而且笔头是不锈钢的,重一些(有些笔盖大的、按动的是塑料的) 其实这些笔一般都不会是假的

寿荆淑2110在中国买的日本笔(如斑马、三菱等)真的是在日本制造的吗? -
柳翟江18770798790 ______ 理论上来说凡是是上面有标明“japan”“made in japan”的应该都是日本笔但是也不排除XXX的可能不过这不是重点我们需要的是优质的书写工具我一直信不过晨光的... 所以一笔袋子都是uni zebra pilot pentel 还有tombo

寿荆淑2110＂PILOT＂笔如何辩真伪? -
柳翟江18770798790 ______ ＂PILOT＂笔特点:用其所写的字迹能透过笔杆末端的胶粒擦拭. Pilot Frixion能透过笔杆末端的胶粒擦拭.Pilot Frixion的墨水在65°C或以上变成透明,而以胶粒擦拭可将纸张加热至65°C以上.墨水会于零下10°C重现.

寿荆淑2110什么是斑马笔 -
柳翟江18770798790 ______ 不贵重很便宜斑马的墨水有点怪怪的一沾水就变墨绿色其实和记号笔一样的只要不沾水

寿荆淑2110广东考生除了用斑马牌的签字笔作答外,还有什么笔可以推荐下啊. -
柳翟江18770798790 ______ 我擦...打了半天的家伙居然给度娘吞了 PS:我的小号,现在换号玩... 三菱的笔也可以用于高考的,但是如果是电脑阅卷的话,千万不要买0.38的笔,毕竟电脑阅卷用极细的话,就会导致电脑上看不清或者看的非常累,那你就自求多福吧..... 大型书店的笔其实也不一定是真的,很多时候很多中间商都不知道自己到底卖的是真的还是假的.我就是在这第一手货源的地方,对这些比较清楚.不过有个白色标签的确是要有的. 如果不喜欢用斑马的,那就用三菱的咯,高考就用UB-150和UB-155不错,我推荐这两款,特别是三菱UB-155耐水性水笔,我每次大型的会议等都是用这款,就是不能换笔芯,用了就要废掉了.... ><

寿荆淑2110斑马会员卖的东西都是正品吗?用过的来说说吧? -
柳翟江18770798790 ______ 那是当然的了,我从去年开始在斑马会员买过不少东西了,家里用的,身上穿的,还有一些护肤品,都是正品啊,而且价格也比较划算,感觉比通过其他的渠道买到的要便宜,质量也不错.

寿荆淑2110斑马笔有什么好处 -
柳翟江18770798790 ______ ＂斑马＂牌笔是一个国家品牌,有签字笔、钢笔、毛笔、画笔等等!因为其厂家没有什么广告宣传,所以现在只有少数人知道了.签字笔主要是以:均匀、不断线不透纸(与纸品的好坏有关)、无异味...

寿荆淑2110怎样辨别真假2B铅笔? -
柳翟江18770798790 ______ 1、商标钢印字迹.真品商标图案清晰明了,轮廓饱满,钢印字迹整体协调、端正,呈雪白色,且每支都整齐划一;假品商标图案模糊不清.钢印字迹轮廓模糊,颜色呈淡白色或灰白色,字体大小不一. 2、外观.真品六角、圆形等形状正确,...

寿荆淑2110什么牌子的油漆笔最好用?斑马还是日本樱花? -
柳翟江18770798790 ______ 其实斑马和樱花都是日本进口的.至于好不好用,这个没有绝对的,有人认为斑马的好用,有人则认为樱花的好用,其实,只要你买到是正品,基本上的话,都没什么区别的.我个人的话,斑马的效果更倾向于工业和单位的使用,毕竟斑马能够...

寿荆淑2110我今天买了一只ZEBRA的自动铅笔求高人分辨真假 -
柳翟江18770798790 ______ 就光凭一张照片你认为能分清真假么,做工啊,质感啊都很重要.再说了,你觉得好用就行了,ZEBRA的圆珠笔用的比较多,铅笔还真没什么可以说的.

（编辑：自媒体）