本篇内容主要讲解“如何使用Keras实现图像分类中的激活热图”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Keras实现图像分类中的激活热图”吧!
类别激活图(CAM)是一种用于计算机视觉分类任务的强大技术。它允许研究人员检查被分类的图像,并了解图像的哪些部分/像素对模型的最终输出有更大的贡献。
基本上,假设我们构建一个CNN,目标是将人的照片分类为“男人”和“女人”,然后我们给它提供一个新照片,它返回标签“男人”。有了CAM工具,我们就能看到图片的哪一部分最能激活“Man”类。如果我们想提高模型的准确性,必须了解需要修改哪些层,或者我们是否想用不同的方式预处理训练集图像,这将非常有用。
在本文中,我将向你展示这个过程背后的思想。为了达到这个目的,我会使用一个在ImageNet上预训练好的CNN, Resnet50。
我在这个实验中要用到的图像是,这只金毛猎犬:
首先,让我们在这张图上尝试一下我们预训练模型,让它返回三个最有可能的类别:
fromkeras.applications.resnet50importResNet50
fromkeras.preprocessingimportimage
fromkeras.applications.resnet50importpreprocess_input,decode_predictions
importnumpyasnpmodel=ResNet50(weights='imagenet')img_path='golden.jpg'
img=image.load_img(img_path,target_size=(224,224))
x=image.img_to_array(img)
x=np.expand_dims(x,axis=0)
x=preprocess_input(x)preds=model.predict(x)
#decodetheresultsintoalistoftuples(class,description,probability)
print('Predicted:',decode_predictions(preds,top=3)[0])
如你所见,第一个结果恰好返回了我们正在寻找的类别:Golden retriver。
现在我们的目标是识别出我们的照片中最能激活黄金标签的部分。为此,我们将使用一种称为“梯度加权类别激活映射(Grad-CAM)”的技术(官方论文:https://arxiv.org/abs/1610.02391)。
这个想法是这样的:想象我们有一个训练好的CNN,我们给它提供一个新的图像。它将为该图像返回一个类。然后,如果我们取最后一个卷积层的输出特征图,并根据输出类别对每个通道的梯度对每个通道加权,我们就得到了一个热图,它表明了输入图像中哪些部分对该类别激活程度最大。
让我们看看使用Keras的实现。首先,让我们检查一下我们预先训练过的ResNet50的结构,以确定我们想要检查哪个层。由于网络结构很长,我将在这里只显示最后的block:
fromkeras.utilsimportplot_model
plot_model(model)
让我们使用最后一个激活层activation_49来提取我们的feature map。
golden=model.output[:,np.argmax(preds[0])]
last_conv_layer=model.get_layer('activation_49')
fromkerasimportbackendasK
grads=K.gradients(golden,last_conv_layer.output)[0]
pooled_grads=K.mean(grads,axis=(0,1,2))
iterate=K.function([model.input],[pooled_grads,last_conv_layer.output[0]])
pooled_grads_value,conv_layer_output_value=iterate([x])
foriinrange(pooled_grads.shape[0]):
conv_layer_output_value[:,:,i]*=pooled_grads_value[i]
heatmap=np.mean(conv_layer_output_value,axis=-1)
importmatplotlib.pyplotasplt
heatmap=np.maximum(heatmap,0)
heatmap/=np.max(heatmap)
plt.matshow(heatmap)
这个热图上看不出什么东西出来。因此,我们将该热图与输入图像合并如下:
importcv2
img=cv2.imread(img_path)
heatmap=cv2.resize(heatmap,(img.shape[1],img.shape[0]))
heatmap=np.uint8(255*heatmap)
heatmap=cv2.applyColorMap(heatmap,cv2.COLORMAP_JET)
merged=heatmap*0.4+imgplt.imshow(merged)
如你所见,图像的某些部分(如鼻子部分)特别的指示出了输入图像的类别。
到此,相信大家对“如何使用Keras实现图像分类中的激活热图”有了更深的了解,不妨来实际操作一番吧!这里是恰卡编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!