安全的關(guān)鍵.png)
使用這些基本 REST API 最佳實(shí)踐構(gòu)建出色的 API
卷積的概念是CNN操作的核心。卷積是一種數(shù)學(xué)運(yùn)算,它把兩個(gè)函數(shù)結(jié)合起來(lái)產(chǎn)生第三個(gè)函數(shù)。在cnn的上下文中,這兩個(gè)函數(shù)是輸入圖像和濾波器,而得到的結(jié)果就是特征圖。
卷積層包括在輸入圖像上滑動(dòng)濾波器,并計(jì)算濾波器與輸入圖像的相應(yīng)補(bǔ)丁之間的點(diǎn)積。然后將結(jié)果輸出值存儲(chǔ)在特征映射中的相應(yīng)位置。通過(guò)應(yīng)用多個(gè)過(guò)濾器,每個(gè)過(guò)濾器檢測(cè)一個(gè)不同的特征,我們可以生成多個(gè)特征映射。
Stride: Stride 是指卷積濾波器在卷積運(yùn)算過(guò)程中在輸入數(shù)據(jù)上移動(dòng)的步長(zhǎng)。
Padding:Padding是指在應(yīng)用卷積操作之前在輸入圖像或特征映射的邊界周圍添加額外像素。
Padding的目的是控制輸出特征圖的大小,保證濾波窗口能夠覆蓋輸入圖像或特征圖的邊緣。如果沒(méi)有填充,過(guò)濾器窗口將無(wú)法覆蓋輸入數(shù)據(jù)的邊緣,導(dǎo)致輸出特征映射的大小減小和信息丟失。有兩種類型的填充“valid”和“same”。
kernel/filter :kernel(也稱為filter 或 weight )是一個(gè)可學(xué)習(xí)參數(shù)的小矩陣,用于從輸入數(shù)據(jù)中提取特征。
在下圖中,輸入圖像的大小為(5,5),過(guò)濾器filter 的大小為(3,3),綠色為輸入圖像,黃色區(qū)域?yàn)樵搱D像的過(guò)濾器。在輸入圖像上滑動(dòng)濾波器,計(jì)算濾波器與輸入圖像的相應(yīng)像素之間的點(diǎn)積。Padding是valid (也就是沒(méi)有填充)。stride值為1。
特征圖是卷積神經(jīng)網(wǎng)絡(luò)(CNN)中卷積層的輸出。它們是二維數(shù)組,包含卷積濾波器從輸入圖像或信號(hào)中提取的特征。
卷積層中特征圖的數(shù)量對(duì)應(yīng)于該層中使用的過(guò)濾器的數(shù)量。每個(gè)過(guò)濾器通過(guò)對(duì)輸入數(shù)據(jù)應(yīng)用卷積操作來(lái)生成單個(gè)特征映射。
特征圖的大小取決于輸入數(shù)據(jù)的大小,卷積操作中使用的過(guò)濾器、填充和步幅的大小。通常,隨著我們深入網(wǎng)絡(luò),特征圖的大小會(huì)減小,而特征圖的數(shù)量會(huì)增加。特征圖的大小可以用以下公式計(jì)算:
Output_Size = (Input_Size - Filter_Size + 2 * Padding) / Stride + 1
這個(gè)公式非常重要,因?yàn)樵谟?jì)算輸出時(shí)肯定會(huì)用到,所以一定要記住
來(lái)自一個(gè)卷積層的特征映射作為網(wǎng)絡(luò)中下一層的輸入數(shù)據(jù)。隨著層數(shù)的增加,網(wǎng)絡(luò)能夠?qū)W習(xí)越來(lái)越復(fù)雜和抽象的特征。通過(guò)結(jié)合來(lái)自多層的特征,網(wǎng)絡(luò)可以識(shí)別輸入數(shù)據(jù)中的復(fù)雜模式,并做出準(zhǔn)確的預(yù)測(cè)。
這里我們使用TF作為框架進(jìn)行演示
## Importing libraries
# Image processing library
import cv2
# Keras from tensorflow
import keras
# In Keras, the layers module provides a set of pre-built layer classes that can be used to construct neural networks.
from keras import layers
# For ploting graphs and images
import matplotlib.pyplot as plt
import numpy as np
使用OpenCV導(dǎo)入一張iris花的圖像,并將其大小調(diào)整為224 x 224像素。
img_size = (224, 224)
file_name = "./data/archive/flowers/iris/10802001213_7687db7f0c_c.jpg"
img = cv2.imread(file_name) # reading the image
img = cv2.resize(img, img_size)
我們添加2個(gè)卷積層:
model = keras.Sequential()
filters = 16
model.add(layers.Conv2D(input_shape = (224, 224, 3),filters = filters, kernel_size= 3))
model.add(layers.Conv2D(filters = filters, kernel_size= 3))
從卷積層中獲取過(guò)濾器。
filters, bias = model.layers[0].get_weights()
min_filter = filters.min()
max_filter = filters.max()
filters = (filters - min_filter) / (max_filter - min_filter)p
可視化
figure = plt.figure(figsize= (10, 20))
filters_count = filters.shape[-1]
channels = filters.shape[0]
index = 1
for channel in range(channels):
for filter in range(filters_count):
plt.subplot(filters_count, channels, index)
plt.imshow(filters[channel, :, :, filter])
plt.xticks([])
plt.yticks([])
index+=1
plt.show()
將圖像輸入到模型中得到特征圖
normalized_img = (img - img.min()) / (img.max() - img.min())
normalized_img = normalized_img.reshape(-1, 224, 224, 3)
feature_map = model.predict(normalized_img)
特征圖需要進(jìn)行歸一化這樣才可以在matplotlib中顯示
feature_map = (feature_map - feature_map.min())/ (feature_map.max() - feature_map.min())
提取特征圖并顯示
total_imgs = feature_map.shape[0]
no_features = feature_map.shape[-1]
fig = plt.figure(figsize=(10, 50))
index = 1
for image_no in range(total_imgs):
for feature in range(no_features):
# plotting for 16 filters that produced 16 feature maps
plt.subplot(no_features, 3, index)
plt.imshow(feature_map[image_no, :, :, feature], cmap="gray")
plt.xticks([])
plt.yticks([])
index+=1
plt.show()
通過(guò)可視化CNN不同層的特征圖,可以更好地理解網(wǎng)絡(luò)在處理圖像時(shí)“看到”的是什么。例如,第一層可能會(huì)學(xué)習(xí)簡(jiǎn)單的特征,如邊緣和角落,而后面的層可能會(huì)學(xué)習(xí)更抽象的特征,如特定物體的存在。通過(guò)查看特征圖,我們還可以識(shí)別圖像中對(duì)網(wǎng)絡(luò)決策過(guò)程重要的區(qū)域。
文章轉(zhuǎn)自微信公眾號(hào)@算法進(jìn)階
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)