久久黄色级2电影,由爱可奈AⅤ在线播放,亚洲在中文无码精品久久久

主頁 > 知識庫 > pytorch固定BN層參數的操作

pytorch固定BN層參數的操作

背景：

基于PyTorch的模型，想固定主分支參數，只訓練子分支，結果發現在不同epoch相同的測試數據經過主分支輸出的結果不同。

原因：

未固定主分支BN層中的running_mean和running_var。

解決方法：

將需要固定的BN層狀態設置為eval。

問題示例：

環境：torch：1.7.0

# -*- coding:utf-8 -*-
import torch
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, 3)
        self.bn1 = nn.BatchNorm2d(6)
        self.conv2 = nn.Conv2d(6, 16, 3)
        self.bn2 = nn.BatchNorm2d(16)
        # an affine operation: y = Wx + b
        self.fc1 = nn.Linear(16 * 6 * 6, 120)  # 6*6 from image dimension
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 5)

    def forward(self, x):
        # Max pooling over a (2, 2) window
        x = F.max_pool2d(F.relu(self.bn1(self.conv1(x))), (2, 2))
        # If the size is a square you can only specify a single number
        x = F.max_pool2d(F.relu(self.bn2(self.conv2(x))), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

def print_parameter_grad_info(net):
    print('-------parameters requires grad info--------')
    for name, p in net.named_parameters():
        print(f'{name}:\t{p.requires_grad}')

def print_net_state_dict(net):
    for key, v in net.state_dict().items():
        print(f'{key}')

if __name__ == "__main__":
    net = Net()

    print_parameter_grad_info(net)
    net.requires_grad_(False)
    print_parameter_grad_info(net)

    torch.random.manual_seed(5)
    test_data = torch.rand(1, 1, 32, 32)
    train_data = torch.rand(5, 1, 32, 32)

    # print(test_data)
    # print(train_data[0, ...])
    for epoch in range(2):
        # training phase, 假設每個epoch只迭代一次
        net.train()
        pre = net(train_data)
        # 計算損失和參數更新等
        # ....

        # test phase
        net.eval()
        x = net(test_data)
        print(f'epoch:{epoch}', x)

運行結果：

-------parameters requires grad info--------
conv1.weight: True
conv1.bias: True
bn1.weight: True
bn1.bias: True
conv2.weight: True
conv2.bias: True
bn2.weight: True
bn2.bias: True
fc1.weight: True
fc1.bias: True
fc2.weight: True
fc2.bias: True
fc3.weight: True
fc3.bias: True
-------parameters requires grad info--------
conv1.weight: False
conv1.bias: False
bn1.weight: False
bn1.bias: False
conv2.weight: False
conv2.bias: False
bn2.weight: False
bn2.bias: False
fc1.weight: False
fc1.bias: False
fc2.weight: False
fc2.bias: False
fc3.weight: False
fc3.bias: False
epoch:0 tensor([[-0.0755, 0.1138, 0.0966, 0.0564, -0.0224]])
epoch:1 tensor([[-0.0763, 0.1113, 0.0970, 0.0574, -0.0235]])

可以看到：

net.requires_grad_(False)已經將網絡中的各參數設置成了不需要梯度更新的狀態，但是同樣的測試數據test_data在不同epoch中前向之后出現了不同的結果。

調用print_net_state_dict可以看到BN層中的參數running_mean和running_var并沒在可優化參數net.parameters中

bn1.weight
bn1.bias
bn1.running_mean
bn1.running_var
bn1.num_batches_tracked

但在training pahse的前向過程中，這兩個參數被更新了。導致整個網絡在freeze的情況下，同樣的測試數據出現了不同的結果

Also by default, during training this layer keeps running estimates of its computed mean and variance, which are then used for normalization during evaluation. The running estimates are kept with a defaultmomentumof 0.1. source

因此在training phase時對BN層顯式設置eval狀態：

if __name__ == "__main__":
    net = Net()
    net.requires_grad_(False)

    torch.random.manual_seed(5)
    test_data = torch.rand(1, 1, 32, 32)
    train_data = torch.rand(5, 1, 32, 32)

    # print(test_data)
    # print(train_data[0, ...])
    for epoch in range(2):
        # training phase, 假設每個epoch只迭代一次
        net.train()
        net.bn1.eval()
        net.bn2.eval()
        pre = net(train_data)
        # 計算損失和參數更新等
        # ....

        # test phase
        net.eval()
        x = net(test_data)
        print(f'epoch:{epoch}', x)

可以看到結果正常了：

epoch:0 tensor([[ 0.0944, -0.0372, 0.0059, -0.0625, -0.0048]])
epoch:1 tensor([[ 0.0944, -0.0372, 0.0059, -0.0625, -0.0048]])

補充：pytorch---之BN層參數詳解及應用(1,2,3)(1,2)?

BN層參數詳解（1，2）

一般來說pytorch中的模型都是繼承nn.Module類的，都有一個屬性trainning指定是否是訓練狀態，訓練狀態與否將會影響到某些層的參數是否是固定的，比如BN層(對于BN層測試的均值和方差是通過統計訓練的時候所有的batch的均值和方差的平均值)或者Dropout層(對于Dropout層在測試的時候所有神經元都是激活的)。通常用model.train()指定當前模型model為訓練狀態,model.eval()指定當前模型為測試狀態。

同時，BN的API中有幾個參數需要比較關心的，一個是affine指定是否需要仿射，還有個是track_running_stats指定是否跟蹤當前batch的統計特性。容易出現問題也正好是這三個參數：trainning，affine，track_running_stats。

其中的affine指定是否需要仿射，也就是是否需要上面算式的第四個，如果affine=False則γ=1,β=0 \gamma=1,\beta=0γ=1,β=0，并且不能學習被更新。一般都會設置成affine=True。(這里是一個可學習參數)

trainning和track_running_stats，track_running_stats=True表示跟蹤整個訓練過程中的batch的統計特性，得到方差和均值，而不只是僅僅依賴與當前輸入的batch的統計特性（意思就是說新的batch依賴于之前的batch的均值和方差這里使用momentum參數，參考了指數移動平均的算法EMA）。相反的，如果track_running_stats=False那么就只是計算當前輸入的batch的統計特性中的均值和方差了。當在推理階段的時候，如果track_running_stats=False，此時如果batch_size比較小，那么其統計特性就會和全局統計特性有著較大偏差，可能導致糟糕的效果。

應用技巧：（1，2）

通常pytorch都會用到optimizer.zero_grad() 來清空以前的batch所累加的梯度，因為pytorch中Variable計算的梯度會進行累計，所以每一個batch都要重新清空一次梯度，原始的做法是下面這樣的：

問題：參數non_blocking,以及pytorch的整體框架??

代碼（1）

for index,data,target in enumerate(dataloader):
    data = data.cuda(non_blocking=True)
    target = torch.from_numpy(np.array(target)).float().cuda(non_blocking = Trye)
    output = model(data)
    loss = criterion(output,target)
    
    #清空梯度
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

而這里為了模仿minibacth,我們每次batch不清0，累積到一定次數再清0，再更新權重：

for index, data, target in enumerate(dataloader)：
    #如果不是Tensor，一般要用到torch.from_numpy()
    data = data.cuda(non_blocking = True)
    target = torch.from_numpy(np.array(target)).float().cuda(non_blocking = True)
    output = model(data)
    loss = criterion(data, target)
    loss.backward()
    if index%accumulation == 0:
        #用累積的梯度更新權重
        optimizer.step()
        #清空梯度
        optimizer.zero_grad()

雖然這里的梯度是相當于原來的accumulation倍，但是實際在前向傳播的過程中，對于BN幾乎沒有影響，因為前向的BN還是只是一個batch的均值和方差，這個時候可以用pytorch中BN的momentum參數，默認是0.1，BN參數如下，就是指數移動平均

x_new_running = (1 - momentum) * x_running + momentum * x_new_observed. momentum

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

pytorch 如何自定義卷積核權值參數
pytorch交叉熵損失函數的weight參數的使用
Pytorch 統計模型參數量的操作 param.numel()
pytorch 一行代碼查看網絡參數總量的實現
pytorch查看網絡參數顯存占用量等操作
pytorch 優化器(optim)不同參數組,不同學習率設置的操作
pytorch LayerNorm參數的用法及計算過程

標簽：駐馬店常州宿遷六盤水江蘇成都山東蘭州

巨人網絡通訊聲明：本文標題《pytorch固定BN層參數的操作》，本文關鍵詞 pytorch,固定,層,參數,的,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《pytorch固定BN層參數的操作》相關的同類信息！

pytorch固定BN層參數的操作

背景：基于PyTorch的模型，想固定主分支參數，只訓練子分支，結果發現在不同epoch相同的測試數據經過主分支輸出的結果不同。原因：未固定主分支BN層中的running_mean和running_var。解...

10-18

上半年重慶市服務外包執行額達4.7億美元增長169%

重慶頻道消息 6月30日,記者從"2013重慶市服務貿易工作會"上獲悉,今年上半年我市服務外包執行額達4.7億美元,同比增長169%。此...

10-22

Ruby中的block、proc、lambda區別總結

在規則引擎中，Ruby 的閉包使用特別頻繁，而且有 block，Proc和 lambda 等后幾種形式的用法，很讓人困惑。為了深入理解代碼，...

10-18

AI電話機器人是騙局嗎（ai電話智能機器人）

本文目錄一覽：1、ai電話詐騙是怎么回事兒?2、如何預防利用AI電話詐騙的騙局?3、ai電話詐騙,是真的嗎?4、江蘇鎮江一騙子用...

06-20

廊坊電銷卡好用嗎

廊坊電銷卡好用嗎 "本公司是一家專業做電銷卡的通訊公司！十年行業經驗為為您保駕護航！卡種多，歸屬地齊全。滿足不同...

12-15

合肥智能電銷網絡線路辦理服務商-誠信合作

合肥智能電銷網絡線路辦理服務商它不只能提高企業的營銷效率，還能幫助企業提高服務效率，除此之外，企業搭建智能電銷...

01-16

精確定位店位置多少錢？精確定位位置？

北京現代4s店裝gps定位多少錢？如果需要可以去汽配城和GPS公司安裝，記著要軟件客戶端、賬號和密碼。你可以貨比三家，一...

11-26

有準確率很高的空號檢測軟件嗎？

怎么解決手機空號這一麻煩事呢，用手機空號檢測就能解決，現在手機空號檢測的軟件在網上一搜出來的太多，一時之間不知...

12-03

云外呼系統質量

外呼系統是一種具有完善防封功能以及客戶管理后臺的系統，目前電銷行業現在面臨的問題就是現在封號問題嚴重，不管用哪...

11-27

win7升級win8.1后360瀏覽器打不開了怎么辦？

原先安裝win7系統換為win8.1update（win8應該適用），之前安裝在D盤的360極速/安全瀏覽器無法打開，可使用此方法。軟件名稱：...

10-20

嘉興不封號呼叫中心軟件多少錢,呼叫中心軟件辦理費用-信譽保證

嘉興不封號呼叫中心軟件多少錢,呼叫中心軟件辦理費用預計電銷機器人將會大規模運用，智能電銷機器人的市場份額將逐步...

12-17

現在最火的餐飲加盟項目有哪些？你覺得現在餐飲行業好做嗎？

2018年最火的餐飲加盟店之貝克士漢堡現在社會的生活方式都是快節奏的，人們會為了節省更多的時間而去選擇快餐。然而漢...

12-14

400電話辦理一年多少錢？解析金錢背后的談判技巧、價格構成、影響因素和節省策略-400電話辦

在商業社會中，電話交流作為最直接的聯系方式，一直被視為商業合作的重要手段。而在以客戶為中心的營銷模式中，400電話...

07-21

win8圖片庫加入圖片的方法介紹

Win8系統中的Metro界面真是灰常漂亮啊，我就喜歡在這界面下用不過可以用的軟件真是少。Metro界面中的相片下的圖片庫，你打...

10-20

電銷機器人未來趨勢圖分析（機器人銷售前景）

本文目次一覽： 1、AI智能電銷呆板人阛阓前景如何樣？ 2、德律風發售將來的走向是什么？ 3、中科嘉智電銷呆板人將來的發...

11-26

商標注冊人的權利和義務

（一）商標注冊人的權利商標注冊人的權利主要是指對注冊商標所享有的專用權。我國《商標法》規定：經商標局核準注冊...

10-23

大理州電銷機器人培訓（電銷機器人話術劇情）

本文目錄一覽： 1、學習工業機器人到哪里學啊？2、電銷機器人究竟多少錢？價格往來不斷怎樣這么大3、有誰用過電銷機器...

04-22

巨人科技如何來管理員工

任何公司對自己員工的管理工作都是非常重要的，只有我們真正的做好各個方面的管理，你就會發現其實所有的事情都能夠有...

05-15

銀川智能外呼系統價格（外呼系統收費）

本文目錄一覽： 1、外呼體系裝置須要哪些用度？ 2、召喚焦點或外呼體系哪種又廉價又好的啊 3、智能外呼體系幾何錢？ 4、...

11-26

在正規平臺辦理電銷卡的好處

選擇電話營銷時，重要的及時電話卡了，但是使用普通的電話卡因為電話的數量較多就很容易被封，那么就需要去辦理電銷卡...

12-04

智能外呼系統對接網關（智能外呼系統對接網關有什么用）

今天給各位分享智能外呼系統對接網關的知識，其中也會對智能外呼系統對接網關有什么用進行解釋，如果能碰巧解決你現在...

11-06

電銷行業大革命，電銷機器人到底帶來了什么

電銷領域革命，電銷機器人究竟帶給了哪些在2017年電銷領域早已進入了一個乏力的環節：大家抵觸電銷的電話，只需已接...

01-15

ai外呼電話機器人（ai外呼機器人費用）

本文目錄一覽： 1、這個獵星AI智能外呼機器人好用嗎？2、ai智能電話機器人有什么作用？3、AI語音機器人有哪些好處4、智...

11-27

一鍵呼救911呼叫中心！Uber推出呼叫功能提高救援效率

據境外媒體報道，讓報警電話時用戶的定位變得更準確，這不僅是在優化應急流程，更可能是在生死關頭提高救援效率。FC...

10-19

viewport.exe進程是什么意思

進程文件： viewport or viewport.exe 進程名稱： ATI/Appian HydraVision Desktop Manager 進程類別：存在安全風險的進程英文描述： viewpo...

10-19

重慶高院終審判決假冒“簡單搜索”網站賠償百度80萬元

來源：中國知識產權資訊網一個域名為“baidu”的搜索網站，卻被法院判決賠償百度公司80萬元。這究竟是為何？ “百度推...

10-23

電話智能機器人怎么樣，到底有沒有效果

人工客服收到工作時間、效率以及工作量的限制，已經無法完全適應部分企業的呼叫業務。通過AI智能軟件系統的協助，完成...

07-12

干洗商標該如何選擇合適的類別呢？

所謂三百六十五行行行出狀元，現在社會工種也是特別多，只要想的出到，都是有市場的，很多人買的衣服都是品牌，自己又...

10-23

突發：剛剛，美國官方宣布“封殺”中國移動！！！移動公司重磅回應...

12-04

手機坐席與PC端云呼叫中心有哪些區別

疫情期間坐席受制于網絡條件或者沒帶電腦，手機坐席是坐席居家辦公的一種新方式，適合沒有電腦或者更愿意使用手機的坐...

12-07

400電話的智能網平臺是怎么回事

對于400電話這樣的一種業務，很多人是不了解的，甚至不知道這樣一種業務的存在，畢竟自己從來沒有接觸過這樣一種類型的...

05-16

消費級物聯網專用卡14103怎么激活（電信物聯卡14104激活）

141號段是電信物聯卡號段，作為目前物聯網市場上最大的物聯卡運營商，電信物聯卡其卡片的穩定性和質量得到的一致好評。...

11-07

10-23

靚車spavip會所企業彩鈴錄音

您好，歡迎致電靚車spavip會所。我們以專業的技術，為您的愛車提供汽車美容、精品裝具、鍍晶、鍍膜、防爆膜、封釉等專業...

11-27

建立品牌美謄度的策略

品牌競爭是市場競爭在經歷了價格、質量、服務等各方面的較量之后進入的一個新階段。品牌與產品不同，它強調系統性和全...

10-23

辦400電話需要多少錢開通一個400電話需要多少錢？

400電話由主電話和被電話分擔，即400電話承擔市政電話接入費，被電話承擔所有400電話接聽費。影響400電話價格的因素很多...

01-12

windows2000下C盤權限設置

1.選取整個硬盤： system：完全控制 administrator：完全控制 (允許將來自父系的可繼承性權限傳播給對象) 2/programfiles/commonfiles：...

10-20

什么是客服外包，怎么挑選靠譜公司合作？

什么是客服外包？客服外包，是指企業將客服工作交由其他企業負責，客服外包類型主要有：售前咨詢、售后服務等。這對...

01-16

寧波教育AI電話機器人辦理價格-放心省心

寧波教育AI電話機器人辦理價格進員工難以跟進。流失率居高不下：銷售工作單調乏味，流失率居高不下。現在對于很多的傳...

01-16

電銷卡公司封號咋辦

對于電話銷售人員來說，他們每天都要使用手機卡撥打電銷電話，可以說呼出頻率是非常高的，如果使用三大運營商發行的手...

12-16

陽江智能外呼系統（ai智能外呼系統銷售）

本文目錄一覽： 1、自動外呼系統是什么，使用自動外呼營銷系統違法嗎？ 2、什么是智能外呼營銷系統？求詳細解答 3、自動...

11-24

聯通116114為廣交會客商提供無憂服務

第109屆廣交會期間，廣東聯通整合了116114業務的酒店機票預訂、交通顧問等服務，為廣交會客商提供無憂服務。據悉，1161...

10-19

西安5G電話線路詳情-專業服務

西安5G電話線路詳情因此，對于從事電銷業的企業，或對某些從事電話銷售的企業來說，智能電銷機器人是一個好的選擇。目...

01-15

400電話漏接短信功能意義有多大?

當企業漏接掉一個電話，400電話客服會在一定時間給企業發去漏接短信，這就很大程度上降低了企業漏接電話而造成的損失。...

12-22

客服中心服務量話量預測入門

服務預測與排班是大部分服務行業有效管理的關鍵環節，尤其是客服中心，對服務預測準確度要求高，對排班的舒適性和效率...

10-22

福州房產電話呼叫軟件在哪可以辦理,電銷系統-[熱門]

福州房產電話呼叫軟件在哪可以辦理,電銷系統因為電話營銷機器人可以更好的進行智能交流，所以就會讓廣大客戶的好感度...

12-17

Python基礎之hashlib模塊詳解

目錄一、hashlib簡介二、hash對象的方法三、hashlib實際操作四、小小案例一、hashlib簡介 1.什么叫hash: hash是一種算法（不同...

10-18

電銷顧客資源怎么找？

電銷顧客資源怎么找？在電話銷售過程中，正確的尋找到意向顧客是我們做電話銷售人員的關鍵的一步。電話銷售人員在每...

10-24

易才博普奧為全球最大中文書籍零售商提供整體人力資源外包服務

CTI論壇(ctiforum)6月30日消息（記者楊佳林）：人力資源外包專家、服務外包產業專業人才租賃供應商---北京易才博普奧管理顧...

10-19

重慶電銷機器人代勞

匯港通自決研制鑒于大數據、云計劃的產物。扶助大中小企業提率，提高管理，優化運維。移動crm經過大數據、云計劃調整云...

10-31

淺談400電話企業客服的有力工具

現在各行各業的發展都離不開互聯網，企業更是如此，現在越來越多的企業開始了網絡營銷的征程，都想讓自己的業務在互聯...

12-22

pytorch固定BN層參數的操作

10-18

本頁收集關于pytorch固定BN層參數的操作的相關信息資訊供網民參考！

推薦文章

上一篇：python列表數據增加和刪除的具體實例

下一篇：Python多線程與多進程相關知識總結

一起分享吧

亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

pytorch固定BN層參數的操作

背景：

原因：

解決方法：

問題示例：

BN層參數詳解（1，2）

應用技巧：（1，2）