java如何實現卷積神經網絡CupCnn

發布時間：2021-08-13 17:05:50 來源：億速云閱讀：243 作者：小新欄目：編程語言

這篇文章主要介紹了java如何實現卷積神經網絡CupCnn，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

什么是CupCnn

CupCnn是個用java寫的卷積神經網絡，我在工作之余，為了加深對卷積神經網絡的認識，實現了它。它足夠簡潔，表現也不錯，非常適合初學者參考使用。

設計的思路

我希望它是以足夠簡單的神經網絡，這樣有利于初學者學習。所以我沒有實現那些并發加速的東西，這保證的代碼的簡介性。設計的時候，我將卷積神經網絡分為四個模塊：Network（layer blob loss active），這點可以從包名中看出來。layer,loss,active都有一個基類，整個神經網絡的編程都是面向基類的。Network是綜合這四個模塊，統籌和調度資源的中心，每個layer都會有一個Network的實例，這樣可以輕松的通過Network獲得各種數據，比如獲取每一層的輸出，diff等。
設計框圖如下：

java如何實現卷積神經網絡CupCnn

參數的保存對于java而言就非常簡單了，實現Serializable接口就可以快速實現參數的序列化和反序列化。CupCnn只對data目錄下的Blob和BlobParams兩個實現了Serializable接口，所有的參數都由這兩個實現。

目前的表現

全連接神經網絡

目前，在mnist數據集上，全連接神經網絡（全連接（100）+全連接（30）+全連接（10）+softmax），訓練30個epoes,準確率為96.76

卷積神經網絡

卷積神經網絡（6個特征）+最大值池化+卷積（6個特征）+全連接（512）+全連接（30）+全連接（10）+softmax）,在學習速率為0.2的情況下，訓練30個epoes,準確率為97.79.我相信經過進一步參數調優，在充分訓練的情況下，準確率能達到更高。

卷積神經網絡訓練快照如下：

begin train
epoe: 0 lossValue: 2.3019369891560455   lr: 0.2 accuracy is 0.13
epoe: 0 lossValue: 2.0722489482105195   lr: 0.2 accuracy is 0.44
epoe: 0 lossValue: 1.2423286194012682   lr: 0.2 accuracy is 0.72
epoe: 0 lossValue: 0.7860529560675255   lr: 0.2 accuracy is 0.79
epoe: 0 lossValue: 0.6272194196176664   lr: 0.2 accuracy is 0.87
epoe: 0 lossValue: 0.5240051326725808   lr: 0.2 accuracy is 0.84
epoe: 0 lossValue: 0.27637563581928026   lr: 0.2 accuracy is 0.95
epoe: 0 lossValue: 0.35585388987055083   lr: 0.2 accuracy is 0.92
epoe: 0 lossValue: 0.441971528417802   lr: 0.2 accuracy is 0.92
epoe: 0 lossValue: 0.25637710325999674   lr: 0.2 accuracy is 0.95
epoe: 0 lossValue: 0.39872273532502   lr: 0.2 accuracy is 0.9
epoe: 1 lossValue: 0.264085484522027   lr: 0.16000000000000003 accuracy is 0.91
epoe: 1 lossValue: 0.22754066024803088   lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.30256420975577103   lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.18149648622985948   lr: 0.16000000000000003 accuracy is 0.99
epoe: 1 lossValue: 0.177239938748327   lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.15041993009777443   lr: 0.16000000000000003 accuracy is 0.98
epoe: 1 lossValue: 0.10759545752665524   lr: 0.16000000000000003 accuracy is 1.0

CupCnn的使用

目前，CupCnn實現了mnist數據集上的測試，在src/test下，MnistTest是main函數的入口，具體的神經網絡的搭建在MnistNetwork類中。在MnistNetwork類中，buildConvNetwork和buildFcNetwork分別實現
了搭建卷積神經網絡和搭建全連接神經網絡。得益于java良好的跨平臺屬性，你下載完CupCnn的源碼后，使用eclipse打開該項目，然后直接運行，應該就能開始在mnist數據集上訓練和測試了。

構建神經網絡

  public void buildNetwork(){
    //首先構建神經網絡對象，并設置參數
    network = new Network();
    network.setBatch(100);
    network.setLoss(new LogLikeHoodLoss());
    //network.setLoss(new CrossEntropyLoss());
    optimizer = new SGDOptimizer(0.2);
    network.setOptimizer(optimizer);

    //buildFcNetwork();
    buildConvNetwork();

    network.prepare();
  }

setBatch（）函數設置一個批次里有多少張圖片。

setLoss（）設置要是用的損失函數。CupCnn實現了交叉熵損失函數和對數似然損失函數。

setOptimizer（）設置要是用的優化器。CupCnn只實現了SGD優化器，如果您實現了更好的優化器，并且愿意提交到CupCnn,那本人深表歡迎。

構建全連接神經網絡

  private void buildFcNetwork(){
    //給network添加網絡層
    InputLayer layer1 = new InputLayer(network,new BlobParams(network.getBatch(),1,28,28));
    network.addLayer(layer1);
    FullConnectionLayer layer2 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),784,1,1));
    layer2.setActivationFunc(new ReluActivationFunc());
    network.addLayer(layer2);
    FullConnectionLayer layer3 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),100,1,1));
    layer3.setActivationFunc(new ReluActivationFunc());
    network.addLayer(layer3);
    FullConnectionLayer layer4 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),30,1,1));
    layer4.setActivationFunc(new SigmodActivationFunc());
    network.addLayer(layer4);
    FullConnectionLayer layer5 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),10,1,1));
    layer5.setActivationFunc(new ReluActivationFunc());
    network.addLayer(layer5);
    SoftMaxLayer sflayer = new SoftMaxLayer(network,new BlobParams(network.getBatch(),10,1,1));
    network.addLayer(sflayer);
  }

正如上面代碼展示的一樣，每一個Layer都需要一個network,它是Network的實例，Network是全局的管理者和資源的調度者，有了Network的引用，我們可以輕易的獲得到每一層的輸出的數據，輸出的誤差等。此外，每一層都需要一個指定當前層輸出數據塊大小的參數，該參數告訴某一層你需要輸出多少數據。比如神經網絡的最后一層是SoftMaxLayer ，它需要輸出到底是哪個數字，這個數字用長度為10的向量表示，比如數字7，那么SoftMaxLayer 應該輸出第8個元素的值為1，其他元素的值為0。卷積層和池化層需要更多的參數，因為他們都有一個kernel,對卷積層而言，它叫卷積核，卷積層的實現每此每個方向的stride也就是步長都是1，這點還有改進的余地。對于池化層，你出來需要傳入池化核的參數外，還需要傳入水平方向和垂直方向的步長，這是必須的。

訓練和測試

搭建好神經網絡后，你需要調用network.prepare()方法，該方法會根據每一層的數據參數創建輸出數據塊和誤差數據塊。因此該方法的調用是必須的。

  public void train(List<DigitImage> imgList,int epoes){
    System.out.println("begin train");
    int batch = network.getBatch();
    double loclaLr = optimizer.getLr();
    for(int e=0;e<epoes;e++){
      Collections.shuffle(imgList);
      for(int i=0;i<imgList.size()-batch;i+=batch){
        List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
        double lossValue = network.train(inputAndLabel.get(0), inputAndLabel.get(1));

        if(i>batch && i/batch%50==0){
          System.out.print("epoe: "+e+" lossValue: "+lossValue+" "+" lr: "+optimizer.getLr()+" ");
          testInner(inputAndLabel.get(0), inputAndLabel.get(1));
        }
      }

      if(loclaLr>0.001){
        loclaLr*=0.8;
        optimizer.setLr(loclaLr);
      }
    }
  }

  public void test(List<DigitImage> imgList){
    System.out.println("begin test");
    int batch = network.getBatch();
    int correctCount = 0;
    int i = 0;
    for(i=0;i<imgList.size()-batch;i+=batch){
      List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
      Blob output = network.predict(inputAndLabel.get(0));
      int[] calOutLabels = getBatchOutputLabel(output.getData());
      int[] realLabels = getBatchOutputLabel(inputAndLabel.get(1).getData());
      for(int kk=0;kk<calOutLabels.length;kk++){
        if(calOutLabels[kk] == realLabels[kk]){
          correctCount++;
        }
      }
    }

    double accuracy = correctCount/(1.0*i+batch);
    System.out.println("test accuracy is "+accuracy+" correctCount "+correctCount);
  }

如上，調用Network的 train即可訓練，調用Network的predict方法即可測試。

參數的保存和加載

  public void saveModel(String name){
    network.saveModel(name);
  }

  public void loadModel(String name){
    network = new Network();
    network.loadModel(name);
    network.prepare();
  }

調用Network的saveModel和loadModel可分別實現參數的保存和加載，你只需要傳入一個文件名即可。當我們通過保存的參數創建神經網絡的時候，我們需要先new 一個Network，然后調用這個network的loadModel加載已保存的參數，然后不要忘記調用prepare方法創建每一層的輸出數據塊和誤差數據塊。

感謝你能夠認真閱讀完這篇文章，希望小編分享的“java如何實現卷積神經網絡CupCnn”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業資訊頻道，更多相關知識等著你來學習!

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

java如何實現卷積神經網絡CupCnn

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

java如何實現卷積神經網絡CupCnn

猜你喜歡

最新資訊

相關推薦

相關標簽