您好,登錄后才能下訂單哦!
閱讀目錄:
1.開篇介紹
2.NET并行計算基本介紹
3.并行循環使用模式
3.1并行For循環
3.2并行ForEach循環
3.3并行LINQ(PLINQ)
最近這幾天在搗鼓并行計算,發現還是有很多值得分享的意義,因為我們現在很多人對它的理解還是有點不準確,包括我自己也是這么覺得,所以整理一些文章分享給在使用.NET并行計算的朋友和將要使用.NET并行計算的朋友;
NET并行編程推出已經有一段時間了,在一些項目代碼里也時不時會看見一些眼熟的并行計算代碼,作為熱愛技術的我們怎能視而不見呢,于是搗鼓了一番跟自己的理解恰恰相反,看似一段能提高處理速度的并行代碼為能起效果,跟直接使用手動創建的后臺線程處理差不多,這不太符合我們對.NET并行的強大技術的理解,所以自己搞了點資料看看,實踐了一下,發現在使用.NET并行技術的時候需要注意一些細節,這些細節看代碼是看不出來的,所以我們看到別人這么用我們就模仿這么用,我們需要自己去驗證一下到底能提高多少處理速度和它的優勢在哪里;要不然效率上不去反而還低下,查看代碼也不能很好的斷定哪里出了問題,所以還是需要系統的學習總結才行;
現在的系統已經不在是以前桌面程序了,也不是簡單的WEB應用系統,而是大型的互聯網社區、電子商務等大型系統,具有高并發,大數據、SOA這些相關特性的復雜體系的綜合性開放平臺;.NET作為市場占有率這么高的開發技術,有了一個很強大的并行處理技術,目的就是為了能在高并發的情況下提高處理效率,提高了單個并發的處理效率也就提高了總體的系統的吞吐量和并發數量,在單位時間內處理的數據量將提高不是一個系數兩個系數;一個處理我們提高了兩倍到三倍的時間,那么在并發1000萬的頂峰時時不時很客觀;
既然是.NET并行計算,那么我們首先要弄清楚什么叫并行計算,與我們以前手動創建多線程的并行計算有何不同,好處在哪里;我們先來了解一下什么是并行計算,其實簡單形容就是將一個大的任務分解成多個小任務,然后讓這些小任務同時的進行處理,當然純屬自己個人理解,當然不是很全面,但是我們使用者來說足夠了;
在以前單個CPU的情況下只能靠提高CPU的時鐘頻率,但是畢竟是有極限的,所以現在基本上是多核CPU,個人筆記本都已經基本上是4核了,服務器的話都快上20了;在這樣一個有利的計算環境下,我們的程序在處理一個大的任務時為了提高處理速度需要手動的將它分解然后創建Thread來處理,在.NET中我們一般都會自己創建Thread來處理單個子任務,這大家都不陌生,但是我們面臨的問題就是不能很好的把握創建Thread的個數和一些參數的控制,畢竟.NET并行也是基于以前的Thread來寫的,如何在多線程之間控制參數,如何互斥的執行的線程順序等等問題,導致我們不能很好的使用Thread,所以這個時候.NET并行框架為我們提供了一個很好的并行開發平臺,畢竟大環境就是多核時代;
下面我們將接觸.NET并行計算中的第一個使用模式,有很多并行計算場景,歸結起來是一系列使用模式;
并行循環模式就是將一個大的循環任務分解成多個同時并行執行的小循環,這個模式很實用;我們大部分處理程序的邏輯都是在循環和判斷之間,并行循環模式可以適當的改善我們在操作大量循環邏輯的效率;
我們看一個簡單的例子,看到底提升了多少CPU利用率和執行時間;
using System; using System.Collections.Generic; using System.Threading.Tasks; using System.Diagnostics; namespace ConsoleApplication1.Data { public class DataOperation { private static List<Order> orders = new List<Order>(); static DataOperation() { for (int i = 0; i < 9000000; i++) { orders.Add(new Order() { Oid = Guid.NewGuid().ToString(), OName = "OrderName_" + i.ToString() }); } } public void Operation() { Console.WriteLine("Please write start keys:"); Console.ReadLine(); Stopwatch watch = new Stopwatch(); watch.Start(); orders.ForEach(order => { order.IsSubmit = true; int count = 0; for (int i = 0; i < 2000; i++) { count++; } }); watch.Stop(); Console.WriteLine(watch.ElapsedMilliseconds); } public void TaskOperation() { Console.WriteLine("Please write start keys:"); Console.ReadLine(); Stopwatch watch = new Stopwatch(); watch.Start(); Parallel.ForEach(orders, order => { order.IsSubmit = true; int count = 0; for (int i = 0; i < 2000; i++) { count++; } }); watch.Stop(); Console.WriteLine(watch.ElapsedMilliseconds); } } }
這里的代碼其實很簡單,在靜態構造函數中我初始化了九百萬條測試數據,其實就是Order類型的實例,這在我們實際應用中也很常見,只不過不是一次性的讀取這么多數據而已,但是處理的方式基本上差不多的;然后有兩個方法,一個是Operation,一個是TaskOperation,前者順序執行,后者并行執行;
在循環的內部我加上了一個2000的簡單空循環邏輯,為什么要這么做后面會解釋介紹(小循環并行模式不會提升性能反而會降低性能);這里是為了讓模擬場景更真實一點;
我們來看一下測試相關的數據:i5、4核測試環境,執行時間為42449毫秒,CPU使用率為25%左右,4核中只使用了1和3的,而其他的都屬于一般處理狀態;
圖1:
我們再來看一下使用并行計算后的相關數據:i5、4核測試環境,執行時間為19927毫秒,CPU利用率為100%,4核中全部到達頂峰;
圖2:
這一個簡單的測試例子,當然我只測試了兩三組數據,基本上并行計算的速度要快于單線程的處理速度的2.1倍以上,當然還有其他因素在里面這里就不仔細分析了,起到拋磚引玉的作用;
在使用for循環的時候有相應的Parallel方式使用for循環,我們直接看一下示例代碼,還是以上面的測試數據為例;
Parallel.For(0, orders.Count, index => { // });
第一個參數是索引的開始,第二個參數是循環總數,第三個是執行體,參數是索引值;使用起來其實很簡單的;
同樣ForEach也是很簡單的,還是使用上面的測試數據為例;
Parallel.ForEach(orders, order => { order.IsSubmit = true; int count = 0; for (int i = 0; i < 2000; i++) { count++; } });
在Parallel類中有ForEach方法,第一個參數是迭代集合,第二個是每次迭代的item;
其實Parallel為我們封裝了一個簡單的調用入口,其實是依附于后臺的Task框架的,因為我們常用的就是循環比較多,畢竟循環是任務的入口調用,所以我們使用并行循環的時候還是很方便的;
首先PLINQ是只針對Linq to Object的,所以不要誤以為它也可以使用于Linq to Provider,當然自己可以適當的封裝;現在LINQ的使用率已經很高了,我們在做對象相關的操作時基本上都在使用LINQ,很方便,特別是Select、Where非常的常用,所以.NET并行循環也在LINQ上進行了一個封裝,讓我們使用LINQ的時候很簡單的使用并行特性;
LINQ核心原理的文章:http://www.cnblogs.com/wangiqngpei557/category/421145.html
根據LINQ的相關原理,知道LINQ是一堆擴展方法的鏈式調用,PLINQ就是擴展方法的集合,位于System.Linq.ParallelEnumerable靜態類中,擴展于ParallelQuery<TSource>泛型類;
System.Linq.ParallelQuery<TSource>類:
using System.Collections; using System.Collections.Generic; namespace System.Linq { // 摘要: // 表示并行序列。 // // 類型參數: // TSource: // 源序列中的元素的類型。 public class ParallelQuery<TSource> : ParallelQuery, IEnumerable<TSource>, IEnumerable { // 摘要: // 返回循環訪問序列的枚舉數。 // // 返回結果: // 循環訪問序列的枚舉數。 public virtual IEnumerator<TSource> GetEnumerator(); } }
System.Linq.ParallelEnumerable類:
// 摘要: // 提供一組用于查詢實現 ParallelQuery{TSource} 的對象的方法。 這是 System.Linq.Enumerable 的并行等效項。 public static class ParallelEnumerable
我們在用的時候只需要將它原本的類型轉換成ParallelQuery<TSource>類型就行了;
var items = from item in orders.AsParallel() where item.OName.Contains("1") select item;
Linq 的擴展性真的很方便,可以隨意的封裝任何跟查詢相關的接口;
作者:王清培
出處:http://wangqingpei557.blog.51cto.com/
本文版權歸作者和51CTO共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。