CPU 和 GPU 處理器在計算機系統中擅長不同的事情。CPU 更適合專注于執行單個任務,而 GPU 更適合同時計算復雜的數據集。以下是 CPU 和 GPU 不同的更多方式。
1. 計算中的預期功能

CPU指的是中央處理器。CPU 是對所有現代計算系統都至關重要的通用處理器,因為它執行計算機及其操作系統有效運行所需的命令和進程。因此,它通常被稱為計算機的大腦。
如前所述,CPU 包括算術邏輯單元 (ALU)、控制單元 (CU) 和存儲器。控制單元管理數據流,而 ALU 對內存提供的數據執行邏輯和算術運算。CPU 決定了程序運行的速度。
GPU是指圖形處理單元,也稱為視頻卡或圖形卡。GPU 是專門為處理圖形數據而設計和優化的處理器。因此,將圖像等數據從一種圖形格式轉換為另一種圖形格式。它還可以通過創建 2D 或 3D 圖像來渲染圖像,這在3D 打印工作流程中被廣泛使用。
2、運營重點

CPU 專注于低延遲。具有低延遲的計算機通常經過優化,可以以最小的延遲處理大量指令或數據傳輸。在 CPU 中,延遲是指設備發出請求與 CPU 完成請求之間的時間延遲,該延遲以時鐘周期為單位進行測量。
由于高速緩存未命中和未對齊,CPU 中的延遲級別可能會增加。通常,高延遲與增加的網頁加載時間和應用程序故障有關。
相比之下,GPU 側重于高吞吐量。吞吐量是指當每條指令的操作數獨立于前面的指令時,每個時鐘周期可以執行的相似指令的最大數量。內存帶寬限制、算法分支發散和內存訪問延遲可能導致低吞吐量。
3、操作功能

CPU 執行四個主要功能——獲取、解碼、執行和寫回:
Fetch是指CPU從程序存儲器中接收指令的操作。
譯碼是指通過指令譯碼器對指令進行轉換,以確定還需要CPU的哪些其他部分進行處理。
執行是指完成指令。
回寫是指將數據復制到更高級別的緩存或內存的緩存技術。
GPU 的主要功能是管理和提高視頻和圖形性能。它具有紋理貼圖、硬件覆蓋、解碼運動圖像專家組 (MPEG) 文件和數字輸出到屏幕監視器等功能。這些旨在減少工作量并生成更快的圖形。GPU 還執行與 3D 和浮點運算相關的計算。
4. 核心的使用

現代 CPU 有 2 到 18 個強大的內核,每個內核都可以在同時工作時執行不同的工作。通過稱為同時多線程處理的過程,可以將核心拆分為稱為線程的虛擬核心。例如,具有四個內核的 CPU 可以拆分為提供八個線程。
CPU 的效率隨著內核數量的增加而增加,因為它可以同時運行更多的程序并處理范圍廣泛的任務。因此,CPU 內核針對串行計算和運行數據庫管理系統 (DBMS) 進行了優化。
GPU 內核在串行計算方面比 CPU 慢,但在并行計算方面要快得多,因為它們有數千個最適合并行工作負載的較弱內核。GPU 內核是用于處理圖形操作的專用處理器。
5.串行和并行指令處理

在串行處理中,一次執行單個任務,而在并行處理中,同時執行多個任務。
在串行處理中,每個任務都使用相同的平均時間完成。使用先進先出 (FIFO) 技術完成指令。CPU 更適合串行指令處理,因為它們可以使用單個內核在完成另一個任務后執行一個任務。程序計數器確定指令的執行順序。
同時,任務被拆分到多個處理器中并行處理,以減少運行程序的時間。GPU更適合并行指令處理。GPU 的架構允許它們同時跨數據流執行大量計算。因此,提高了計算機系統的速度。并行處理旨在提高計算機系統的計算速度并增加其吞吐量。
6. 多功能性和與其他組件的交互

與 GPU 相比,CPU 更加通用。它具有更廣泛的指令范圍,可以執行許多任務。在執行指令時,CPU 還與更多計算機組件交互,例如 RAM、ROM、基本輸入/輸出系統 (BIOS)和輸入/輸出 (I/O) 端口。
相比之下,GPU 只能接收有限的指令集,只能執行與圖形相關的任務。GPU 在執行指令時與較少的計算機組件交互。通常,GPU 在確定如何在屏幕上顯示像素時只需要與顯示和內存單元交互。
七、任務的執行

盡管速度相對較慢,但 CPU 可以處理大多數消費級任務,甚至是復雜的任務。CPU 還可以處理圖形操作任務,但效率會大大降低。然而,由于任務的復雜性,CPU 在 3D 渲染方面優于 GPU。此外,CPU 具有更大的內存容量,因此用戶可以在不影響性能的情況下快速擴展至 64GB。
GPU 主要是增強圖像和渲染圖形,速度明顯快于 CPU。將 GPU 與高端計算機組件相結合,渲染圖形的速度比 CPU 快 100 倍。盡管速度很快,但 GPU 通常設計用于執行簡單和不復雜的任務。此外,GPU 的顯卡內存有限,最高可達 12GB,無法堆疊并且無法在不導致性能下降和瓶頸的情況下輕松擴展。
8. 硬件限制

由于硬件限制,CPU 制造商面臨重大障礙。1965 年,摩爾定律基于對歷史趨勢的觀察和預測而誕生,為現代數字革命奠定了基礎。該定律指出,硅芯片上的晶體管數量每兩年翻一番,而計算機的成本則減半。然而,57 年后,他的觀察可能已接近尾聲。今天,可以添加到一塊硅上的晶體管數量是有限的。盡管如此,制造商已設法使用分布式計算、量子計算機和硅替代品來克服這些硬件限制。
另一方面,GPU 制造商目前沒有面臨硬件限制。Huang 定律觀察到 GPU 的進步速度比 CPU 快得多。它還指出,GPU 的性能每兩年翻一番。
9. API 限制

應用程序編程接口 (API)是一種軟件接口,它為計算機程序提供了一種相互通信的方式。CPU 制造商對其 CPU 沒有 API 限制。數據 API 可與 CPU 無縫協作,而不會限制功能。但是,GPU 的圖形 API 有限;這些也很難調試,進一步限制了它們的應用。
OpenCL 和計算統一設備架構 (CUDA) 是最流行的 GPU 圖形渲染 API。OpenCL 是一種開源 API,適用于 AMD GPU 硬件,但在 Nvidia 硬件上運行速度非常慢。CUDA 是 Nvidia 擁有的專有 API,并針對與 Nvidia GPU 一起使用進行了優化。然而,CUDA用戶在其生態系統中的特殊性設計使得未來很難改變。
10.上下文切換延遲

上下文切換延遲是指處理單元執行進程所花費的時間。當發出帶有指令的請求時,將自動啟動依賴鏈,其中一個進程依賴于前一個進程,直到請求得到滿足。由于將信息存儲在寄存器中,CPU 在多個線程之間的切換速度較慢。相反,GPU 任務是同時執行的。這意味著沒有 warp 間上下文切換,寄存器必須保存到內存并恢復。
11.緩存方法

CPU 使用緩存有效地從內存中檢索數據以節省時間和能源。高速緩存是更小、更快的內存,更靠近(通常嵌入)CPU,用于存儲來自頻繁使用的主內存位置的數據副本。CPU 緩存由多個級別組成,通常最高為 3 級,有時為 4 級。每個級別根據訪問頻率決定是否應保留或刪除特定內存。現代 CPU 自動執行緩存管理。
值得注意的是,GPU 的本地內存結構與 CPU 類似。但是,GPU 內存具有非統一的內存訪問架構,允許程序員選擇保留哪些內存以及從 GPU 內存中刪除哪些內存。這樣可以實現更好的內存優化。
總結
中央處理器 (CPU) 和圖形處理器 (GPU) 是 PC 和大型機中最關鍵的兩個組件,沒有它們現代計算就無法運行。該領域的大多數進步——從人工智能和超級計算機到預測分析——都依賴于這兩個基礎構建塊。通過了解 CPU 和 GPU 之間的差異,個人高級用戶和 IT 決策者可以更好地利用他們的基礎架構和端點環境來獲得更好的結果。


