綜上來(lái)看,內(nèi)存和帶寬是限制證明生成的主要瓶頸。對(duì)于顯卡來(lái)說(shuō),這里的內(nèi)存指的是顯存,并不是主板上的內(nèi)存,主板上的內(nèi)存主要是參與CPU的計(jì)算。當(dāng)然目前有些芯片技術(shù)可以打通主板上的內(nèi)存和顯存,讓內(nèi)存為顯存計(jì)算來(lái)用。
在分析之前,我們先看一下ASIC(Application Specific Integrated Circuit),中文全稱是“專用集成電路”。這里特別強(qiáng)調(diào)“專用”,“專用”意味著針對(duì)單一項(xiàng)目來(lái)說(shuō)會(huì)更加有競(jìng)爭(zhēng)力。相對(duì)比,GPU(顯卡)是通用計(jì)算處理芯片,所以在單一項(xiàng)目上來(lái)說(shuō)“專用”肯定比“通用”更有競(jìng)爭(zhēng)力。
為了打破英偉達(dá)一家獨(dú)大的局面,前任全球芯片老大英特爾和多年老對(duì)手AMD對(duì)標(biāo)CUDA都分別推出了OneAPI和ROCm,Linux基金會(huì)更是聯(lián)合英特爾、谷歌、高通、ARM、三星等公司聯(lián)合成立了民間號(hào)稱“反CUDA聯(lián)盟”的UXL基金會(huì),以開(kāi)發(fā)全新的開(kāi)源軟件套件,讓AI開(kāi)發(fā)者能夠在基金會(huì)成員的任何芯片上進(jìn)行編程,試圖讓其取代CUDA,成為AI開(kāi)發(fā)者的開(kāi)發(fā)平臺(tái)。
早在2021年,英偉達(dá)就曾公開(kāi)表示過(guò)“禁止使用轉(zhuǎn)換層在其他硬件平臺(tái)上運(yùn)行基于CUDA的軟件”,2024年3月,英偉達(dá)更是將其升級(jí)為“CUDA禁令”,直接添加在了CUDA的終用戶許可協(xié)議中,已禁止用轉(zhuǎn)譯層在其他GPU上運(yùn)行CUDA軟件