侵權投訴

對標英偉達勝算幾何?這家AI芯片獨角獸首次全面揭開神秘面紗……

墨記 ? 來源:電子發燒友網 ? 作者:張慧娟 ? 2020-06-19 10:01 ? 次閱讀

AI訓練市場,不乏躍躍欲試想挑戰英偉達霸主地位的廠商。不過,英偉達GPU仍是當前全球大規模商用部署的頭號玩家。其次,Google的TPU通過內部應用及TensorFlow占據第二大生態規模。
?
要知道,一顆AI芯片從開發定義到落地部署,中間存在著巨大的鴻溝,特別是算法越來越復雜、模型越來越大,AI芯片面臨著算力的嚴峻考驗,最終要在數據中心批量部署,能夠成功的廠商鳳毛麟角。
?
不過,來自于底層的顛覆性創新正在悄然改變著格局。Graphcore,這家成立于2016年、來自于英國的AI芯片公司,通過創新的IPU處理器技術,已經開始在全球數據中心批量應用,躋身于該市場第三梯隊。
?
5月27日,在Intelligent Health峰會上,微軟機器學習科學家Sujeeth Bharadwaj分享了在攻克新冠病毒時的一項研究,在訓練CXR(胸部X射線檢查)模型時,用Graphcore IPU處理器和英偉達 V100同時運行微軟COVID-19影像分析算法SONIC,最終的結果可能令所有人大跌眼鏡:IPU在30分鐘內完成了V100需5個小時的訓練工作量!
?
這家年輕的公司,由此再次引起了業界的關注。日前,Graphcore面對<電子發燒友>等行業媒體,首次在中國市場全面揭開了其創新背后的核心技術及最新業務進展,以及在中國市場的布局等。

為什么傳統的處理器架構需要被顛覆?

Graphcore高級副總裁兼中國區總經理盧濤(Jason Lu)介紹稱,AI時代的機器智能代表的是全新的計算負載,不同于傳統計算的特點有:它是非常大規模的并行計算;數據結構非常稀疏;相較于傳統的科學計算或高性能計算(HPC),AI/機器智能是低精度計算;另外在訓練、推理過程中的數據參數復用、靜態圖結構等,都是AI應用全新計算負載的典型代表。
盧濤 Jason Lu
Graphcore高級副總裁兼中國區總經理
?
整個AI算法模型的演變,基本上從2016年1月份的ResNet50的2500萬個參數,發展到2018年10月份BERT-Large的3.3億個參數,而到了2019年發展到GPT2的15.5億個參數,增長幅度非常大。甚至,現在一些領先的科研機構和AI研究者在探索更大的算法模型,能夠訓練更復雜的算法,來提高精度。密集計算并不是可持續的方法,譬如算法模型參數要從15.5億規模擴展到一萬億,這種指數級的增長,需要成倍的算力提升。Graphcore認為,傳統處理器無法很好地應對這些變化,因此市場需要一種顛覆式的創新架構。
?
傳統的處理器架構,如CPU是針對應用和網絡進行設計的標量處理器,GPU是以向量處理為核心的、針對圖形和高性能計算的處理器。而AI是全新的應用架構,底層是以計算圖作為表征的,且從整個AI發展方向來看,大規模、稀疏化的數據會越來越多,因此,Graphcore針對這些發展趨勢設計了一種全新的處理器架構。
?

全世界最復雜的擁有236億個晶體管的芯片處理器

目前為止,機器學習的算力來源主要還是傳統的處理器,它們的算力提升也非常快。不過,峰值算力和有效算力是兩回事,這其中,內存帶寬成為掣肘
?
當處理器算力提高了10倍,內存如何相應提高10倍的性能呢?盧濤介紹,如果用傳統的DDR4、DDR5、HBM、HBM1、HBM2、HBM3等內存,基本上每一代能有30%或40%的提升,因此,這對傳統架構是一個非常大的挑戰。
?
相較于傳統CPU、GPU,IPU采用了大規模并行MIMD(多指令多數據)處理器核,通過緊密耦合的大型本地分布式SRAM,在片內能夠做到300MB SRAM。相對CPU的DDR2子系統或GPU的GDDR、HBM來說,IPU能夠實現10到320倍的性能提升。這樣帶來的好處是,能夠將模型和數據放在片內處理,從時延的角度來看,與訪問外存相比較,時延僅為1%。
?
通過采用大規模分布式的片上SRAM架構,IPU處理器將所有memory都放在片上,解決了當前機器學習中大量出現的內存帶寬所造成的瓶頸。
??
目前,基于這一創新架構的IPU處理器GC2已量產,采用TSMC 16nm工藝,號稱是世界上最復雜的擁有236億個晶體管的芯片處理器
?
GC2片內有1216個IPU-Tiles,每個Tile有獨立的IPU核心作為計算以及In-Processor-Memory(處理器之內的內存),總共有7296個線程,能夠支持7296個程序并行運行。對整片來說,In-Processor-Memory總共是300MB,PCIe是16個PCIe Gen 4。
?
而在各個核心之間,Graphcore通過BSP同步協議,能夠支持同一個IPU處理器內1216個核心之間的通信,以及跨不同的IPU之間進行通信。另外,在IPU和IPU之間,擁有80個IPU-Links,總共有320GB/s的chip to chip的帶寬。正因如此,IPU處理器可以同時支持訓練和推理。

從目前所公布的指標來看,在自然語言處理、圖像分類、金融模型訓練等方面,IPU在現有及下一代的模型上,性能均領先于GPU:在自然語言處理方面的速度能夠提升20%到50%;在圖像分類方面,能夠有6倍的吞吐量且時延更低;在金融模型方面,訓練速度能夠提高26倍以上。目前,IPU在云上、在一些客戶的自建數據中心的服務器上已經投產應用。
?
而在場景應用方面,IPU采用分組卷積的方式也體現出了獨有優勢,特別是針對更為稀疏化的數據時。
?
盧濤分享了眾多AI創新者、算法科學家、AI應用開發者日常工作中遇到的一大問題:當算法模型在GPU上運行速度非常慢的時候,通常被認為是算法或軟件問題。他指出,如果算法模型不是用稠密的卷積,而是用較為稀疏的卷積比如Fully depthwise做的,那么在GPU上運行得慢的根本原因是GPU架構不符合算法特點,因此采用IPU能夠提供更好的支持。
?
他解釋稱,Graphcore設計了一個分組卷積內核的micro-benchmark,將組維度(group dimension)分成從1到512來比較,這里512就是應用得較多的“Dense卷積網絡”,典型應用如ResNet。此時,IPU GC2性能甚至比英偉達V100要高近一倍。隨著稠密程度降低、稀疏化程度增加,在組維度為1或32時,針對EfficientNet或MobileNet,IPU對比GPU展現出巨大優勢,做到成倍的性能提升,同時時延大大降低。
?

創新架構需要軟硬協同設計

IPU所采用的片上存儲架構,確實是未來計算結構的發展方向之一,但從芯片設計和應用角度而言,這是一大挑戰。
?
片上存儲通常有兩種架構,一是在片上規劃單塊大規模的存儲,這種方式通常會導致良品率極低。另一種架構就是Graphcore這樣的分布式片上存儲架構。但這又帶來了新的挑戰:如何把分布式存儲架構有效利用起來?這對編譯器的要求非常高,可以說是軟件、硬件協同設計的過程。要做出能夠真正落地的產品,最核心的挑戰就是軟硬件兩方面的專業知識和經驗。
?
為了提升芯片的可用性,以及便于用戶和開發者更方便地在系統中進行開發、移植、優化,Graphcore將產品擴展到囊括龐大的部署軟件和基礎架構套件,通過Poplar SDK給用戶提供更好的體驗。而這通常是頭部廠商如英偉達在推進GPU大規模應用時才有的舉動。
?
Poplar SDK是架構在機器學習上的框架軟件(比如TensorFlow、ONNX、PyTorch和PaddlePaddle)和硬件之間的一個基于計算圖的整套工具鏈和庫。Poplar SDK支持容器化部署,能夠快速啟動并運行。在標準生態方面,Poplar SDK支持Docker、Kubernetes、以及微軟的Hyper-v等虛擬化技術和安全技術。在操作系統方面,Poplar SDK目前支持最主要的三個Linux發行版:ubuntu、RedHat Enterprise Linux、CentOS。
?
今年5月,Graphcore還推出了PopVision Graph Analyser分析工具,用戶可以通過這個可視化的圖形展示工具來分析軟件運行情況、調試效率。
?
目前基于IPU的一些應用已覆蓋到機器學習的各個應用領域,包括自然語言處理、圖像/視頻處理、時序分析、推薦/排名及概率模型。一些應用案例和模型已經在TensorFlow、ONNX和Graphcore的PopART上可用,所有源代碼都可以在GitHub處下載。
?

新冠疫情下“小兵”立大功

當前,全球都希望更高效地攻克新冠疫情中的難題。這時,AI在高清醫學影像領域就體現出了重要價值。
?
第一,疫情發展非常快,不斷有新的病例、影像和數據產生,這就要求現有的模型要不斷根據新的情況來提高精度。
?
第二,疫情造成全球醫療資源緊缺。放射影片往往需要富有經驗的醫生進行判斷,而在資源緊張的情況下,AI工具可以幫助更多醫生獲得更專業的判斷力。
?
第三,全球都迫切需要攻克病毒的研究成果,如何提高研究效率至關重要。
?
Graphcore中國銷售總監朱江,就本文開頭所提到的微軟訓練CXR(胸部X光射線檢查)的應用案例,詳細介紹了IPU與英偉達 V100的對比情況。
朱江
Graphcore中國銷售總監
?
微軟專門開發了SONIC CV模型進行訓練,IPU和GPU的訓練結果對比如下圖:左邊是訓練時間,IPU優勢明顯。右邊紅色曲線代表訓練時精度上升的情況,藍色曲線代表測試精度。可以看到測試精度和訓練精度較為接近甚至吻合,這也說明SONIC模型在泛化性能上更好,在針對未知的新數據方面,其處理能力比微軟傳統的EfficientNet模型更好。整體上,SONIC的模型通過30分鐘的訓練達到94%的訓練精度和測試精度,訓練速度方面,IPU需要30分鐘,而GPU差不多需要5個小時。
?
通過這一訓練,微軟認為能夠訓練到SOTA的精度的模型不一定是大模型,可以用小模型來達到這樣的精度要求。另外,IPU的MIMD架構非常適用于以分組卷積為代表的新模型。
?
據了解,目前微軟已采用IPU來進行計算機視覺中分類方面的訓練,能達到一個數量級的速度提升。未來,微軟期望把IPU在CV領域的應用擴展到更多方面,包括監測、分割以及配準。

創新帶給Graphcore的底氣

迄今為止,Graphcore獲得了AI領域多位重量級人物的背書。
?
英國半導體之父、Arm聯合創始人Hermann爵士認為:“在計算機歷史上只發生過三次革命,一次是70年代的CPU,第二次是90年代的GPU,而Graphcore就是第三次革命。”意指其率先提出了為AI計算而生的IPU。
?
AI教父Geoff Hinton教授在接受Wired采訪時,被問到 “我們應該如何構建功能更像大腦的機器學習系統”時,從錢包中掏出了一個又大又亮的硅片,并回答說:“我們需要轉向不同類型的計算機來處理新的機器學習系統。”他認為Graphcore的IPU正在滿足這樣的系統需求。


迄今為止,Graphcore總融資超過4.5億美金,其中包括全球知名的金融投資者和戰略投資者。

不論是技術本身所帶來的創新地位,還是大佬的站臺或融資歷程,Graphcore的履歷都堪稱漂亮。
?
不過,作為一家初創企業,Graphcore直面的都是業界巨擘。強如英偉達,也已經感受了種種威脅,正在加速創新。上個月,英偉達推出了基于Ampere架構的NVIDIA A100,將AI訓練和推理性能提高20倍,可以說是英偉達GPU迄今為止最大的性能飛躍。
?
對于未來的競爭,Graphcore方面信心滿滿。盧濤表示,雖然目前對比的都是與V100這樣的大量部署的旗艦級產品,但即使是第一代IPU產品也不會輸于A100,且下一代IPU處理器也將有重磅發布。
?
未來的推進策略,Graphcore還是會在訓練和推理兩方面并行,聚焦對高精度、低時延、高吞吐量要求更高的場景。另外還有一個趨勢是訓練和推理混布的需求,例如視頻平臺、電商網站等希望通過算法同時進行訓練和推理,能夠根據用戶數據實時更新算法模型;未來的汽車應用也是訓練和推理混布的場景,都將有一定的增長。

積極擁抱中國AI生態圈

在中國,Graphcore剛與兩大頭部客戶有了重大進展。
?
一是阿里巴巴新的開放式深度學習API ODLA(Open Deep Learning API)支持Graphcore IPU,某種程度上,這也反映了數據中心對IPU的計算需求正在增長。
?
二是成為百度飛槳(PaddlePaddle)硬件生態圈共建計劃伙伴之一,這一合作使Graphcore進入了中國深度學習開源框架的生態系統中,觸及百萬以上的AI開發者。
?
盧濤表示,Graphcore正在積極擁抱中國的AI生態圈,中國市場未來有望占據其全球市場的40%甚至50%

本文由電子發燒友網原創,未經授權禁止轉載。如需轉載,請添加微信號elecfans999.

收藏 人收藏
分享:

評論

相關推薦

性能提升20倍!NVIDIA A100 GPU打破16項AI芯片性能記錄

2020年7月30日,MLPerf組織發布第三個版本MLPerf Trainingv0.7基準測試(....
的頭像 Carol Li 發表于 07-31 08:03 ? 33次 閱讀
性能提升20倍!NVIDIA A100 GPU打破16項AI芯片性能記錄

NVIDIA已經與ARM達成了潛在交易

該報告還補充說,NVIDIA的收購報價有可能無法實現,ARM可能會選擇公開上市。如果收購成功,那么它....
的頭像 倩倩 發表于 07-29 16:23 ? 368次 閱讀
NVIDIA已經與ARM達成了潛在交易

OPPO Find X2 / X2 Pro在中國獲得GPU驅動程序更新

 Oppo Find X2 / Find X2 Pro的GPU驅動程序更新當前僅限于設備的中文版本。....
的頭像 倩倩 發表于 07-29 09:21 ? 174次 閱讀
OPPO Find X2 / X2 Pro在中國獲得GPU驅動程序更新

NVIDIA通知三季度GPU芯片供應量僅為70%水平

7月28日消息,據最新爆料,NVIDIA已經通知AIC廠商8月到10月份GPU供應量只有上季度的70....
的頭像 Carol Li 發表于 07-29 08:51 ? 910次 閱讀
NVIDIA通知三季度GPU芯片供應量僅為70%水平

AI芯片的十字路口 未來發展大方向

在芯片領域,X86架構可以說定義了PC時代;Arm則在移動端一枝獨秀。但隨著芯片自主化、定制化的需求....
發表于 07-24 16:48 ? 246次 閱讀
AI芯片的十字路口 未來發展大方向

用于下一代汽車專用集成電路(ASIC)的嵌入式現場可編程邏輯門陣列(eFPGA)

用于下一代汽車專用集成電路(ASIC)的嵌入式現場可編程邏輯門陣列(eFPGA)
發表于 07-24 11:26 ? 240次 閱讀
用于下一代汽車專用集成電路(ASIC)的嵌入式現場可編程邏輯門陣列(eFPGA)

臺積電超級計算AI芯片將至 16nm工藝加速晶片級計算

據外媒EXTREMETECH消息,臺積電將建造超級計算AI芯片,從而加速晶片級計算。
發表于 07-23 17:33 ? 104次 閱讀
臺積電超級計算AI芯片將至 16nm工藝加速晶片級計算

低至70μW | 國芯發布超低功耗AI芯片,助力智能穿戴「芯」升級

隨著人工智能技術的發展,AI語音的滲透率越來越高,從智能音箱,到語音家電,再到智能車載,AI已經無處....
發表于 07-22 14:15 ? 242次 閱讀
低至70μW | 國芯發布超低功耗AI芯片,助力智能穿戴「芯」升級

FPGA取代AI加速器中的GPU

AI軟件初創公司Mipsology正在與Xilinx合作,以使FPGA能夠僅使用一個附加命令即可替換AI加速器
的頭像 物聯網評論 發表于 07-21 15:14 ? 685次 閱讀
FPGA取代AI加速器中的GPU

智慧穿戴,從芯啟航 | 邀您見證超低功耗AI芯片的誕生!

面對眾多智能穿戴場景下的AI落地難題,國芯將在7月21日發布全新AI芯片以及一站式解決方案,直擊痛點....
發表于 07-21 11:15 ? 145次 閱讀
智慧穿戴,從芯啟航 | 邀您見證超低功耗AI芯片的誕生!

寒武紀助推了全球首款人工智能手機芯片的誕生

寒武紀首次公開募股的發行價為64.39元/股,發行價為250元/股,總市值一度超過1000億。截至鈦....
發表于 07-20 15:50 ? 631次 閱讀
寒武紀助推了全球首款人工智能手機芯片的誕生

為什么寒武紀無疑是AI計算芯片初創企業中資金實力最雄厚之一

寒武紀董事長、CEO陳天石此前曾表示:“作為一家中立的芯片公司,我們走最正統的芯片設計公司的路徑,把....
發表于 07-20 14:29 ? 258次 閱讀
為什么寒武紀無疑是AI計算芯片初創企業中資金實力最雄厚之一

Untether AI宣布已完成由Radical Ventures牽頭

Untether AI總裁兼首席執行官Arun Iyengar表示:“我們投資者的持續支持,標志著我....
的頭像 倩倩 發表于 07-20 09:03 ? 771次 閱讀
Untether AI宣布已完成由Radical Ventures牽頭

英特爾第二代FinFET芯片,有利于開發更好的CPU/GPU/調制解調器設計

在提升的各項指標當中,更低的發熱量將是英特爾能否順利進入智能手機及平板電腦市場的關鍵。因為的體積小、....
的頭像 我快閉嘴 發表于 07-18 11:04 ? 546次 閱讀
英特爾第二代FinFET芯片,有利于開發更好的CPU/GPU/調制解調器設計

ARM架構的GPU和臺式機的GPU有什么區別

1:移動GPU(指的是ARM處理器集成的GPU)和獨立的PC的GPU的區別?除了架構,就拿視頻解碼來說,為什么ARM的處理...
發表于 07-18 08:04 ? 0次 閱讀
ARM架構的GPU和臺式機的GPU有什么區別

如何使用OpenCL輕松實現FPGA應用編程

實現這一編程思想的轉變,是因為 FPGA 借助 OpenCL 實現了編程,程序員只需要通過 C/C+....
發表于 07-16 17:58 ? 127次 閱讀
如何使用OpenCL輕松實現FPGA應用編程

醫生希望他們的新機器人助手留下來

但是基爾南說,像紫羅蘭這樣的機器已經幫助解決了這些問題,在危機時刻證明了它們的價值。就像其他醫生Th....
的頭像 倩倩 發表于 07-16 14:53 ? 433次 閱讀
醫生希望他們的新機器人助手留下來

Graphcore發布第二代IPU及IPU-M2000 三大顛覆性技術定義AI計算的未來

無論您是要使用單個IPU還是要使用數千個IPU來完成機器智能工作負載,Graphcore的Popla....
發表于 07-16 09:02 ? 168次 閱讀
Graphcore發布第二代IPU及IPU-M2000 三大顛覆性技術定義AI計算的未來

Imagination:用領先IP技術加速中國IC設計創新和應用落地

在7月3日下午,Imagination中國區市場及業務發展高級經理鄭魁在視頻采訪直播間接受了的采訪,....
的頭像 荷葉塘 發表于 07-15 13:53 ? 2003次 閱讀
Imagination:用領先IP技術加速中國IC設計創新和應用落地

中科院投資寒武紀天使輪,四年股權收益超20000倍

國內AI芯片一直是一個熱門創投方向,幾家AI芯片明星公司,寒武紀、地平線、深鑒科技紛紛先后獲得融資。....
的頭像 CEO創客 發表于 07-14 14:57 ? 3465次 閱讀
中科院投資寒武紀天使輪,四年股權收益超20000倍

Imagination Technologies宣布推新型GPU,可用于智能汽車儀盤表

據外媒報道,總部位于英國倫敦的Imagination Technologies公司宣布推出XS系列圖....
發表于 07-14 12:36 ? 112次 閱讀
Imagination Technologies宣布推新型GPU,可用于智能汽車儀盤表

一種同時解決目標獨立光柵化和可變頻率的像素著色器的通用實現方法

D3D12為了兼顧圖像質量和硬件性能,對反走樣算法提出了更高的要求—VRS(Variable Rat....
的頭像 集成電路應用雜志 發表于 07-14 11:00 ? 266次 閱讀
一種同時解決目標獨立光柵化和可變頻率的像素著色器的通用實現方法

疫情控制為何風景這邊獨好?六大高管破解智能識別+AI測溫防疫關鍵點

圍繞智能感知最新技術趨勢,熱成像和紅外探測器技術流派,端邊協同的多邊測溫方案、AI算法以及智能硬件如....
的頭像 章鷹 發表于 07-13 07:41 ? 2765次 閱讀
疫情控制為何風景這邊獨好?六大高管破解智能識別+AI測溫防疫關鍵點

研華SKY-6420-4U高密度GPU服務器,IPMI監控系統確保GPU的穩定性

過去的兩年里,研華著手布局AI領域,將自己定位為一個全面的人工智能平臺解決方案提供商。為此,研華推出....
發表于 07-12 09:47 ? 233次 閱讀
研華SKY-6420-4U高密度GPU服務器,IPMI監控系統確保GPU的穩定性

2020年第三屆AI大會圓滿成功,最新IP/芯片/方案/生態加速AI落地

2020年7月10日,由全球電子科技領域專業媒體電子發燒友 舉辦的第三屆2020年人工智能大會盛大開....
的頭像 Carol Li 發表于 07-11 13:50 ? 2364次 閱讀
2020年第三屆AI大會圓滿成功,最新IP/芯片/方案/生態加速AI落地

重磅揭曉!電子發燒友2020年度首屆“中國人工智能卓越創新獎”名單正式出爐

2020年7月10日,深圳訊由全球電子科技領域專業媒體電子發燒友舉辦的第三屆2020年人工智能大會圓....
的頭像 Carol Li 發表于 07-10 16:59 ? 2883次 閱讀
重磅揭曉!電子發燒友2020年度首屆“中國人工智能卓越創新獎”名單正式出爐

產業獨家調研|AI落地是什么在“卡脖子”?34%企業僅三成項目成功部署,26%出貨增長不足一成!

今年上半年通過多維度的梳理和一線交流,以及超過1000份有效調查問卷,完成了行業首份覆蓋芯片/開發平....
的頭像 墨記 發表于 07-10 09:08 ? 2181次 閱讀
產業獨家調研|AI落地是什么在“卡脖子”?34%企業僅三成項目成功部署,26%出貨增長不足一成!

AI芯片為載體的計算力是人工智能發展水平的重要衡量標準

“無芯片不 AI”,以 AI 芯片為載體的計算力是人工智能發展水平的重要衡量標準,我們將對AI芯片作....
發表于 07-09 16:29 ? 350次 閱讀
AI芯片為載體的計算力是人工智能發展水平的重要衡量標準

高通推驍龍865 Plus處理器,GPU圖形渲染速度提升10%

7月8日晚,高通公司正式宣布推出全新的驍龍865 Plus處理器,該款處理器相對驍龍865而言,性能....
的頭像 牽手一起夢 發表于 07-09 14:46 ? 606次 閱讀
高通推驍龍865 Plus處理器,GPU圖形渲染速度提升10%

兆芯公布一份詳細路線圖,國產計算機搭載國產獨立顯卡將成可能

說到國產獨立顯卡,對于大家來說可能是距離國產CPU更為遙遠的產品,好在這幾年國產龍芯3號已經漸成起色....
的頭像 牽手一起夢 發表于 07-09 14:39 ? 504次 閱讀
兆芯公布一份詳細路線圖,國產計算機搭載國產獨立顯卡將成可能

Cerebras Systems展示了 AI 芯片 WSE

據了解,半導體廠商 Cerebras Systems 在去年 8 月份展示了一款世界上最大的芯片——....
發表于 07-09 10:25 ? 320次 閱讀
 Cerebras Systems展示了 AI 芯片 WSE

Graphcore發布IPU開發者云 積極擁抱中國的AI生態系統

借助IPU開發者云,創新者可以使自己的算法任務直達IPU,避開傳統硬件的限制陷阱,使得自己的算法模型....
發表于 07-09 09:26 ? 265次 閱讀
Graphcore發布IPU開發者云 積極擁抱中國的AI生態系統

臺積電推出的超級計算AI芯片進入商業化,機器學習將邁入新臺階

此次臺積電計劃生產的AI芯片,其實是由一家初創人工智能公司Cerebras Systems在去年推出....
的頭像 我快閉嘴 發表于 07-09 08:47 ? 366次 閱讀
臺積電推出的超級計算AI芯片進入商業化,機器學習將邁入新臺階

GPU加速的L0范數圖像平滑(L0 Smooth)【CUDA】

GPU 加速的 L0 范數圖像平滑(L0 Smooth)【CUDA】
發表于 07-08 12:10 ? 25次 閱讀
GPU加速的L0范數圖像平滑(L0 Smooth)【CUDA】

臺積電或將生產Cerebras的“超級”AI芯片

臺積電在推出3D SoIC后端服務后,還開發了主要用于超級計算AI芯片的InFO_SoW(晶圓上系統....
發表于 07-08 11:56 ? 231次 閱讀
臺積電或將生產Cerebras的“超級”AI芯片

IDC:預測到2024年中國GPU服務器市場規模將達到64億美元

目前,云端AI算力主要由三類AI加速器來提供:GPU,FPGA和AI ASIC芯片。這些加速器的優點....
的頭像 我快閉嘴 發表于 07-07 10:39 ? 492次 閱讀
IDC:預測到2024年中國GPU服務器市場規模將達到64億美元

芯微AI芯片加持百度飛槳,攜手加速AI應用落地

瑞芯微Rockchip正式宣布,旗下AI芯片RK1808、RK1806適配百度飛槳(PaddlePa....
發表于 07-06 16:01 ? 84次 閱讀
芯微AI芯片加持百度飛槳,攜手加速AI應用落地

AI芯片的未來會是什么樣,將充滿著無限的可能

據OFweek電子工程網不完全統計,自2014年AI芯片創業潮以來,國內AI芯片企已超過數百家,公開....
發表于 07-03 10:36 ? 69次 閱讀
AI芯片的未來會是什么樣,將充滿著無限的可能

GPU是什么,關于vGPU在OpenStack中的應用

一、什么是GPU GPU:Graphics Processing Unit,即圖像處理單元,是一種專....
發表于 07-03 10:22 ? 335次 閱讀
GPU是什么,關于vGPU在OpenStack中的應用

海康“起舞”,訊飛“護盤”,AI兩大戰事升級

AI已經度過了發明期,進入了應用期。當技術應用進入了新階段,需要以新的心態來看待傳統企業和初創企業的....
的頭像 墨記 發表于 07-03 08:57 ? 4700次 閱讀
海康“起舞”,訊飛“護盤”,AI兩大戰事升級

如何利用ARM Mali在機器視覺技術實現應用優勢

談GPU計算的優勢,并闡述生態系統合作伙伴是如何利用ARM Mali 在各種圖像處理,多媒體和計算機....
的頭像 ARM視頻 發表于 07-02 13:13 ? 871次 觀看
如何利用ARM Mali在機器視覺技術實現應用優勢

ARM Mali OpenGL ES軟件開發工具包

Mali T600系列圖形處理器對GPU計算有著針對性設計,其不僅兼容OpenCl 1.1 Full....
的頭像 ARM視頻 發表于 07-02 13:02 ? 1194次 觀看
ARM Mali OpenGL ES軟件開發工具包

高通驍龍865可以達到桌面級的gpu水平么?

如果桌面級GPU水平是指同代的話,那么手機soc永遠也不可能追上,桌面級的GPU領先手機GPU的原因....
的頭像 如意 發表于 07-01 08:58 ? 1201次 閱讀
高通驍龍865可以達到桌面級的gpu水平么?

數據庫解決了在超級計算機的CPU上的進程安排問題

對抗某一特定蛋白質的化合物數量可達14億種,另一項測試結果表明,他們可以在短短12小時內完成對這些化....
的頭像 英偉達NVIDIA中國 發表于 06-30 14:39 ? 349次 閱讀
數據庫解決了在超級計算機的CPU上的進程安排問題

NVIDIA GPU提高了TOP500超級計算機的能效

自2019年11月以來,榜單上使用HDR InfiniBand的TOP500系統數量幾乎增加了一倍。....
的頭像 英偉達NVIDIA中國 發表于 06-30 14:34 ? 404次 閱讀
NVIDIA GPU提高了TOP500超級計算機的能效

云從科技再次入圍CB insights榜單 NB-IoT模塊降至18.5元

隨著中國5G領銜的新基建加速推進,中國蜂窩物聯網的推進也在加速,6月29日,中國移動新疆分公司發布2....
的頭像 章鷹 發表于 06-30 09:19 ? 1832次 閱讀
云從科技再次入圍CB insights榜單 NB-IoT模塊降至18.5元

青云全新升級光格網絡,賦能物聯網產業的智能化建設

物聯網平臺:可承載海量設備的接入管理,并通過云邊協同,快速構建、部署、管理邊緣業務。同時結合青云Qi....
的頭像 我快閉嘴 發表于 06-28 19:27 ? 540次 閱讀
青云全新升級光格網絡,賦能物聯網產業的智能化建設

AI芯片第一股 中科寒武紀科創板IPO注冊生效

6月24日消息,中科寒武紀科技股份有限公司、南京偉思醫療科技股份有限公司科創板IPO注冊生效,即將發....
的頭像 章鷹 發表于 06-25 09:54 ? 3435次 閱讀
AI芯片第一股 中科寒武紀科創板IPO注冊生效

全球最新TOP500超算榜單出爐!揭秘英偉達雄霸三分之二版圖的擴張之路!

全球最新的TOP500超級計算機榜單發布。排名前十的超級計算機中有8臺采用了NVIDIA的技術;TO....
的頭像 墨記 發表于 06-25 07:59 ? 4447次 閱讀
全球最新TOP500超算榜單出爐!揭秘英偉達雄霸三分之二版圖的擴張之路!

首個邊緣AI開發者社區成立,并為AI產業參與者提供全方位支持

為使合作伙伴能夠直接受益于地平線成熟的算法落地能力,探索自己在數據和算法方面的獨特價值。地平線將全面....
的頭像 我快閉嘴 發表于 06-24 19:47 ? 1028次 閱讀
首個邊緣AI開發者社區成立,并為AI產業參與者提供全方位支持

AI芯片市場風云再起,但「中國芯」的逆襲路才剛剛起步

燧原科技在小圈子里早已被人熟知:創紀錄地用 18 個月,將技術門檻最高的 AI 訓練芯片“邃思” 一....
的頭像 真格基金 發表于 06-24 16:28 ? 523次 閱讀
AI芯片市場風云再起,但「中國芯」的逆襲路才剛剛起步

智能手機顯示屏顯示的內容定義了幀速率

簡而言之,為了獲得更好的觀看體驗,顯示器的刷新率應超過內容的幀速率。因此,如果您在60 Hz或120....
的頭像 EDA365 發表于 06-24 15:56 ? 694次 閱讀
智能手機顯示屏顯示的內容定義了幀速率

二維位元陣列是否可行?

嗨,正如標題所暗示的,我想知道是否有可能制作一個2維的比特串。我需要它作為CPU和GPU之間的緩沖區。如果可能的話,那么1...
發表于 05-11 06:17 ? 112次 閱讀
二維位元陣列是否可行?

云知聲打磨四年的AI芯片出爐

云知聲打磨四年的AI芯片出爐,中國造芯勢力群起...
發表于 05-05 09:11 ? 90次 閱讀
云知聲打磨四年的AI芯片出爐

AI芯片熱潮和架構創新有什么作用

魏少軍談AI芯片熱潮和架構創新 透露清華Thinker芯片將獨立融資...
發表于 04-23 14:59 ? 116次 閱讀
AI芯片熱潮和架構創新有什么作用

在PanGu Board上運行Qt應用實戰

PanGu Board開發板是西安湃兔核科技基于STM32MP1系列處理器設計的SoC開發板,提供了HDMI、以太網、LCD、USB...
發表于 12-10 11:30 ? 3105次 閱讀
在PanGu Board上運行Qt應用實戰

華為的GPU Turbo技術你知道是什么嗎?

華為GPU Turbo揭秘,嚇人的技術,原來只是神經網絡...
發表于 11-11 06:24 ? 1289次 閱讀
華為的GPU Turbo技術你知道是什么嗎?

NVIDIA 在首個AI推理基準測試中大放異彩

Turing GPU、Xavier芯片系統在MLPerf基準測試中展現了巨大優勢 加利福尼亞州圣克拉拉市 —— 2019年11月6日 —— &...
發表于 11-08 19:44 ? 695次 閱讀
NVIDIA 在首個AI推理基準測試中大放異彩

為什么基于GPU的二維數組加法灰色的那行會出現報錯?

這是基于GPU的二維數組加法。。。然24行,就是灰色的那行,報錯too few arguments in function call,但是明明形參數和實參數...
發表于 11-05 22:15 ? 464次 閱讀
為什么基于GPU的二維數組加法灰色的那行會出現報錯?

多核處理器能夠替代FPGA嗎?

Peter認為,鑒于其高性能、易編程及低成本特點,GPGPU技術在許多情況下能夠替代FPGA和DSP ...
發表于 10-17 08:07 ? 624次 閱讀
多核處理器能夠替代FPGA嗎?
国产成 人 亚洲 欧美|在线时看乱伦视频网站|成人学生口交做爱吞精|日本r18成人手办