早报网

網站地圖 - 關于我們
您的當前位置: 首頁 > 業界 > 分析 正文

GPU之后,NPU再成標配,手機、PC如何承載AI大模型?

作者:用戶投稿 時間:2024-03-13 18:13 點擊:
導讀:

  摘要:AI產品開發者需要先行一步,早一些讓用戶體驗自己的產品,和用戶建立連接,培養粘性,從而在競爭中占得先機。

  2024注定是AI行業熱鬧非凡的一年。雖然剛剛進入3月份,但是關于AI的新聞已經多次占據了頭條。就在上個月,OpenAI了文字生成視頻的大模型Sora,其逼真的效果直接清空了在這個細分賽道苦苦耕耘的創業者。幾天后,英偉達市值站上2萬億美元,成為了上最快實現從1萬億到2萬億美元市值的企業。正所謂"當你發現金礦,最好的生意不是挖礦而是賣鏟子",英偉達成為了AI時代"備競賽"的最大贏家。

  就在大家感嘆"世界上只有兩種AI,一種叫OpenAI,一種叫其他AI"的時候,沉寂了許久的Anthropic放出王炸,這家由OpenAI前研究副總裁創立的公司,了最新的Claude3模型,各項指標已經全面超越了GPT4。

  AI行業的風起云涌,也昭示了這個行業還處在一個初級階段。技術迭代太快,暫時領先的企業可能在一夜之間就被新技術顛覆。一些眼花繚亂的新技術,雖然已經問世,但遲遲不公開或者沒有。比如上文提到的Sora,截至,還沒有正式向公眾開放。

  生成式AI的研發和本地之間存在鴻溝。目前,大眾使用的生成式AI產品往往是在云端而在本地訪問(比如ChatGPT網頁),但這無法滿足所有需求,并且會產生一些隱患。

  首先,隨著大模型越來越復雜,云端和本地之間的傳輸在有限帶寬下變得捉襟見肘,比如一架波音787飛機每秒鐘產生5G的數據,如果上傳到云端、計算、輸出結果再返回,飛機可能已經飛出去幾公里了(按照800公里/小時估算)。如果在飛機上使用AI功能但是在云端,這樣的傳輸速度是無法滿足要求的。

  此外,一些用戶敏感數據、隱私數據,是否一定要上云?顯然放在本地比云端更讓用戶放心。

  不論生成式AI多么強大,如何到本地始終是一個無法繞開的問題。這是行業發展的趨勢,雖然目前面臨一些困難。

  困難在于,如何把"大模型"裝入"小設備"。注意,這里的"大小"是相對而言的。云端計算的背后可能是一個占地幾萬平方米的計算中心,而本地卻要讓生成式AI在你的手機上跑起來。手機沒有液氮冷卻,也沒有無窮無盡的電力,該如何AI呢?

  異構計算,一種可能的解決方案?

  高通的異構計算AI引擎(以下皆稱作高通AI引擎)為行業提供了一種可行的解決方案。即通過CPU、GPU、NPU以及高通傳感器中樞和內存子系統的協作,實現了AI和大幅度提升AI體驗的目的。

  

1710207019121032.png

  圖:專門的工業設計讓不同計算單元更緊湊 來源:高通

  不同類型的處理器所擅長的工作不同,異構計算的原理就是讓"專業的人做專業的事"。CPU擅長順序控制,適用于需要低延時的應用場景,同時,一些較小的傳統模型如卷積神經網絡模型(CNN),或一些特定的大語言模型(LLM),CPU處理起來也能得心應手。而GPU更擅長面向高精度格式的并行處理,比如對畫質要求非常高的視頻、游戲。

  CPU和GPU出鏡率很高,大眾已經相當熟悉,而NPU相對而言更像一種新技術。NPU即神經網絡處理器,專門為實現低功耗、加速AI推理而打造。當我們在持續使用AI時,需要以低功耗穩定輸出高峰值性能,NPU就可以發揮最大優勢。

  舉個例子,當用戶在玩一款重負載的游戲,此時GPU會被完全占用,或者用戶在瀏覽多個網頁,CPU又被完全占用。此時,NPU作為真正的AI專用引擎就會負擔起和AI有關的計算,保證用戶的AI體驗流暢。

  總結起來說就是,CPU和GPU是通用處理器,為靈活性而設計,易于編程,本職工作是負責操作系統、游戲和其他應用。NPU則為AI而生,AI是它的本職工作,通過犧牲部分易編程特性而實現了更高的峰值性能和能效,一路為用戶的AI體驗護航。

  當我們把 CPU、GPU、NPU 以及高通傳感器中樞和內存子系統集成在一起,就是異構計算架構。

  

1710207027131493.png

  圖:高通AI引擎包括Hexagon NPU、Adreno GPU、高通Oryon或 Kryo CPU、高通傳感器中樞和內存子系統 來源:高通

  高通AI引擎整合了高通 Oryon 或 Kryo CPU、 Adreno GPU 、 Hexagon NPU 以及高通傳感器中樞和內存子系統。Hexagon NPU作為其中的組件,經過多年的升級迭代,目前已達到業界領先的AI處理水平。以手機平臺為例,集成高通 AI 引擎的第三代驍龍 8 支持行業領先的LPDDR5x內存,頻率高達4.8GHz,使其能夠以非常高速的芯片內存讀取速度運行大型語言模型,如百川、Llama 2等,從而實現非??斓膖oken生成速率,為用戶帶來全新的體驗。

  

1710207035151743.png

  圖:NPU隨著不斷變化的AI用例和模型持續演進,實現高性能低功耗 來源:高通

  高通對NPU的研究,并不是近幾年才開始的。如果要追溯Hexagon NPU的起源,要回到2007年,也就是生成式AI走入公眾視野的15年前。高通的首款Hexagon DSP在驍龍平臺上亮相,DSP控制和標量架構成為了高通未來多代NPU的基礎。

  8年后,也就是2015年,驍龍820處理器集成了首個高通AI引擎;

  2018年,高通在驍龍855中為Hexagon NPU增加了張量加速器;

  2019年,高通在驍龍865上擴展了終端側AI用例,包括AI成像、AI視頻、AI語音等功能;

  2020年,Hexagon NPU迎來變革型架構更新。標量、向量、張量加速器融合,這為高通未來的NPU架構奠定了基礎;

  2022年,第二代驍龍8中的Hexagon NPU引入了一系列重大技術提升。微切片技術提升了內存效率,功耗降低繼續降低并且實現了4.35倍的AI性能提升。

  2023年10月25日,高通正式第三代驍龍8。作為高通技術公司首個專為生成式AI而精心打造的移動平臺,其集成的Hexagon NPU是目前高通面向生成式AI最新、也是最好的設計。

  由于高通為AI開發者和下游廠商提供的是全套解決方案(這部分內容會在第三部分詳細敘述),并非單獨提供芯片或者某個軟件應用。這意味著在硬件設計上和優化上,高通可以通盤考慮,找出目前AI開發的瓶頸,做有針對性地提升。

  比如,為何要特別在意內存帶寬這個技術點?當我們把視角從芯片上升到AI大模型開發,就會發現內存帶寬是大語言模型token生成的瓶頸。第三代驍龍8的NPU架構之所以能幫助加速開發AI大模型,原因之一便在于專門提升了內存帶寬的效率。

  這種效率的提升主要受益于兩項技術的應用。

  第一是微切片推理。通過將神經網絡分割成多個獨立執行的微切片,消除了高達10余層的內存占用,此舉最大化利用了Hexagon NPU中的標量、向量和張量加速器并降低功耗。第二是本地4位整數(INT4)運算。它能將INT4層和神經網絡和張量加速吞吐量提高一倍,同時提升了內存帶寬效率。

  

1710207042908590.png

  圖:第三代驍龍8的Hexagon NPU以低功耗實現更佳的AI性能

  2月26日,世界移動通信(MWC 2024)在巴塞羅那拉開帷幕?;隍旪圶 Elite,高通向全世界展示了全球首個在終端側運行的超過70億參數的大型多模態語言模型(LMM)。該模型可接收和音頻輸入(如音樂、交通環境音頻等),并基于音頻內容生成多輪對話。

  所以,在集成了Hexagon NPU的移動終端上,會有怎樣的AI體驗?以及它是如何做到的?高通詳細拆解了一個案例。

  借助移動終端的AI旅行助手,用戶可以直接對模型提出規劃旅游行程的需求。AI助手可以立刻給到航班行程,并且通過語音對話調整輸出結果,最后通過Skyscanner插件創建完整航班日程。

  這種一步到位的體驗是如何實現的?

  第一步,用戶的語音通過自動語音識別(ASR)模型Whisper轉化成。該模型有2.4億個參數,主要在高通傳感器中樞上運行;

  第二步,利用Llama 2或百川大語言模型基于內容生成回復,這一模型在Hexagon NPU上運行;

  第三步,通過在CPU上運行的開源TTS(Text to Speech)模型將轉化為語音;

  最后一步,通過調制解調器技術進行網絡連接,使用Skyscanner插件完成訂票操作。

  行業井噴前夕,開發者需要搶占先機

  使用不同的工具測試驍龍和高通平臺的AI性能表現,可以發現其得分比同類競品高出幾倍。從魯AIMark V4.3基準測試結果來看,第三代驍龍8的總分相較競品B高出5.7倍,而相較競品C高出7.9倍。

  在安兔兔AITuTu基準測試中,第三代驍龍8的總分比競品B高出6.3倍。針對MLCommon MLPerf推理的不同子項,包括圖像分類、語言理解以及超級分辨率等,也進行了詳盡的比較。

  

1710207049795939.png

  進一步對比驍龍X Elite與其他X86架構競品,在ResNet-50、DeeplabV3等測試中,驍龍X Elite表現出明顯的領先地位,其基準測試總分分別是X86架構競品A的3.4倍和競品B的8.6倍。因此,在PC端,無論是運行Microsoft Copilot,還是進行文檔摘要、文檔撰寫等生成式AI應用,體驗都十分流暢。

  

1710207057195443.png

  領先的AI性能不全是高通AI引擎的功勞,確切的說,高通對AI廠商的賦能是全方位的。

  首先是高通AI引擎。它包括Hexagon NPU、Adreno GPU、高通Oryon CPU(PC平臺)、高通傳感器中樞和內存子系統。專門的工業設計、不同部件之間良好的協同,這款異構計算架構為終端側產品提供了低功耗、高能效的開發平臺。

  基于先進的硬件,高通又推出了AI軟件棧(高通AI Stack)。這款產品的誕生是為了解決AI開發中的頑疾——同一個功能,針對不同平臺要多次開發,重復勞動。AI Stack支持目前所有的主流AI框架,OEM廠商和開發者可以在平臺上創建、優化和AI應用,并且能實現"一次開發,全平臺",減少了研發人員的重復勞動。

  

1710207063156616.png

  圖:高通AI軟件棧幫助開發者"一次開發,全平臺" 來源:高通

  此外,還有高通在MWC2024上剛剛的AI Hub。AI Hub是一個包含了近80個AI模型的模型庫,其中既有生成式AI模型,也有傳統AI模型,還包括圖像識別或面部識別模型,百川、Stable Diffusion、Whisper等模型。開發者可以從AI Hub中選取想要使用的模型生成二進制插件,做到AI 開發的"即插即用"。

  

1710207070107739.png

  綜合來說,如果縱向看深度,高通在硬件(AI引擎)、軟件(AI Stack)和素材庫(AI Hub)三個維度全面加速廠商的AI開發進度。橫向看覆蓋廣度,高通的產品已經覆蓋了幾乎所有的終端側設備(第三代驍龍8支持手機等終端,X Elite賦能AI PC產品)。

  AI應用處于井噴前的醞釀期。

  在教育領域,AI能針對學生的學能力和進度制定個性化的教學方案;在醫學領域, AI可以用來發掘全新的抗生素類型;在養老方面,未來在一些社會老齡化問題比較嚴重的地區,可以利用AI終端收集老年人家中的所有個人數據,從而幫助預防緊急醫療。

  之所以叫"井噴前",正是因為還沒有大規模。另一方面,AI應用,作為最容易讓用戶產生粘性的產品之一,具有很強的先發優勢效應。

  AI產品開發者需要先行一步,早一些讓用戶體驗自己的產品,和用戶建立連接,培養粘性,從而在競爭中占得先機。

  (文章轉載自DeepTech深科技)

   廣告

打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網 版權所有
蘇ICP備2024138443號

蘇公網安備32130202081338號

本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.m.amdoc.cn互聯網違法和不良信息舉報中心
Top 主站蜘蛛池模板: 订做不锈钢_不锈钢定做加工厂_不锈钢非标定制-重庆侨峰金属加工厂 | LCD3D打印机|教育|桌面|光固化|FDM3D打印机|3D打印设备-广州造维科技有限公司 | 江苏全风,高压风机,全风环保风机,全风环形高压风机,防爆高压风机厂家-江苏全风环保科技有限公司(官网) | 日本SMC气缸接头-速度控制阀-日本三菱伺服电机-苏州禾力自动化科技有限公司 | 翰香原枣子坊加盟费多少钱-正宗枣核糕配方培训利润高飘香 | 玻璃钢罐_玻璃钢储罐_盐酸罐厂家-河北华盛节能设备有限公司 | 不锈钢轴流风机,不锈钢电机-许昌光维防爆电机有限公司(原许昌光维特种电机技术有限公司) | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 不锈钢搅拌罐_高速搅拌罐厂家-无锡市凡格德化工装备科技有限公司 | 百方网-百方电气网,电工电气行业专业的B2B电子商务平台 | 废气处理设备-工业除尘器-RTO-RCO-蓄热式焚烧炉厂家-江苏天达环保设备有限公司 | ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 运动木地板厂家,篮球场木地板品牌,体育场馆木地板安装 - 欧氏运动地板 | 盐城网络公司_盐城网站优化_盐城网站建设_盐城市启晨网络科技有限公司 | IHDW_TOSOKU_NEMICON_EHDW系列电子手轮,HC1系列电子手轮-上海莆林电子设备有限公司 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 除湿机|工业除湿机|抽湿器|大型地下室车间仓库吊顶防爆除湿机|抽湿烘干房|新风除湿机|调温/降温除湿机|恒温恒湿机|加湿机-杭州川田电器有限公司 | 珠海冷却塔降噪维修_冷却塔改造报价_凉水塔风机维修厂家- 广东康明节能空调有限公司 | 气力输送设备_料封泵_仓泵_散装机_气化板_压力释放阀-河南锐驰机械设备有限公司 | 浙江宝泉阀门有限公司| 变色龙PPT-国内原创PPT模板交易平台 - PPT贰零 - 西安聚讯网络科技有限公司 | 纯化水设备-EDI-制药-实验室-二级反渗透-高纯水|超纯水设备 | 顺景erp系统_erp软件_erp软件系统_企业erp管理系统-广东顺景软件科技有限公司 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 氢氧化钙设备_厂家-淄博工贸有限公司 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 壹车网 | 第一时间提供新车_资讯_报价_图片_排行! | 盐水蒸发器,水洗盐设备,冷凝结晶切片机,转鼓切片机,絮凝剂加药系统-无锡瑞司恩机械有限公司 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 全自动变压器变比组别测试仪-手持式直流电阻测试仪-上海来扬电气 | 京马网,京马建站,网站定制,营销型网站建设,东莞建站,东莞网站建设-首页-京马网 | 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 单柱拉力机-橡胶冲片机-哑铃裁刀-江都轩宇试验机械厂 | 阜阳在线-阜阳综合门户| 上海办公室装修,写字楼装修—启鸣装饰设计工程有限公司 | TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | CTAB,表面活性剂1631溴型(十六烷基三甲基溴化铵)-上海升纬化工原料有限公司 | 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 烟台螺纹,烟台H型钢,烟台钢材,烟台角钢-烟台市正丰金属材料有限公司 | 电位器_轻触开关_USB连接器_广东精密龙电子科技有限公司 | 硅胶布|电磁炉垫片|特氟龙胶带-江苏浩天复合材料有限公司 |