英偉達被「偷家」？齐新AI芯片橫空诞去世躲世　速率比GPU快十倍

发布时间：2025-12-17 10:36:24 作者：玩站小弟

芯片推理速率較英偉達GPU后退10倍、老本惟独其1/10；運止的小大模子天去世速率接远每一秒500 tokens，碾壓ChatGPT-3.5小大約40 tokens/秒的速率——短短多少天，一家名為G 。

芯片推理速率較英偉達GPU后退10倍、英偉老本惟独其1/10；運止的達被诞去小大模子天去世速率接远每一秒500 tokens，碾壓ChatGPT-3.5小大約40 tokens/秒的齐新速率——短短多少天，一家名為Groq的芯片初創公司正在AI圈爆水。

Groq讀音與馬斯克的橫空谈天機器人Grok極為接远，竖坐時間卻遠遠早於後者。世躲世速其竖坐於2016年，率比定位為一家家养智能解決妄想公司。英偉

正在Groq的達被诞去創初團隊中，有8人來自僅有10人的齐新google早期TPU中间設計團隊。好比，芯片Groq創初人兼CEO Jonathan Ross設計並實現了TPU本初芯片的橫空中间元件，TPU的世躲世速研發工做中有20%皆由他实现，之後他又减进Google X快捷評估團隊，率比為google母公司Alphabet設計並孵化了新Bets。英偉

正在Groq的創初團隊中，有8人來自僅有10人的google早期TPU中间設計團隊。（圖片來源：科創板日報）

雖然團隊脫胎於googleTPU，但Groq既沒有選擇TPU這條路，也沒有看中GPU、CPU等路線。Groq選擇了一個齐新的系統路線——LPU（Language Processing Unit，語止處理單元）。

「我們（做的）不是小大模子，」Groq展现，「我們的LPU推理引擎是一種新型端到端處理單元系統，可為AI小大模子等計算稀散型應用提供最快的推理速率。」

從這裏不難看出，「速率」是Groq的產品強調的特點，而「推理」是其主挨的細分領域。

Groq也的確做到了「快」，根據Anyscale的LLMPerf排止顯示，正在Groq LPU推理引擎上運止的Llama 2 70B，輸出tokens吞吐量快了18倍，由於其余残缺雲推理供應商。

根據Anyscale的LLMPerf排止顯示，正在Groq LPU推理引擎上運止的Llama 2 70B，輸出tokens吞吐量快了18倍，由於其余残缺雲推理供應商。（圖片來源：科創板日報）

第三圆機構artificialanalysis.ai給出的測評結果也顯示，Groq的吞吐量速率稱患上上是「遙遙領先」。

為了證明自家芯片的才气，Groq還正在夷易近網發布了免費的小大模子服務，收罗三個開源小大模子，Mixtral 8×7B-32K、Llama2-70B-4K战Mistral 7B - 8K，古晨前兩個已经開放操做。

Groq（Llama 2）對比ChatGPT（圖片來源：科創板日報援用X用戶JayScambler）

LPU旨正在克制兩個小大模子瓶頸：計算稀度战內存帶寬。據Groq介紹，正在 LLM 圆里，LPU較GPU/CPU擁有更強小大的算力，從而減少了每一個單詞的計算時間，可能更快天天去世文本序列。此外，由於消除了外部內存瓶頸，LPU推理引擎正在小大模子上的功能比GPU逾越逾越幾個數量級。

據悉，Groq芯片残缺拋開了英偉達GPU頗為倚仗的HBM與CoWoS启裝，其採用14nm製程，拆載230MB SRAM，內存帶寬達到80TB/s。算力圆里，其整型（8位）運算速率為750TOPs，浮點（16位）運算速率為188TFLOPs。

值患上看重的是，「快」是Groq芯片主挨的優點，也是其操做的SRAM最突出的強項之一。

SRAM是古晨讀寫最快的存儲設備之一，但其價格昂貴，因此僅正在要供厚道的天圆操做，好比CPU一級緩衝、两級緩衝。

華西證券指出，可用於存算一體的成去世存儲器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中，SRAM正在速率圆里战能效好比里具备優勢，特別是正在存內邏輯技術發展起來之後，具备明顯的下能效战下细度特點。SRAM、RRAM有看成為雲端存算一體主流介質。

（來源：科創板日報）

責任編輯：文劼

Tag：

河北的“罗森”事实啥去头？

2025-12-17
2024国庆档新片票房破3亿
据汇散仄台数据，妨碍10月1日9时2分，2024年国庆档新片票房出面签字映及预卖）突破3亿！
2025-12-17
@珠海工会会员，您的专属300元斲丧券已经备好→
金秋的大风沉拂国庆假期即将到去小大家是不是是皆已经筹办妥为祖国庆去世啦😄为贺喜中华人仄易远共战国竖坐75周年第四季度珠海职工村落降游行动于今日诰日10:00定时战小大家碰头⏰300元村落降仄易远宿券斲
2025-12-17
那即是中国排里！国旗呵护队步步铿锵
今日诰日10月1日）是国庆节，新中国迎去75周光阴工妇诞。天安门广场国庆降旗仪式上，国旗呵护队动做整净划一，法式铿锵有力，气派如虹！
2025-12-17
那才是咱们该遁的星·王梅云｜为有幽喷香香去
人物手刺河北省人仄易远医院副院少、医教影像钻研所所少、河北省医教影像中间主任。中国喷射教界尾位好国医教与去世物工程院会士，国内尾位国内神经血管徐病教会主席、国内医教磁共振教会理事会理事及细神成像教组主
2025-12-17
今日诰日港珠澳小大桥部蹊径段临时交通克制
总台记者从港珠澳小大桥操持局患上悉，港珠澳小大桥将于9月30日睁开综开应慢实习实习，为保障实习实习顺遂妨碍，将对于部蹊径段施止临时交通克制：一、克制时候9月30日周一）7时至12时。二、克制路段港珠澳
2025-12-17

风俗文化的现代演绎

民俗与节庆活动

文化对全球化的影响

民俗风情

风俗传承

艺术讲堂

全球文化交流

文化先锋

英偉達被「偷家」？齐新AI芯片橫空诞去世躲世　速率比GPU快十倍

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接

英偉達被「偷家」？齐新AI芯片橫空诞去世躲世 速率比GPU快十倍

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接

英偉達被「偷家」？齐新AI芯片橫空诞去世躲世　速率比GPU快十倍