肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

當(dāng)前位置: 首頁(yè) ? 資訊 ? 熱點(diǎn) ? 正文

英偉達(dá)曝 AI 專用「核彈」:GPT速度提高 30 倍,三大云廠商搶著買

作者:鄭玄 來(lái)源: 極客公園 201603/22

3 月 21 日晚上 11 點(diǎn),英偉達(dá) CEO 黃仁勛的演講,為 GTC 2023 拉開(kāi)序幕。ChatGPT 和 GPT-4 掀起這股生成式 AI 熱潮后,為 AI 提供心臟的英偉達(dá)成了背后的大贏家,也讓今年的 GTC 注定成為有史以來(lái)最受

標(biāo)簽: AI 英偉達(dá) GPT

3 月 21 日晚上 11 點(diǎn),英偉達(dá) CEO 黃仁勛的演講,為 GTC 2023 拉開(kāi)序幕。

ChatGPT 和 GPT-4 掀起這股生成式 AI 熱潮后,為 AI 提供心臟的英偉達(dá)成了背后的大贏家,也讓今年的 GTC 注定成為有史以來(lái)最受關(guān)注的一屆。

黃仁勛沒(méi)有讓關(guān)注者失望。

「AI 的 iPhone 時(shí)刻已經(jīng)到來(lái)。」70 分鐘的演講里,老黃重復(fù)了四五遍。

每次講這句話前,他都會(huì)分享一項(xiàng)關(guān)于生成式 AI 的新進(jìn)展——對(duì)創(chuàng)作、醫(yī)療、工業(yè)等領(lǐng)域的革命,讓普通人用瀏覽器就能訓(xùn)練大模型的云服務(wù),以及讓大模型處理成本下降 10 倍的超級(jí)芯片……

「AI 的發(fā)展會(huì)超過(guò)任何人的想象。」這句話是對(duì)這場(chǎng)演講*的注腳。

01、讓大語(yǔ)言模型的處理成本下降一個(gè)數(shù)量級(jí)

2012 年,Alex Kerchevsky、Ilya Suskever 和他們的導(dǎo)師 Geoff Hinton 在兩塊 GeForce GTX 580 上,使用 1400 萬(wàn)張圖像訓(xùn)練了 AlexNet——這被認(rèn)為是這一輪 AI 革命的開(kāi)端,因?yàn)樗状巫C明了 GPU 可以用于訓(xùn)練人工智能。

4 年后,黃仁勛親手向 OpenAI 交付了*臺(tái) NVIDIA DGX 超級(jí)計(jì)算機(jī)。此后數(shù)年,OpenAI 在大型語(yǔ)言模型上的突破讓 AIGC 開(kāi)始進(jìn)入人們的視野,并在去年年底推出 ChatGPT 后徹底破圈。幾個(gè)月內(nèi)這個(gè)對(duì)話式 AI 產(chǎn)品吸引了超過(guò) 1 億用戶,成為歷史上增長(zhǎng)最快的 App。

NVIDIA DGX 最初被用作 AI 的研究設(shè)備,現(xiàn)在已經(jīng)被企業(yè)廣泛用于優(yōu)化數(shù)據(jù)和處理 AI。根據(jù)黃仁勛,財(cái)富 100 強(qiáng)公司中有一半安裝了 DGX。

在這之中,部署像 ChatGPT 這樣的 LLM 正在成為 DGX 越來(lái)越重要的一項(xiàng)工作。對(duì)此,黃仁勛宣布了一種新的 GPU——帶有雙圖形處理器 NVlink 的 H100 NVL。

基于英偉達(dá)的 Hopper 架構(gòu),H100 采用 Transformer 引擎,被設(shè)計(jì)用于專門處理類似 GPT 這樣的模型。與用于 GPT-3 處理的 HGX A100 相比,一個(gè)搭載四對(duì) H100 和 NVlink 的標(biāo)準(zhǔn)服務(wù)器的處理速度快 10 倍。根據(jù)官網(wǎng)數(shù)據(jù),H100 的綜合技術(shù)創(chuàng)新??梢詫⒋笮驼Z(yǔ)言模型的速度提高 30 倍。

「H100 可以將大型語(yǔ)言模型處理成本降低一個(gè)數(shù)量級(jí),」黃仁勛說(shuō)到。

此外,在過(guò)去的十年里,云計(jì)算每年增長(zhǎng) 20%,成為一個(gè) 1 萬(wàn)億美元的行業(yè)。為了 AI 和 云計(jì)算,英偉達(dá)設(shè)計(jì)了 Grace CPU,在新的架構(gòu)下,GPU 負(fù)責(zé)處理 AI 的工作負(fù)載,Grace CPU 負(fù)責(zé)采樣,二者之間通過(guò)一個(gè) 900 GB/s 的高速傳輸設(shè)備連接在一起。

「Grace-Hopper 是處理大規(guī)模數(shù)據(jù)集的*選擇?!裹S仁勛稱,「我們的客戶希望建立訓(xùn)練數(shù)據(jù)大幾個(gè)數(shù)量級(jí)的 AI 大模型,Grace-Hopper 是理想的引擎?!?/p>

某種意義上來(lái)說(shuō),計(jì)算成本已經(jīng)成為今天阻礙生成式 AI 發(fā)展的核心問(wèn)題,OpenAI 為此燒掉了數(shù)十億乃至上百億美元,微軟也出于成本考慮始終沒(méi)有向更大范圍的公眾開(kāi)放新 Bing,甚至限制用戶每天的對(duì)話次數(shù)。

英偉達(dá)此時(shí)推出更高效的算力方案,無(wú)疑是給行業(yè)解決了一個(gè)大難題。

02、DGX Cloud:讓任何企業(yè)

都能構(gòu)建 AI 能力

今年 GTC 上另一個(gè)涉及生成式 AI 的重點(diǎn),就是 DGX Cloud。

實(shí)際上,這并不是英偉達(dá)*次公布 DGX Cloud。此前英偉達(dá)四季報(bào)發(fā)布時(shí),黃仁勛就向外界透露英偉達(dá)將與云服務(wù)廠商展開(kāi)合作,讓客戶可以使用網(wǎng)頁(yè)瀏覽器,就能通過(guò) NVIDIA DGX Cloud 來(lái)使用 DGX 計(jì)算機(jī),從而訓(xùn)練和部署大型語(yǔ)言模型或完成其他 AI 工作負(fù)載。

英偉達(dá)已經(jīng)與甲骨文展開(kāi)合作,預(yù)計(jì)下個(gè)季度微軟 Azure 也會(huì)開(kāi)始托管 DGX 云,而谷歌云也將在不久之后加入這一行列,以托管的方式向那些有意愿構(gòu)建新產(chǎn)品和發(fā)展 AI 戰(zhàn)略的企業(yè)提供 DGX 云服務(wù)。

黃仁勛稱,這種合作關(guān)系將英偉達(dá)的生態(tài)系統(tǒng)帶到了云服務(wù)商手中,同時(shí)擴(kuò)大了英偉達(dá)的市場(chǎng)規(guī)模和覆蓋面。企業(yè)將能夠每月租用 DGX 云集群,確保他們能夠快速輕松地?cái)U(kuò)展大型多節(jié)點(diǎn) AI 訓(xùn)練。

03、ChatGPT 只是開(kāi)始

「加速計(jì)算是曲速引擎,AI 就是它的能源?!裹S仁勛說(shuō)道,「生成式 AI 日新月異的能力,給我們重新構(gòu)想其產(chǎn)品和商業(yè)模式帶來(lái)了緊迫感?!?/p>

ChatGPT 和 GPT-4 為代表的大語(yǔ)言模型在過(guò)去幾個(gè)月火遍全球,但對(duì)英偉達(dá)來(lái)說(shuō),ChatGPT 和大模型并不是 AI 的全部。會(huì)上,黃仁勛還分享了更多英偉達(dá)在 AI 領(lǐng)域的探索和他本人的觀察。

首先是最火的生成式 AI。

只需要一張手繪的草圖,就能生成 3D 建模的戶型。

撰寫代碼也不在話下。

還有創(chuàng)作音樂(lè)。

為了加速那些尋求利用生成 AI 的人的工作,英偉達(dá)宣布成立 NVIDIA AI Foundations,這是一個(gè)云服務(wù)和代工廠,面向需要構(gòu)建、改進(jìn)和定制 LLM 和生成式 AI 的用戶,這些客戶使用其專有數(shù)據(jù)訓(xùn)練特定領(lǐng)域的 AI。

AI Foundations 的服務(wù)包括 NVIDIA NeMo,用于構(gòu)建文本-文本的生成模型;畢加索,一種視覺(jué)語(yǔ)言模型制作服務(wù),面向希望構(gòu)建基于經(jīng)授權(quán)內(nèi)容訓(xùn)練模型的用戶;以及 BioNeMo,幫助生物醫(yī)藥研究人員。

作為生產(chǎn)力工具,AI 也在發(fā)揮巨大的價(jià)值,黃仁勛在演講中介紹了幾個(gè)非常有意思的案例。

*個(gè)是與美國(guó)電信巨頭 AT&T。AT&T 需要定期派遣 3 萬(wàn)名技術(shù)人員,為 700 個(gè)區(qū)域的 1300 萬(wàn)名客戶提供服務(wù)。這個(gè)龐大的數(shù)據(jù),調(diào)度是一個(gè)痛點(diǎn),如果在 CPU 上運(yùn)行,調(diào)度優(yōu)化需要一整夜的時(shí)間才能完成。


借助英偉達(dá)的 CuOpt,AT&T 可以將調(diào)度方案的優(yōu)化時(shí)間加快 100 倍,并可實(shí)時(shí)更新其調(diào)度方案。

某種意義上,在英偉達(dá)的幫助下,AT&T 做到了美團(tuán)、滴滴這些需要實(shí)時(shí)匹配的互聯(lián)網(wǎng)公司用好多年積累才做到的事情。

另一個(gè)案例是與芯片公司的合作。大多數(shù)人都知道了光刻機(jī)這個(gè)半導(dǎo)體產(chǎn)業(yè)的關(guān)鍵設(shè)備。但鮮為人知的是,隨著制程技術(shù)的發(fā)展,芯片設(shè)計(jì)對(duì)算力的需求也是半導(dǎo)體行業(yè)的一大痛點(diǎn)。

今天計(jì)算光刻是芯片設(shè)計(jì)和制造領(lǐng)域*的計(jì)算工作負(fù)載,每年需要消耗數(shù)百億 CPU 小時(shí),并且隨著算法越來(lái)越復(fù)雜,計(jì)算光刻的成本也在提高。

對(duì)此,英偉達(dá)宣布推出 cuLitho——一個(gè)計(jì)算光刻庫(kù)。并與 ASML、臺(tái)積電等巨頭展開(kāi)合作,從而大幅降低芯片設(shè)計(jì)過(guò)程中的算力消耗,節(jié)能減排。

事實(shí)上,減少能源消耗,提高計(jì)算效率,是黃仁勛眼中 AI 技術(shù)將為人類社會(huì)帶來(lái)的另一大價(jià)值。而在摩爾定律失效的當(dāng)下,加速計(jì)算和 AI 的到來(lái)恰逢其時(shí)。

「各行業(yè)正都在面對(duì)可持續(xù)發(fā)展、生成式 AI 和數(shù)字化的挑戰(zhàn)。工業(yè)公司正在競(jìng)相數(shù)字化,并重塑為軟件驅(qū)動(dòng)的科技公司——成為顛覆者,而不是被顛覆者,」加速計(jì)算讓這些公司可以應(yīng)對(duì)這些挑戰(zhàn),黃仁勛說(shuō)道?!讣铀儆?jì)算是減少電力消耗、實(shí)現(xiàn)可持續(xù)性發(fā)展和碳中和的*方式?!?/p>

最后,類似于一個(gè)彩蛋,從老黃此次演講的表現(xiàn)不難猜測(cè),視頻中出現(xiàn)的老黃,應(yīng)該全程是一個(gè)虛擬形象。如無(wú)意外,很有可能也是「生成式 AI」的產(chǎn)物——在表現(xiàn) AI 進(jìn)步的同時(shí),也算是黃仁勛為自己家「核彈算力」再次「現(xiàn)身說(shuō)法」。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財(cái)中網(wǎng)合作