国产三级精品三级在线观看,国产高清无码在线观看,中文字幕日本人妻久久久免费,亚洲精品午夜无码电影网

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

隨著大規(guī)模深度神經(jīng)網(wǎng)絡(luò)(NN)和其他人工智能(AI)應(yīng)用的最新發(fā)展,人們?cè)絹碓綋?dān)心訓(xùn)練和操作它們所需的能源消耗。

物理神經(jīng)網(wǎng)絡(luò)可以成為這個(gè)問題的解決方案,但傳統(tǒng)算法的直接硬件實(shí)現(xiàn)面臨著多重困難。使用傳統(tǒng)反向傳播算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)會(huì)面臨一些挑戰(zhàn),例如缺乏可擴(kuò)展性、訓(xùn)練過程中操作的復(fù)雜性以及對(duì)數(shù)字訓(xùn)練模型的依賴。

洛桑聯(lián)邦理工學(xué)院(école Polytechnique Fédérale de Lausanne,EPFL)和微軟研究團(tuán)隊(duì)(Microsoft Research)等機(jī)構(gòu)組成的合作團(tuán)隊(duì)提出了一種通過物理局部學(xué)習(xí)(PhyLL)算法增強(qiáng)的簡(jiǎn)單深度神經(jīng)網(wǎng)絡(luò)架構(gòu),該架構(gòu)可以對(duì)深度物理神經(jīng)網(wǎng)絡(luò)進(jìn)行監(jiān)督和無監(jiān)督訓(xùn)練,而無需詳細(xì)了解非線性物理層的屬性。

利用這種方法,研究人員在元音和圖像分類實(shí)驗(yàn)中訓(xùn)練了多種基于波的物理神經(jīng)網(wǎng)絡(luò),并展示了該方法的普遍性。該團(tuán)隊(duì)的方法比其他硬件感知訓(xùn)練方案具有優(yōu)勢(shì),可以提高訓(xùn)練速度、增強(qiáng)穩(wěn)健性;同時(shí),通過消除系統(tǒng)建模的需要來降低功耗,從而減少數(shù)字計(jì)算需求。

該研究以「Backpropagation-free training of deep physical neural networks」為題發(fā),于 2023 年 11 月 23 日發(fā)布在《Science》。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

深度學(xué)習(xí)已成為一項(xiàng)取得了巨大成功的突破性技術(shù),主要在傳統(tǒng)的馮·諾依曼計(jì)算硬件上運(yùn)行。該技術(shù)目前面臨高能耗(例如 GPT-3 的 1.3 ?GWh 用電量)和低計(jì)算速度的問題。

由于這些挑戰(zhàn),科學(xué)家正在探索人工神經(jīng)網(wǎng)絡(luò)(ANN)的替代物理平臺(tái),包括光學(xué)、自旋電子學(xué)、納米電子設(shè)備、光子硬件和聲學(xué)系統(tǒng)。

目前,局部學(xué)習(xí)已被廣泛研究用于訓(xùn)練數(shù)字神經(jīng)網(wǎng)絡(luò),從早期的 Hopfield 模型中的 Hebbian 對(duì)比學(xué)習(xí)工作到最近的生物學(xué)合理框架、塊式 BP 和對(duì)比表示學(xué)習(xí)。

受這一概念的啟發(fā),為了解決基于 BP 的 PNN 訓(xùn)練的局限性,EPFL 等機(jī)構(gòu)的研究人員提出了一種簡(jiǎn)單且物理兼容的 PNN 架構(gòu),并通過物理局部學(xué)習(xí) (PhyLL) 算法進(jìn)行了增強(qiáng)。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

圖:Deep PNNs。(來源:論文)

該方法能夠在本地對(duì)任意 PNN 進(jìn)行監(jiān)督和無監(jiān)督對(duì)比學(xué)習(xí)訓(xùn)練,而無需了解非線性物理層并訓(xùn)練數(shù)字孿生模型。在這種無 BP 方法中,通常由數(shù)字計(jì)算機(jī)執(zhí)行的標(biāo)準(zhǔn)后向傳遞被替換為通過物理系統(tǒng)的附加單個(gè)前向傳遞。

這種替代可以消除由于其他硬件感知框架中存在的數(shù)字孿生建模階段而產(chǎn)生的額外開銷,從而提高基于波的 PNN 訓(xùn)練階段的訓(xùn)練速度、功耗和內(nèi)存使用率。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

圖:Acoustic-PNN。(來源:論文)

該方法即使在暴露于不可預(yù)測(cè)的外部擾動(dòng)的系統(tǒng)中,依然能保持穩(wěn)健性和適應(yīng)性。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

圖:Deep PNN 對(duì)不可預(yù)測(cè)的外部擾動(dòng)的穩(wěn)健性。(來源:論文)

為了展示該方法的普遍性,研究人員使用三個(gè)基于波的系統(tǒng)進(jìn)行了實(shí)驗(yàn)元音和圖像分類,這三個(gè)系統(tǒng)在潛在的波現(xiàn)象和所涉及的非線性類型方面有所不同。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

圖:Microwave-PNN。(來源:論文)

由于人工神經(jīng)網(wǎng)絡(luò)規(guī)模空前增長(zhǎng),例如預(yù)計(jì)將不斷增加的大型語言模型(LLM),這些網(wǎng)絡(luò)的訓(xùn)練和推理階段的成本呈指數(shù)級(jí)增長(zhǎng)。

PNN 等專用硬件有可能大幅降低這些成本。之前 Anderson 團(tuán)隊(duì)曾經(jīng)預(yù)測(cè),與未來大型 Transformer 模型的數(shù)字電子處理器相比,推理時(shí)間能效優(yōu)勢(shì)約為 8000 倍。EPFL 團(tuán)隊(duì)提出的訓(xùn)練方法可以作為訓(xùn)練這些光學(xué) LLMs 的可行候選方法,有可能提供顯著的能源效率和速度優(yōu)勢(shì)。

低耗能高速度,EPFL和微軟研究團(tuán)隊(duì)的新方法:深度物理神經(jīng)網(wǎng)絡(luò)的無反向傳播訓(xùn)練

圖:Optics-PNN。(來源:論文)

利用光學(xué)實(shí)現(xiàn)大規(guī)模 LLM 仍然面臨一些挑戰(zhàn),例如當(dāng)前的 SLM 容量?jī)H限于幾百萬個(gè)參數(shù),遠(yuǎn)低于所需的數(shù)十億個(gè)參數(shù)。然而,實(shí)現(xiàn)十億參數(shù)光學(xué)架構(gòu)和節(jié)能 PNN 并不存在根本障礙。

Science》雜志副主編 Yury Suleymanov 評(píng)價(jià)道:「該研究是優(yōu)化神經(jīng)網(wǎng)絡(luò)中的能源密集型訓(xùn)練步驟的重要一步,從而為現(xiàn)代人工智能系統(tǒng)提供更有效的解決方案。

論文鏈接:https://www.science.org/doi/10.1126/science.adi8474

原創(chuàng)文章,作者:計(jì)算搬磚工程師,如若轉(zhuǎn)載,請(qǐng)注明來源華算科技,注明出處:http://www.xiubac.cn/index.php/2024/01/10/88738221c4/

(0)

相關(guān)推薦

仁布县| 阿拉善左旗| 长垣县| 绍兴市| 天柱县| 北碚区| 达州市| 霍邱县| 江华| 西昌市| 尚志市| 雅安市| 富平县| 津南区| 民勤县| 龙江县| 东乌| 枝江市| 广饶县| 兴仁县| 新平| 高青县| 海门市| 谷城县| 类乌齐县| 开封县| 襄城县| 重庆市| 汽车| 海盐县| 黎川县| 诏安县| 灌南县| 邯郸县| 武宣县| 茶陵县| 慈溪市| 宾阳县| 克山县| 舞阳县| 改则县|