北理工課題組在光卷積神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)研究方面取得重要進(jìn)展
發(fā)布日期:2024-01-31 供稿:物理學(xué)院 攝影:物理學(xué)院
編輯:王莉蓉 審核:陳珂 閱讀次數(shù):日前,北京理工大學(xué)物理學(xué)院張向東教授課題組利用經(jīng)典光的關(guān)聯(lián)特性實(shí)現(xiàn)了具有“量子加速”功能光學(xué)卷積網(wǎng)絡(luò),。相關(guān)成果以“Correlated Optical Convolutional Neural Network with “Quantum Speedup””為題發(fā)表在Light: Science & Applications期刊[Light Sci. Appl. 13, 36 (2024)]上,。北京理工大學(xué)物理學(xué)院孫亦凡副研究員為該論文第一作者,北京理工大學(xué)物理學(xué)院張向東教授為論文通訊作者,,北京理工大學(xué)物理學(xué)院孔令軍研究員,、李乾博士也為該工作做出了重要貢獻(xiàn)。該研究工作得到了國(guó)家自然科學(xué)基金委的大力支持,。
近年來,,在現(xiàn)代計(jì)算機(jī)技術(shù)的加持下,以機(jī)器學(xué)習(xí)算法為代表的人工智能技術(shù)得到了極大的發(fā)展,。這些技術(shù)使得人們?cè)趫D像識(shí)別,、自然語言生成與處理、目標(biāo)檢測(cè)等任務(wù)中的效率達(dá)到了前所未有的高度[Nature, 521, 436(2015)],。特別是在今年,,許多國(guó)家和地區(qū)將ChatGPT這樣一種基于深度神經(jīng)網(wǎng)絡(luò)算法的語言處理軟件名稱作為英文年度詞匯,足見其影響力之大,。該軟件能夠幾乎實(shí)時(shí)地進(jìn)行普通對(duì)答,、文字編輯,甚至可以高質(zhì)量地完成語義歸納,、多種語言互譯等相關(guān)工作,。然而,如此出色的功能背后需要龐大的計(jì)算能力作為支撐,。根據(jù)官方的資料,,ChatGPT的模型參數(shù)數(shù)量超過一千七百億,整個(gè)訓(xùn)練過程需要使用昂貴的設(shè)備并花費(fèi)大量的時(shí)間。事實(shí)上,,這樣的計(jì)算資源在現(xiàn)有的設(shè)備技術(shù)水平條件下已經(jīng)趨于飽和,。因此,如何有效地降低機(jī)器學(xué)習(xí)模型的訓(xùn)練成本并提高其訓(xùn)練效率,,是目前該領(lǐng)域發(fā)展過程中面臨的一個(gè)重要問題。
為了解決這樣的問題,,除了發(fā)展改進(jìn)原有的經(jīng)典神經(jīng)網(wǎng)絡(luò)算法以外,,人們還在兩個(gè)研究方向上做出了大膽的嘗試。他們分別是光學(xué)神經(jīng)網(wǎng)絡(luò)和量子神經(jīng)網(wǎng)絡(luò),。光學(xué)神經(jīng)網(wǎng)絡(luò)是一種利用先進(jìn)光學(xué)調(diào)控手段來執(zhí)行機(jī)器學(xué)習(xí)算法的經(jīng)典光學(xué)信息處理過程,。在該過程中,,對(duì)算法的執(zhí)行主要是通過光學(xué)狀態(tài)調(diào)控來完成。相較于傳統(tǒng)的電學(xué)設(shè)備,,光學(xué)信息處理設(shè)備具有獨(dú)特的優(yōu)勢(shì),,例如,與普通環(huán)境的弱耦合性,、光學(xué)并行性,、高速傳導(dǎo)性等。所以,,以此為基礎(chǔ)的光學(xué)神經(jīng)網(wǎng)絡(luò)具有低能耗,、低串?dāng)_、低傳輸延遲等優(yōu)點(diǎn)[Nature 589, 44 (2021); Nature 589, 52 (2020)],。但遺憾的是,,目前光學(xué)神經(jīng)網(wǎng)絡(luò)還并未具有算法結(jié)構(gòu)上的加速效果,例如更快的模型收斂速度等,。另一種潛在的改進(jìn)方式是量子神經(jīng)網(wǎng)絡(luò),。這是一種基于量子計(jì)算理論的神經(jīng)網(wǎng)絡(luò)算法。近幾年的研究表明,,由于利用了量子態(tài)所具有的特殊關(guān)聯(lián)性質(zhì),,量子神經(jīng)網(wǎng)絡(luò)能夠展現(xiàn)出算法結(jié)構(gòu)上的加速。其中一個(gè)典型的例子是最近人們理論上分析的量子卷積網(wǎng)絡(luò) [Nat. Phys., 15, 1273(2019)],。對(duì)該網(wǎng)絡(luò)的數(shù)值模擬結(jié)果表明,,其損失函數(shù)在訓(xùn)練過程中具有更快的收斂速度,這也意味著其總的訓(xùn)練時(shí)長(zhǎng)可以被有效縮短,。然而,,由于技術(shù)發(fā)展的限制,目前這樣的神經(jīng)網(wǎng)絡(luò)算法很難在硬件上大規(guī)模執(zhí)行,,這導(dǎo)致其所具有的加速性難以在目前人們面對(duì)的實(shí)際問題中發(fā)揮作用,。
綜上所述,一方面,,光學(xué)神經(jīng)網(wǎng)絡(luò)已經(jīng)初步具備一定規(guī)模的實(shí)現(xiàn)能力,,并展現(xiàn)出特定優(yōu)點(diǎn),另一方面,,理論已證明量子神經(jīng)網(wǎng)絡(luò)可以提供算法結(jié)構(gòu)上的加速效果,,但在當(dāng)下很難被大規(guī)模實(shí)現(xiàn)。最近我們構(gòu)造出了一種新型經(jīng)典光神經(jīng)網(wǎng)絡(luò):關(guān)聯(lián)光卷積神經(jīng)網(wǎng)絡(luò),。它能將兩種神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)相結(jié)合,,也就是,既具有算法結(jié)構(gòu)加速效果,又能夠相對(duì)容易地實(shí)現(xiàn),。下面從理論構(gòu)建和實(shí)驗(yàn)實(shí)現(xiàn)兩方面做介紹,。
研究亮點(diǎn)之一:具有“量子加速”功能的關(guān)聯(lián)光卷積網(wǎng)絡(luò)理論設(shè)計(jì)
首先,研究人員利用經(jīng)典光學(xué)關(guān)聯(lián)性質(zhì),,從理論上給出了一種能夠與量子卷積網(wǎng)絡(luò)相對(duì)應(yīng)的光學(xué)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),,并將其稱為關(guān)聯(lián)光卷積網(wǎng)絡(luò)。他們的方案示意圖如圖1所示,。該網(wǎng)絡(luò)的主要結(jié)構(gòu)可以被歸納為四個(gè)部分:光源部分,,卷積層部分,池化層部分,,以及最后的探測(cè)部分,。這四個(gè)部分中,光源部分是最為基礎(chǔ)的部分,,是整個(gè)方案能夠與量子卷積網(wǎng)絡(luò)相對(duì)應(yīng)的根源, 如圖1左側(cè)被標(biāo)注為的光束所示,。不同于先前的光學(xué)神經(jīng)網(wǎng)絡(luò),研究人員考慮了一種特殊的經(jīng)典光學(xué)狀態(tài)作為信息載體,,也即多模偏振態(tài),。通過構(gòu)建該狀態(tài)中不同模式之間的正交關(guān)系,該狀態(tài)可以有效地對(duì)量子計(jì)算中的多量子比特狀態(tài)進(jìn)行模擬,。事實(shí)上,,本文的研究人員已經(jīng)在較早之前的工作中指出了多模偏振光的這一性質(zhì) [Annalen der Physik, 534, 2200360 (2022)]。光源部分之后是卷積層部分,。這部分的功能是對(duì)關(guān)聯(lián)光學(xué)狀態(tài)進(jìn)行幺正變換,,如圖1藍(lán)色區(qū)域所示。該變換實(shí)際上是由一系列對(duì)兩束多模偏振光進(jìn)行幺正變換的模塊組合而成,。這些模塊在圖1中由藍(lán)色的長(zhǎng)方體標(biāo)出,,其細(xì)節(jié)展示在藍(lán)色的虛線框中。實(shí)際上,,每一個(gè)模塊都由一系列的波片和非線性原件構(gòu)成,,其結(jié)構(gòu)和功能均與量子計(jì)算中的雙量子比特通用操作一致。在這之后是池化層部分,,如圖1棕色區(qū)域所示,。本文的研究人員在這里設(shè)計(jì)的池化操作本質(zhì)上是基于非線性光學(xué)的光束合并操作。通過合并之后,,多束偏振光所攜帶的信息會(huì)被部分編碼進(jìn)較少的光束中,,這使得參與“運(yùn)算”的關(guān)聯(lián)光束的數(shù)量能夠被有效減少。與傳統(tǒng)卷積網(wǎng)絡(luò)中的池化層相比,,該操作同樣實(shí)現(xiàn)了數(shù)據(jù)維度的縮小,。不過不同的是,本文中給出的這種方法能夠讓數(shù)據(jù)維度縮小的效率具備指數(shù)特征,其與量子計(jì)算中對(duì)部分量子比特進(jìn)行測(cè)量從而獲得子空間的過程類似,。最終,在反復(fù)應(yīng)用卷積和池化之后,,關(guān)聯(lián)光的輸出需要通過探測(cè)部分來完成,,如圖1最右側(cè)結(jié)構(gòu)所示。在這一部分中,,首先需要利用“平衡零拍探測(cè)”對(duì)出射光束的偏振狀態(tài)進(jìn)行 “投影測(cè)量”,,然后再對(duì)所有輸出光投影信息的關(guān)聯(lián)進(jìn)行統(tǒng)計(jì)。關(guān)聯(lián)的大小將被作為輸出結(jié)果,。值得一提的是,,研究人員給出的這種卷積網(wǎng)絡(luò)的突出特點(diǎn)在于,利用經(jīng)典光關(guān)聯(lián)作為信息的基本載體,,并通過對(duì)關(guān)聯(lián)進(jìn)行調(diào)制,、統(tǒng)計(jì)、以及最終的測(cè)量來完成信息處理過程,。這樣的關(guān)聯(lián)光卷積網(wǎng)絡(luò)能夠與量子卷積網(wǎng)絡(luò)模型之間存在良好的對(duì)應(yīng)關(guān)系,。
圖1. 關(guān)聯(lián)光卷積網(wǎng)絡(luò)方案示意圖。
為了進(jìn)一步確認(rèn)關(guān)聯(lián)光卷積網(wǎng)絡(luò)的效果,,研究人員還進(jìn)行了數(shù)值研究,,結(jié)果如圖2所示。首先,,研究人員對(duì)比了關(guān)聯(lián)光卷積網(wǎng)絡(luò)與經(jīng)典卷積網(wǎng)絡(luò)在具體數(shù)據(jù)集上的訓(xùn)練效果,,展示在圖2(a)和圖2(b)中。圖2(a)展示的是兩種卷積網(wǎng)絡(luò)在二分類任務(wù)中損失函數(shù)的收斂情況,,圖2(b)中展示的是兩者在四分類任務(wù)中損失函數(shù)的收斂情況,。從圖中結(jié)果可以看出,這兩種情形下關(guān)聯(lián)光卷積網(wǎng)絡(luò)的收斂速度均快于傳統(tǒng)卷積網(wǎng)絡(luò)方案,。這一特點(diǎn)與量子卷積網(wǎng)絡(luò)的相一致,。除此之外,研究人員還展示了利用關(guān)聯(lián)光卷積網(wǎng)絡(luò)對(duì)Haldane模型基態(tài)進(jìn)行分類的結(jié)果,,如圖2(c)所示,。研究人員首先利用光學(xué)關(guān)聯(lián)對(duì)Haldane模型的基態(tài)進(jìn)行編碼,然后將對(duì)應(yīng)的關(guān)聯(lián)狀態(tài)(也即上文中的多模偏振光)輸入相應(yīng)的關(guān)聯(lián)光卷積網(wǎng)絡(luò)中,,最后利用輸出的結(jié)果分析得到圖2(c)中紅色三角形標(biāo)注的折線,。該折線與由標(biāo)準(zhǔn)方法得到的邊界(由上色背景展示)相吻合。該結(jié)果同樣與量子卷積網(wǎng)絡(luò)的結(jié)果相一致,。這些結(jié)果進(jìn)一步表明,,關(guān)聯(lián)光卷積網(wǎng)絡(luò)可以展示出量子卷積網(wǎng)絡(luò)的基本特性。
圖2.(a)在二分類任務(wù)訓(xùn)練中,關(guān)聯(lián)光卷積網(wǎng)絡(luò)與傳統(tǒng)卷積網(wǎng)絡(luò)損失函數(shù)隨步驟數(shù)的變化情況,。(b)在四分類任務(wù)訓(xùn)練中,,關(guān)聯(lián)光卷積網(wǎng)絡(luò)與傳統(tǒng)卷積網(wǎng)絡(luò)損失函數(shù)隨步驟數(shù)的變化情況。(c)利用關(guān)聯(lián)光卷積網(wǎng)絡(luò)對(duì)Haldane模型基態(tài)相變邊界進(jìn)行確認(rèn)的結(jié)果,。
研究亮點(diǎn)之二:關(guān)聯(lián)光卷積網(wǎng)絡(luò)的實(shí)驗(yàn)驗(yàn)證
為了驗(yàn)證關(guān)聯(lián)光卷積網(wǎng)絡(luò)的功能及可實(shí)現(xiàn)性,,研究人員還在他們的工作中展示了對(duì)該神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)實(shí)現(xiàn)。實(shí)驗(yàn)裝置示意圖如圖3所示,。為了便于實(shí)驗(yàn)實(shí)現(xiàn),,研究人員對(duì)原有方案進(jìn)行了一定程度的化簡(jiǎn)。他們選用激光的空間模式作為多模偏振態(tài)中的正交模式,,并基于光學(xué)關(guān)聯(lián)態(tài)的數(shù)學(xué)特性選取了特殊的狀態(tài)空間來實(shí)現(xiàn)對(duì)應(yīng)的關(guān)聯(lián)光卷積網(wǎng)絡(luò),。圖3中展示的關(guān)聯(lián)光卷積網(wǎng)絡(luò)實(shí)際上是對(duì)一種用于狀態(tài)分類的量子卷積網(wǎng)絡(luò)的模擬,可以對(duì)應(yīng)三個(gè)量子比特作為輸入的情形,。如圖所示,,該網(wǎng)絡(luò)只包含了一個(gè)卷積層,池化層的功能被融入了探測(cè)過程之中,。圖中卷積層中包含的不同功能單元由不同的顏色標(biāo)出,。
圖3. 關(guān)聯(lián)光卷積網(wǎng)絡(luò)的實(shí)驗(yàn)實(shí)現(xiàn)示意圖。
通過該實(shí)驗(yàn)設(shè)置,,研究人員首先研究了不同狀態(tài)作為輸入時(shí)的網(wǎng)絡(luò)輸出結(jié)果,,如圖4所示。在該過程中,,研究人員選擇了十個(gè)不同的關(guān)聯(lián)光學(xué)狀態(tài)作為輸入,,它們分別對(duì)應(yīng)十個(gè)不同的三比特量子態(tài)。由于該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)置,,輸出的狀態(tài)實(shí)際上是單束多模偏振光的投影測(cè)量結(jié)果,,對(duì)應(yīng)單比特量子態(tài)??紤]到所使用的經(jīng)典光學(xué)狀態(tài)與量子比特之間的對(duì)應(yīng)關(guān)系,,研究人員同樣給出了如圖4中展示的“密度矩陣”表示方法。圖4中不同的子圖對(duì)應(yīng)不同的輸入態(tài)情形,。每一個(gè)子圖中長(zhǎng)方柱框的高度表示了理論結(jié)果,,內(nèi)部填充顏色的高度表示了實(shí)驗(yàn)結(jié)果??梢钥闯鰞烧叻系煤芎?。除此之外,研究人員還用該實(shí)驗(yàn)設(shè)置對(duì)三格點(diǎn)Haldane哈密頓量的基態(tài)進(jìn)行處理,,鑒別其所屬的拓?fù)湎?,結(jié)果如圖5所示,。圖5的左圖中的紅點(diǎn)是實(shí)驗(yàn)中直接測(cè)量到的輸出結(jié)果,藍(lán)線為理論曲線,,x坐標(biāo)和y坐標(biāo)分別對(duì)應(yīng)哈密頓量的參數(shù),。首先,從左圖的數(shù)據(jù)中可以看出理論值和實(shí)驗(yàn)值相吻合,。更重要的是,,通過對(duì)曲線做二階導(dǎo)數(shù)處理可以得到清晰的相圖邊界,與圖3(c)中的結(jié)果相對(duì)應(yīng),。該結(jié)果充分驗(yàn)證了研究人員提出的理論方案的正確性以及可行性。
圖4. 不同輸入情形下關(guān)聯(lián)光卷積網(wǎng)絡(luò)的輸出,。各子圖中左側(cè)為實(shí)部結(jié)果,,右側(cè)為虛部結(jié)果。
圖5. 利用關(guān)聯(lián)光卷積網(wǎng)絡(luò)對(duì)Haldane哈密頓量基態(tài)的拓?fù)湎噙M(jìn)行鑒定的實(shí)驗(yàn)結(jié)果,。
該研究團(tuán)隊(duì)基于經(jīng)典光學(xué)關(guān)聯(lián)性質(zhì)設(shè)計(jì)了一種新的光學(xué)卷積網(wǎng)絡(luò),,即關(guān)聯(lián)光卷積網(wǎng)絡(luò)。該網(wǎng)絡(luò)可以展現(xiàn)出與量子卷積網(wǎng)絡(luò)相對(duì)應(yīng)的性質(zhì),,包括在特定分類問題上的加速效果,,以及實(shí)現(xiàn)量子卷積網(wǎng)絡(luò)對(duì)量子態(tài)進(jìn)行分類的部分功能。并且,,研究團(tuán)隊(duì)還利用實(shí)驗(yàn)平臺(tái)對(duì)該神經(jīng)網(wǎng)絡(luò)進(jìn)行了實(shí)驗(yàn)研究,,驗(yàn)證了他們的理論結(jié)果以及該網(wǎng)絡(luò)的可實(shí)現(xiàn)性。該研究成果是光信息處理方向的重要進(jìn)展,,為實(shí)現(xiàn)更高效的光學(xué)神經(jīng)網(wǎng)絡(luò)提供了新的思路,。
論文鏈接:https://doi.org/10.1038/s41377-024-01376-7
分享到: