引言/導讀
(一) 本測試床提出背景和存在的難題、挑戰(zhàn)
云端訓練模型,下發(fā)到邊緣端推理:直接將云端算法遷移到邊緣設(shè)備上執(zhí)行,對邊緣設(shè)備的算力、功耗和散熱要求高;云端和邊端缺乏模型持續(xù)優(yōu)化更新協(xié)同框架,只能進行簡單的協(xié)同,無法保證模型長期準確率。
大規(guī)模數(shù)據(jù)需要上傳至云端:增大企業(yè)定制網(wǎng)運行負荷和網(wǎng)絡(luò)占用;企業(yè)大量數(shù)據(jù)有數(shù)據(jù)加密需求,不能直接上傳至云端,導致多用戶同一模型以及模型持續(xù)優(yōu)化問題。
業(yè)務(wù)場景多樣化,未形成標準的協(xié)同推理解決方案:工廠智能生產(chǎn)的業(yè)務(wù)碎片化,對軟硬件的需求各不相同,目前各大軟硬件廠商(如各大AI算法廠商和算力芯片廠商)未形成標準的協(xié)同推理解決方案,以解決碎片化場景問題。智慧工廠的云邊協(xié)同平臺未來發(fā)展趨勢
云端和邊緣端互相補充,協(xié)同訓練推理,構(gòu)建云端和邊緣端連續(xù)的學習循環(huán),保證業(yè)務(wù)長期可靠穩(wěn)定地運行。
1. 云邊協(xié)同訓練推理,解決工業(yè)邊端算力不足
? 云邊協(xié)同推理:云邊模型切割、模型壓縮等方案實現(xiàn)協(xié)同推理。
? 增量學習:模型在云端或邊緣進行自適應(yīng)優(yōu)化,邊用邊學,模型越來越準確。
2. 數(shù)據(jù)無需上傳云端,解決工業(yè)客戶數(shù)據(jù)隱私問題
? 聯(lián)邦學習:邊緣本地訓練,參數(shù)云上聚合,保護數(shù)據(jù)隱私,減少網(wǎng)絡(luò)帶寬。
? 遷移學習:云上保留原始模型信息,邊緣新訓練集進行學習更新,得到適用于新場景的模型。
3. AI協(xié)同服務(wù)按需定制,解決工業(yè)智能化場景碎片化問題
? 特定業(yè)務(wù)特殊定制:企業(yè)根據(jù)業(yè)務(wù)需求,定制合理的AI協(xié)同服務(wù)。
? 靈活自主,資源有效利用:可靠性增強,節(jié)約能耗,環(huán)境適應(yīng)性強,解決工業(yè)環(huán)境差異大問題。
一、 關(guān)鍵詞
邊云協(xié)同平臺、邊緣智能、協(xié)同推理、模型優(yōu)化
2.1. 發(fā)起公司和主要聯(lián)系人聯(lián)系方式
中國電信:丁鵬,dingpeng6@chinatelecom.cn
2.2. 合作公司
瑞斯康達:提供智能工廠典型應(yīng)用場景環(huán)境,參與現(xiàn)場測試床驗證
三、 測試床項目目標
(一) 測試床項目目標
基于柔性制造PCB焊點質(zhì)量檢測驗證場景:已有大量PCB焊點質(zhì)量檢測數(shù)據(jù)集,在此基礎(chǔ)上建立PCB焊點質(zhì)量檢測模型,通過測試床進行模型的持續(xù)優(yōu)化,為柔性制造PCB焊點質(zhì)量檢測提供基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床。
提供定制化AI協(xié)同服務(wù):基于智能邊緣設(shè)備,實現(xiàn)基于5G MEC+邊緣智能的AI邊云協(xié)同訓練和協(xié)同推理,就近為端側(cè)提供算力支持和模型持續(xù)優(yōu)化支持,保護數(shù)據(jù)隱私,為用戶持續(xù)提升智能化品質(zhì)。
(二) 測試床計劃解決哪些問題、價值點
保障企業(yè)保密數(shù)據(jù)本地化:保障企業(yè)數(shù)據(jù)不出邊緣節(jié)點即可參與模型訓練。
讓服務(wù)可定制,降低資源消耗:提供適合業(yè)務(wù)需求的智能邊緣設(shè)備AI協(xié)同服務(wù),即裝即用,降低資源消耗。
提升模型效果:云邊協(xié)同,循環(huán)促進的訓練推理模式,保證模型的長期可靠運行。
四、 測試床方案架構(gòu)
4.1. 測試床應(yīng)用場景
測試床在企業(yè)本地部署通用服務(wù)器或MEC,也可使用運營商云主機或公用MEC平臺,作為測試床云端,使用定制化的智能邊緣設(shè)備作為邊緣端,兼容現(xiàn)有的AI框架,提供跨云邊協(xié)同訓練推理框架,并使用增量學習、聯(lián)邦學習和遷移學習等能力提供可優(yōu)化的AI模型服務(wù)。使用模型壓縮等技術(shù)實現(xiàn)云邊協(xié)同推理,保證業(yè)務(wù)的穩(wěn)定可靠運行。
測試床適用于支撐智能工廠中的工業(yè)智能應(yīng)用場景,例如焊點檢測、產(chǎn)品質(zhì)量檢測、工人非法越界檢測、安全帽檢測、工服檢測、人臉識別等。
4.2. 測試床架構(gòu)
1. 在體系架構(gòu)的位置
本測試床在工業(yè)互聯(lián)網(wǎng)功能視圖平臺體系框架中的位置如下圖所示,通過邊緣層的數(shù)據(jù)接入、數(shù)據(jù)預處理和智能分析實現(xiàn)邊緣側(cè)的數(shù)據(jù)處理和分析,通過PaaS層和應(yīng)用層的資源部署與管理、數(shù)據(jù)管理與服務(wù)、模型管理與服務(wù)和工業(yè)創(chuàng)新應(yīng)用實現(xiàn)模型優(yōu)化和更新、協(xié)同推理。過程實現(xiàn)數(shù)據(jù)的優(yōu)化閉環(huán),形成云邊模型連續(xù)的學習循環(huán)。。
2. 在實施框架的位置
工業(yè)互聯(lián)網(wǎng)平臺實施框架中,本測試床內(nèi)容包含邊緣層的數(shù)據(jù)預處理和邊緣智能應(yīng)用部分,企業(yè)層在企業(yè)MEC上部署平臺的云端包括數(shù)據(jù)模型、工業(yè)模型的管理等。在產(chǎn)業(yè)層提供多企業(yè)MEC協(xié)同接口,支撐開展資源配置優(yōu)化和產(chǎn)業(yè)生態(tài)的構(gòu)建。實施架構(gòu)如下圖所示:
3. 本測試床架構(gòu)
本測試床主要提供低成本、高性能、易使用、隱私保護的邊緣智能,滿足企業(yè)數(shù)據(jù)本地化(數(shù)據(jù)不出廠區(qū))和即裝即用的定制化服務(wù)。測試床架構(gòu)如下圖所示:
4.3. 測試床方案
基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床功能架構(gòu)如下圖所示:
1. 自動化異構(gòu)邊緣適配
定制化邊緣AI服務(wù)與邊緣智能設(shè)備、邊緣智能硬件廠商進行適配,實現(xiàn)自動化的邊緣資源適配。
2. 實現(xiàn)邊緣AI基礎(chǔ)框架
實現(xiàn)邊緣AI 管理,數(shù)據(jù)集管理,數(shù)據(jù)預處理,跨云邊數(shù)據(jù)同步,配置管理等。
3. 云邊協(xié)同訓練和協(xié)同推理
高效利用云邊各類資源。利用模型壓縮、困難樣本發(fā)現(xiàn)等技術(shù)實現(xiàn)協(xié)同推理;利用遷移學習、增量學習、聯(lián)邦學習技術(shù)實現(xiàn)邊緣AI可長期可靠穩(wěn)定的使用 。實現(xiàn)高性能、低成本、隱私安全的邊緣AI系統(tǒng)?;?G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床技術(shù)實施方案如下圖所示:
4.4. 方案重點技術(shù)
? 模型優(yōu)化技術(shù):解決邊緣AI模型的訓練優(yōu)化問題,保證模型長期穩(wěn)定運行。
? 邊云協(xié)同訓練、協(xié)同推理技術(shù):基于現(xiàn)有的邊云協(xié)同平臺打造邊云協(xié)同訓練和協(xié)同推理框架,保證業(yè)務(wù)對時間延時和精度的需求。
? 輕量化模型分割技術(shù):通過DNN模型壓縮技術(shù)和模型拆分技術(shù),實現(xiàn)輕量化的邊緣模型,適用邊緣算力較低的設(shè)備
4.5. 應(yīng)用場景
1. 協(xié)同推理
在焊點質(zhì)量檢測場景中如何使用跨云邊協(xié)同推理服務(wù)。由于邊緣資源有限,焊點質(zhì)量檢測性能較低。但是,協(xié)同推理服務(wù)可以提高整體性能,將通過困難樣本挖掘識算法將困難樣板上傳到云并進行推理。
2. 聯(lián)邦學習
隱私保護、數(shù)據(jù)安全:不同工廠的焊接技術(shù)是屬于加密技術(shù),焊點成像采集的圖像不能用于共享訓練數(shù)據(jù),通過聯(lián)邦學習技術(shù),無需分享本廠的成像數(shù)據(jù),保證數(shù)據(jù)的隱私性和安全性。
解決數(shù)據(jù)孤島問題:單一工廠的數(shù)據(jù)數(shù)量有限,焊點技術(shù)單一,不能包括多種質(zhì)量問題的類型,通過云上的參數(shù)服務(wù)模塊對全局模型進行優(yōu)化合并,充分利用各節(jié)點資源,提高模型的精度。
3. 遷移增量學習
條件允許的情況下,使用全部數(shù)據(jù)重新訓練模型的效果是最佳的。真實的生產(chǎn)環(huán)境是開放并且復雜多變的,在訓練模型之前無法獲得所有可能情形的有效信息作為訓練數(shù)據(jù)。隨著終端運行不斷生產(chǎn)數(shù)據(jù),新的類別不斷產(chǎn)生,已有類別的新實例不斷出現(xiàn),智能邊緣能夠在獲得新數(shù)據(jù)時,重新訓練數(shù)據(jù),保證不斷優(yōu)化學習的能力。
4.5. 方案自主研發(fā)性、創(chuàng)新性及先進性
技術(shù)創(chuàng)新:平臺兼容現(xiàn)有的AI框架,通過遷移學習、聯(lián)邦學習、增量學習和模型壓縮等技術(shù)實現(xiàn)協(xié)同訓練和協(xié)同推理,解決邊緣數(shù)據(jù)樣本少,冷啟動、邊緣數(shù)據(jù)隱私問題等,讓模型越用越精確。
模式創(chuàng)新:5G MEC下沉,降低業(yè)務(wù)時延;平臺在產(chǎn)業(yè)層實現(xiàn)多企業(yè)MEC協(xié)同接口,匯聚產(chǎn)業(yè)資源,優(yōu)化資源配置,有助于構(gòu)建產(chǎn)業(yè)生態(tài)。
應(yīng)用創(chuàng)新:結(jié)合不同層級不同環(huán)境的計算設(shè)備承擔不同算力需求的任務(wù),結(jié)合企業(yè)需求,提供定制化的AI協(xié)同服務(wù)。
五、 測試床實施部署
5.1. 測試床實施規(guī)劃
本測試床實施分為三個階段:
? 第1階段:2021.02-2021.03
開展測試床場景梳理、可行性評估、測試床架構(gòu)設(shè)計等工作。
? 第2階段:2021.04-2021.07
開展測試床實施方案設(shè)計、設(shè)備選型與環(huán)境建設(shè)、測試床平臺功能測試等工作。
? 第3階段:2021.08-2022.01
開展測試床部署、典型應(yīng)用場景驗證、輸出針對焊點檢測常間的實施方案等工作。
5.2. 測試床實施的技術(shù)支撐及保障措施
本測試床參與方分工協(xié)作,共同支撐與保障本測試床的實施工作:
中國電信股份有限公司研究院負責基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床部署與驗證。
瑞斯康達科技發(fā)展股份有限公司負責提供智能工廠典型應(yīng)用場景環(huán)境,參與現(xiàn)場測試床驗證等工作。
5.3. 測試床實施的自主可控性
本測試床實施各項關(guān)鍵技術(shù)均為自主研發(fā),具有良好的自主可控性。
六、 測試床預期成果
1. 適配異構(gòu)邊緣AI設(shè)備適配
實施前:目前的模型在某些硬件平臺上無法直接運行,與硬件環(huán)境有強依賴。
實施后:與硬件設(shè)備廠商開展合作,適配設(shè)備環(huán)境,實現(xiàn)自動化資源適配。
2. 邊緣AI協(xié)同基礎(chǔ)框架實現(xiàn)
實施前:目前平臺的云邊協(xié)同平臺未支持各種AI框架、未實現(xiàn)對數(shù)據(jù)集和模型的管理。
實施后:云邊支持TensorFlow、pytorch等AI端框架、數(shù)據(jù)集管理、模型管理、跨云邊數(shù)據(jù)同步等。
3. 跨邊云協(xié)同訓練推理構(gòu)建
實施前:云端訓練,邊緣推理,邊端不支持大模型的運行。
實施后:合理利用云邊資源,根據(jù)負載,對應(yīng)用類型實時調(diào)度,實現(xiàn)高性能、低成本、數(shù)據(jù)安全。
4. 增量學習、聯(lián)邦學習和遷移學習驗證
實施前:缺少跨邊云AI協(xié)同優(yōu)化框架實施情況
實施后:支持多種模型優(yōu)化方案,保證AI模型長期穩(wěn)定可靠運行。
6.2. 測試床的商業(yè)價值、經(jīng)濟效益
首個具有增量學習、聯(lián)邦學習、遷移學習框架、協(xié)同訓練推理的平臺:解決邊緣智能跨云邊協(xié)同訓練推理落地推廣中遇到的AI模型訓練等棘手問題。
讓工廠用得方便的邊緣智能:提供定制化的服務(wù),實現(xiàn)企業(yè)的智能化生產(chǎn)與監(jiān)控,持續(xù)優(yōu)化提升工廠的智能化水平,節(jié)約資源,提升效率。
6.3. 測試床可推廣性
1. 形成可推廣解決方案
可基于5G定制網(wǎng),以邊緣智能為核心,形成面向智慧工廠的AI定制協(xié)同服務(wù)解決方案:
l 邊緣智能AI跨邊云協(xié)同服務(wù)框架
l AI跨邊云協(xié)同服務(wù)產(chǎn)品:工業(yè)智能邊緣設(shè)備+定制化AI跨邊云協(xié)同服務(wù)
l 面向智慧工廠集成產(chǎn)品:端+網(wǎng)+云+AI協(xié)同管理
2. 可推廣垂直行業(yè)
以瑞斯康達測試床為基礎(chǔ),向柔性制造行業(yè)推廣,如網(wǎng)關(guān)設(shè)備制造、MEC設(shè)備制造等。
以焊點檢測場景實施為基礎(chǔ),向其他工業(yè)智能場景推廣,如產(chǎn)品質(zhì)量檢測、防靜電服檢測、人臉識別、安全模識別檢測等。
3. 推廣路徑
? 技術(shù)推廣:牽頭制定行業(yè)標準、測試床推廣、典型案例推廣
? 產(chǎn)品推廣:不斷豐富邊云協(xié)同訓練推理框架在智慧工廠場景的實施部署
? 服務(wù)推廣:打造面向智慧工廠邊云協(xié)同平臺培訓/展示服務(wù),帶動更多行業(yè)和企業(yè)部署
七、 測試床成果驗證
本測試床部署在工廠車間內(nèi),在此進行測試床成果的測試與驗證。具體時間計劃見測試床實施規(guī)劃時間表。
7.2. 測試床成果驗證方案
1. 邊緣智能服務(wù)部署驗證內(nèi)容
? 適合工廠特定場景的自研輕量級邊緣模型和云模型
? 實現(xiàn)模型管理和數(shù)據(jù)集管理
? 具有與邊緣模型相匹配算力的智能邊緣設(shè)備
2. 跨云邊協(xié)同訓練推理平臺驗證內(nèi)容
? 兼容現(xiàn)有的AI框架
? 具備聯(lián)邦學習、遷移學習、增量學習模型的協(xié)同訓練框架
? 具備云邊協(xié)同推理框架
無關(guān)系
9.1. 測試床成果交付件
? 具備可定制的邊緣智能AI跨邊云協(xié)同服務(wù),適用于企業(yè)/園區(qū)等特定場景的需求
? 自研跨邊云協(xié)同訓練推理平臺,普遍適用于工廠智能生產(chǎn),智能監(jiān)控等場景
? 典型工廠焊點檢測、安全帽識別和人臉識別等場景的跨云邊協(xié)同訓練和協(xié)同推理的智能AI邊緣部署方案
9.2. 測試床可復制性
本測試具有較好的復制推廣性。一方面以瑞斯康達測試床為基礎(chǔ),向柔性制造行業(yè)復制推廣,如網(wǎng)關(guān)制造、MEC設(shè)備制造等;另一方面,以焊點檢測場景實施為基礎(chǔ),向其他場景推廣,如產(chǎn)品質(zhì)量檢測、防靜電服檢測、人臉識別、安全帽識別等。
9.3. 測試床開放性
本測試床可開放給更多通訊提供商、運營商和制造企業(yè)共同參與測試床驗證與推廣工作。
10.1. 測試床使用者
歡迎所有的AII成員企業(yè)參與和使用本測試床項目。然而,在初始階段,由于試驗站點的訪問權(quán)限有限,本測試床將僅限于現(xiàn)有的合作伙伴。之后,本測試床將逐步開放給更多AII成員企業(yè)使用。
10.2. 測試床知識產(chǎn)權(quán)說明
中國電信與瑞斯康達科技發(fā)展股份有限公司共同對測試床的建設(shè)、運營以及使用擁有產(chǎn)權(quán)。
10.3. 測試床運營及訪問使用
測試床的部署和運營將在瑞斯康達工廠進行?,F(xiàn)階段訪問控制和管理權(quán)限僅限于測試床參與企業(yè)。
10.4. 測試床資金
測試床的資金將來自于測試床參與企業(yè)。
10.5. 測試床時間軸
第1階段(2021.01-2021.03):完成測試床場景梳理、可行性評估、測試床架構(gòu)設(shè)計等工作。
第2階段(2021.01-2021.07):完成測試床實施方案設(shè)計、設(shè)備選型與環(huán)境建設(shè)、測試床平臺功能測試等工作。
第3階段(2021.08-2022.01):完成測試床部署、測試床典型應(yīng)用場景驗證、輸出針對焊點檢測場景的實施方案等工作。
本報告所載的材料和信息,包括但不限于文本、圖片、數(shù)據(jù)、觀點、建議,不構(gòu)成法律建議,也不應(yīng)替代律師意見。本報告所有材料或內(nèi)容的知識產(chǎn)權(quán)歸工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟所有(注明是引自其他方的內(nèi)容除外),并受法律保護。如需轉(zhuǎn)載,需聯(lián)系本聯(lián)盟并獲得授權(quán)許可。未經(jīng)授權(quán)許可,任何人不得將報告的全部或部分內(nèi)容以發(fā)布、轉(zhuǎn)載、匯編、轉(zhuǎn)讓、出售等方式使用,不得將報告的全部或部分內(nèi)容通過網(wǎng)絡(luò)方式傳播,不得在任何公開場合使用報告內(nèi)相關(guān)描述及相關(guān)數(shù)據(jù)圖表。違反上述聲明者,本聯(lián)盟將追究其相關(guān)法律責任。