太原工業(yè)學(xué)院范剛獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉太原工業(yè)學(xué)院申請(qǐng)的專利基于深度學(xué)習(xí)的智能圖像識(shí)別系統(tǒng)及方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119963950B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-06-20發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510451037.4,技術(shù)領(lǐng)域涉及:G06V10/774;該發(fā)明授權(quán)基于深度學(xué)習(xí)的智能圖像識(shí)別系統(tǒng)及方法是由范剛;劉曉進(jìn);黃剛;李蕓;殷國(guó)玲;李佳設(shè)計(jì)研發(fā)完成,并于2025-04-11向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于深度學(xué)習(xí)的智能圖像識(shí)別系統(tǒng)及方法在說明書摘要公布了:本發(fā)明公開了基于深度學(xué)習(xí)的智能圖像識(shí)別系統(tǒng)及方法,包括:通過預(yù)訓(xùn)練的圖像和文本特征提取網(wǎng)絡(luò)分別從圖像和文本中提取高級(jí)語義特征;使用擴(kuò)展網(wǎng)絡(luò)將圖像和文本特征從低維空間映射到更高維度;引入局部和全局對(duì)比學(xué)習(xí)策略,通過動(dòng)態(tài)重采樣和記憶增強(qiáng)機(jī)制優(yōu)化圖像和文本特征的相似性;通過生成對(duì)抗網(wǎng)絡(luò)或變分自編碼器從圖像特征生成輔助文本信息,并與真實(shí)文本標(biāo)簽進(jìn)行對(duì)比學(xué)習(xí);在高維統(tǒng)一嵌入空間中,通過精細(xì)的回歸優(yōu)化和語義匹配評(píng)分機(jī)制,使得圖像和文本在推理階段能夠高效匹配并完成圖像識(shí)別任務(wù)。本發(fā)明可以使圖像和文本的語義相似度得以通過相同的距離度量進(jìn)行比較,從而在推理階段實(shí)現(xiàn)高效的圖像與文本匹配。
本發(fā)明授權(quán)基于深度學(xué)習(xí)的智能圖像識(shí)別系統(tǒng)及方法在權(quán)利要求書中公布了:1.基于深度學(xué)習(xí)的智能圖像識(shí)別方法,其特征在于,包括:步驟1:通過預(yù)訓(xùn)練的圖像和文本特征提取網(wǎng)絡(luò)分別從圖像和文本中提取高級(jí)語義特征;步驟2:使用擴(kuò)展網(wǎng)絡(luò)將圖像和文本特征從低維空間映射到更高維度,增強(qiáng)語義信息,并通過對(duì)齊層將兩者映射到統(tǒng)一的高維語義空間;步驟3:引入局部和全局對(duì)比學(xué)習(xí)策略,通過動(dòng)態(tài)重采樣和記憶增強(qiáng)機(jī)制優(yōu)化圖像和文本特征的相似性,強(qiáng)化多模態(tài)間的語義關(guān)聯(lián),包括:通過引入局部和全局對(duì)比學(xué)習(xí)策略,優(yōu)化圖像和文本特征的相似性,強(qiáng)化多模態(tài)間的語義關(guān)聯(lián),局部對(duì)比學(xué)習(xí)聚焦于物體級(jí)別語義對(duì)比,設(shè)計(jì)局部對(duì)比損失函數(shù),最大化正樣本對(duì)相似度,最小化負(fù)樣本對(duì)相似度,引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)有效局部特征;全局對(duì)比學(xué)習(xí)關(guān)注整體場(chǎng)景或語境對(duì)比,設(shè)計(jì)全局對(duì)比損失函數(shù),優(yōu)化模型對(duì)整體場(chǎng)景的理解;還引入動(dòng)態(tài)重采樣機(jī)制,根據(jù)模型當(dāng)前學(xué)習(xí)情況,動(dòng)態(tài)選擇大難度樣本,增加困難樣本出現(xiàn)概率,避免過擬合簡(jiǎn)單類別,同時(shí),借助記憶增強(qiáng)對(duì)比學(xué)習(xí),利用記憶網(wǎng)絡(luò)存儲(chǔ)歷史對(duì)比樣本,通過回放機(jī)制幫助模型記住類別間語義差異;步驟4:通過生成對(duì)抗網(wǎng)絡(luò)或變分自編碼器從圖像特征生成輔助文本信息,并與真實(shí)文本標(biāo)簽進(jìn)行對(duì)比學(xué)習(xí),進(jìn)一步細(xì)化圖像和文本的語義映射;步驟5:在高維統(tǒng)一嵌入空間中,通過回歸優(yōu)化和語義匹配評(píng)分機(jī)制,使得圖像和文本在推理階段能夠高效匹配并完成圖像識(shí)別任務(wù),包括:通過回歸優(yōu)化機(jī)制,采用雙向距離損失函數(shù),最小化匹配樣本距離,最大化非匹配樣本距離,實(shí)現(xiàn)圖像和文本嵌入空間優(yōu)化,引入平衡因子調(diào)整優(yōu)化強(qiáng)度,保持圖像和文本語義一致性及適度多樣性;在推理階段,對(duì)新圖像和文本描述,先通過特征提取網(wǎng)絡(luò)提取高級(jí)特征,再通過擴(kuò)展網(wǎng)絡(luò)映射到高維嵌入空間對(duì)齊,通過語義匹配評(píng)分衡量圖像和文本相似性,判斷匹配程度,對(duì)于目標(biāo)檢測(cè)任務(wù),結(jié)合圖像區(qū)域特征和文本特征,利用區(qū)域卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)定位,結(jié)合匹配評(píng)分確認(rèn)目標(biāo)類別,最終實(shí)現(xiàn)高精度的圖像識(shí)別。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人太原工業(yè)學(xué)院,其通訊地址為:030008 山西省太原市尖草坪區(qū)新蘭路31號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 福特全球技術(shù)公司馬呂斯·薩瓦茨基獲國(guó)家專利權(quán)
- 威博外科公司D.J.卡格爾獲國(guó)家專利權(quán)
- 夏敬懿獲國(guó)家專利權(quán)
- 英特爾公司K·庫(kù)馬爾獲國(guó)家專利權(quán)
- 波音公司C·A·史密斯獲國(guó)家專利權(quán)
- 人眼安全公司賈斯廷·巴雷特獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司迪安·M·賈拉迪獲國(guó)家專利權(quán)
- 李志毅獲國(guó)家專利權(quán)
- 馬布林克生物科學(xué)公司W(wǎng)·弗里塞爾獲國(guó)家專利權(quán)
- 英特爾公司A·R·阿普獲國(guó)家專利權(quán)


熱門推薦
- 瑞典愛立信有限公司M.C.巴托洛梅羅德里戈獲國(guó)家專利權(quán)
- 約翰·尊科股份有限公司查德·卡羅爾獲國(guó)家專利權(quán)
- 上海至純潔凈系統(tǒng)科技股份有限公司連海洲獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司維吉亞巴布·杰亞拉曼獲國(guó)家專利權(quán)
- 浙江錦源實(shí)業(yè)有限公司施俊杰獲國(guó)家專利權(quán)
- 高通股份有限公司K·古拉蒂獲國(guó)家專利權(quán)
- 蘋果公司M·萬歐斯獲國(guó)家專利權(quán)
- 山東省生物制品研究所彭延杰獲國(guó)家專利權(quán)
- 上海市政工程設(shè)計(jì)研究總院(集團(tuán))有限公司顏海獲國(guó)家專利權(quán)
- 中國(guó)電力科學(xué)研究院有限公司周軍獲國(guó)家專利權(quán)