四川農(nóng)業(yè)大學(xué)陳子墺獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉四川農(nóng)業(yè)大學(xué)申請(qǐng)的專利一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119939482B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-06-20發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510424096.2,技術(shù)領(lǐng)域涉及:G06F18/2433;該發(fā)明授權(quán)一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法是由陳子墺;馮義強(qiáng);王苓;張雨昕;黃文湲;覃涵;劉夢(mèng)可設(shè)計(jì)研發(fā)完成,并于2025-04-07向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法在說明書摘要公布了:本發(fā)明涉及一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法,屬于數(shù)據(jù)處理領(lǐng)域,優(yōu)化方法包括:構(gòu)建社會(huì)工作多模態(tài)數(shù)據(jù),并進(jìn)行數(shù)據(jù)預(yù)處理后將文本轉(zhuǎn)換為嵌入向量;采用流行度偏差正則化處理器通處理社會(huì)工作領(lǐng)域的數(shù)據(jù)輸入;動(dòng)態(tài)選擇降維維度,并采用UMAP算法將BERT嵌入空間中的向量降維;將文檔聚類到相似的嵌入組中,通過計(jì)算數(shù)據(jù)點(diǎn)之間的密度關(guān)系形成層次化的聚類結(jié)構(gòu),并通過密度閾值劃分最終的簇;計(jì)算每個(gè)詞在主題集群中的詞頻和該詞在整個(gè)語料庫中的逆文檔頻率,并計(jì)算語義相似度來重新分配離群點(diǎn)。本發(fā)明優(yōu)化BERTopic模型的多模態(tài)兼容性,支持從不同數(shù)據(jù)來源提取并融合主題信息,增強(qiáng)社會(huì)議題的分析深度。
本發(fā)明授權(quán)一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法在權(quán)利要求書中公布了:1.一種多模態(tài)數(shù)據(jù)驅(qū)動(dòng)的社會(huì)工作領(lǐng)域建模優(yōu)化方法,其特征在于:所述優(yōu)化方法包括:S1、構(gòu)建一個(gè)包含文本、音頻、圖像視頻數(shù)據(jù)的社會(huì)工作多模態(tài)數(shù)據(jù),并進(jìn)行數(shù)據(jù)預(yù)處理后進(jìn)行文本嵌入將文本轉(zhuǎn)換為嵌入向量;S2、采用流行度偏差正則化處理器通過高頻通用詞衰減加權(quán)和社會(huì)學(xué)術(shù)語增強(qiáng)雙重優(yōu)化策略處理社會(huì)工作領(lǐng)域的數(shù)據(jù)輸入;S3、通過動(dòng)態(tài)文檔嵌入優(yōu)化器動(dòng)態(tài)選擇降維維度來優(yōu)化主題建模的效果,并采用UMAP算法將BERT嵌入空間中的向量降維;S4、使用HDBSCAN算法將文檔聚類到相似的嵌入組中以便從中提取主題,通過計(jì)算數(shù)據(jù)點(diǎn)之間的密度關(guān)系形成層次化的聚類結(jié)構(gòu),并通過密度閾值劃分最終的簇;S5、通過c-TF-IDF通過計(jì)算每個(gè)詞在主題集群中的詞頻和該詞在整個(gè)語料庫中的逆文檔頻率來衡量詞匯的重要性,并通過概率重分配矩陣方法計(jì)算語義相似度來重新分配離群點(diǎn),以確保數(shù)據(jù)的最大化利用;所述通過概率重分配矩陣方法計(jì)算語義相似度來重新分配離群點(diǎn)包括:構(gòu)建文檔-主題概率矩陣:概率重分配矩陣為每個(gè)文檔計(jì)算其屬于各個(gè)主題的概率分布,每個(gè)文檔的概率分布表示該文檔屬于每個(gè)主題的概率;對(duì)于每個(gè)文檔,所有主題的概率總和為1,即,其中,M為主題的總數(shù),表示每個(gè)文檔在所有主題中的分布情況;計(jì)算每個(gè)文檔對(duì)各主題的概率:對(duì)于被標(biāo)記為離群點(diǎn)的文檔,概率重分配矩陣計(jì)算每個(gè)文檔與各個(gè)主題之間的相似性,并將其概率性地重新分配給最接近的主題,概率重分配矩陣使用一個(gè)距離度量函數(shù)來衡量文檔和主題之間的相似度,設(shè)文檔和主題之間的相似度通過來表示,PRM使用以下公式計(jì)算文檔屬于主題的概率為,進(jìn)而得到文檔屬于各個(gè)主題的概率,其中,是當(dāng)前文檔與某個(gè)特定主題的距離,是當(dāng)前文檔與所有主題的距離,用于衡量文檔與各個(gè)主題的匹配程度,距離越小,表示越相關(guān),最終用于通過Softmax轉(zhuǎn)換為概率;更新離群點(diǎn)的主題分配:一旦每個(gè)文檔的主題概率分布計(jì)算出來,概率重分配矩陣根據(jù)每個(gè)文檔對(duì)各個(gè)主題的概率分布決定該文檔是否應(yīng)該重新分配到某個(gè)主題中,尤其是那些被HDBSCAN標(biāo)記為離群點(diǎn)的文檔,如果某個(gè)文檔在某個(gè)主題上的概率高,且超過設(shè)定的閾值,則該文檔被重新分配到最接近的主題簇。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人四川農(nóng)業(yè)大學(xué),其通訊地址為:625000 四川省雅安市雨城區(qū)新康路46號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 國家電投集團(tuán)遠(yuǎn)達(dá)環(huán)保工程有限公司重慶科技分公司李升華獲國家專利權(quán)
- 波士頓科學(xué)國際有限公司許明翔獲國家專利權(quán)
- 青島海爾空調(diào)器有限總公司董旭獲國家專利權(quán)
- 中央大學(xué)校產(chǎn)學(xué)協(xié)力團(tuán)尹裕植獲國家專利權(quán)
- 皇家飛利浦有限公司S·小夸雷斯瑪獲國家專利權(quán)
- 原相科技股份有限公司韓威如獲國家專利權(quán)
- 北京小米移動(dòng)軟件有限公司武雋獲國家專利權(quán)
- 株式會(huì)社半導(dǎo)體能源研究所山崎舜平獲國家專利權(quán)
- 漢瓦真空技術(shù)(無錫)有限公司劉順華獲國家專利權(quán)
- 思睿邏輯國際半導(dǎo)體有限公司A·S·多伊獲國家專利權(quán)


熱門推薦
- 三星電機(jī)株式會(huì)社鄭昇賢獲國家專利權(quán)
- 江蘇通付盾信息安全技術(shù)有限公司汪德嘉獲國家專利權(quán)
- 深圳市遠(yuǎn)望工業(yè)自動(dòng)化設(shè)備有限公司龍超祥獲國家專利權(quán)
- 任弘毅獲國家專利權(quán)
- 上海鳴志自動(dòng)控制設(shè)備有限公司涂必林獲國家專利權(quán)
- 長(zhǎng)鑫存儲(chǔ)技術(shù)有限公司請(qǐng)求不公布姓名獲國家專利權(quán)
- 日亞化學(xué)工業(yè)株式會(huì)社巖倉大典獲國家專利權(quán)
- 青島海爾空調(diào)器有限總公司董旭獲國家專利權(quán)
- 魯姆斯科技有限責(zé)任公司加里·喬治·波德雷巴拉克獲國家專利權(quán)
- 華為技術(shù)有限公司彭文杰獲國家專利權(quán)