南湖新聞網

香港深圳物流 > 新聞 > 科學研究 > 正文

我校機器學習團隊在高維數據模式分類研究領域取得新進展

核心提示: 近日,我校信息學院王玉龍教授和理學院陳洪教授機器學習團隊在IEEE Transactions on Cybernetics在線發表了題為“Generalized and Discriminative Collaborative Representation for Multiclass Classification”的研究論文。研究人員利用高維數據的內在本質低維結構信息提出了具有高可解釋性、強判別性、高效率的高維數據模式分類方法。

南湖新聞網訊(通訊員 李偉夫)近日,我校信息學院王玉龍教授和理學院陳洪教授機器學習團隊在IEEE Transactions on Cybernetics在線發表了題為“Generalized and Discriminative Collaborative Representation for Multiclass Classification”的研究論文。研究人員利用高維數據的內在本質低維結構信息提出了具有高可解釋性、強判別性、高效率的高維數據模式分類方法。

高維數據廣泛存在於科學研究和社會生活的各個領域中,如高維生物基因表達數據、高維醫學圖像數據、互聯網中的高分辨率圖像(視頻)數據。然而,高維數據往往會引起“維數災難”,降低算法性能,並帶來巨大的存儲和計算負擔。如何利用高維數據的內在結構信息克服上述困難,進而建立高效的高維數據學習方法及理論已成為機器學習領域的熱點課題,具有重要的理論和應用價值。

本研究通過挖掘和利用高維數據的內在本質多低維子空間結構,設計了基於廣義協同表示(Generalized Collaborative Representation)的高維數據模式分類一般框架,從更高層次分析不同表示分類方法的共同屬性和差異,並給出了相應的理論分析,闡明瞭其分類原理和內在機制。為了進一步提升表示係數的辨識度和算法的分類性能,基於該框架設計了一種判別表示高維數據分類方法(Discriminative Representation based Classification, DRC)。該方法同時具備可解釋性高、判別性強和效率高等優點。其分類與識別流程如下圖。

圖片1

此外,研究人員揭示了高維數據空間分佈情況與DRC算法分類性能的關係,並建立了相應的理論保證。該項成果有助於深入理解高維數據的內在結構與模式識別的關係,為高維數據學習和其他機器學習任務的研究提供指導。

本研究是繼2019年在IEEE Transactions on Pattern Analysis and Machine Intelligence和2020年在IEEE Transactions on Cybernetics發表原子表示高維數據學習相關成果後,該團隊在高維數據人工智能方法研究領域取得的新進展。信息學院王玉龍教授為論文第一作者,理學院陳洪教授為論文通訊作者。該研究得到了國家自然科學基金面上項目和青年項目的資助。

審核人:石峯

論文鏈接 //ieeexplore.ieee.org/document/9210834v

責任編輯:徐行 張璐