一種基于“特征降維”文本復雜網絡的特征提取方法

張麗; 馬靜 南京航空航天大學經濟與管理學院; 江蘇南京211106

關鍵詞:文本復雜網絡 特征降維 pca 特征提取 

摘要:【目的/意義】本文構建一種'特征降維'文本復雜網絡進行文本表示,解決傳統詞同現文本復雜網絡處理海量數據時的維數災難與語義不足問題,再結合機器學習方法提升文本特征提取效果。【方法/過程】依據共現關系抽取二級詞條,再結合依存句法關系抽取三級詞條,構建'特征降維'文本復雜網絡,接著利用PCA算法和TOPSIS法評價網絡節點重要性提取反映文本主題的關鍵詞作為文本特征詞,實現文本特征提取。【結果/結論】本文以網絡新聞數據為實驗對象。實驗結果表明,特征降維文本復雜網絡能較好地表示中文文本,并且在較好地保留了文本語義信息的同時有效減少網絡節點冗余,結合PCA算法的特征提取方法可以使文本分類性能提高。

情報科學雜志要求:

{1}摘要論文應附有中英文摘要。摘要應能客觀地反映論文主要內容的信息,具有獨立性和自含性。一般不超過200字,以與正文不同的字體字號排在作者署名與關鍵詞之間。

{2}本刊提倡嚴謹的學風,堅持“百花齊放,百家爭鳴”的方針,堅持相互尊重的自由討論。

{3}正文(包括圖、表)中的物理量和計量單位必須符合國家標準與國際標準。

{4}附錄內容較少,與參考文獻排在同一頁;如出現內容較多,則另起一頁。附錄的字體為12磅,Times New Roman字體,加粗。附錄內容格式要求與正文一致。

{5}本刊用稿采取三審四校制。來稿應包括題名、作者姓名、作者單位、中英文摘要與關鍵詞、主要作者簡介、正文、參考文獻等。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

情報科學

CSSCI南大期刊
預計1-3個月審稿

期刊主頁
相關期刊
我們的服務
主站蜘蛛池模板: 口工全彩无遮挡3d漫画在线| 国产精品视频白浆免费视频| 久久亚洲精品专区蓝色区| 欧美综合一区二区三区| 全部免费毛片免费播放| 超清首页国产亚洲丝袜| 国产男人的天堂| 91精品天美精东蜜桃传媒入口| 尤果圈3.2.6破解版| 久久亚洲国产成人亚| 欧美va天堂视频在线| 亚洲福利视频网| 精品久久久久久亚洲综合网| 国产jizzjizz视频全部免费| 麻豆精产国品一二三产品区| 国产精品亚洲综合| 97人伦影院a级毛片| 女人被弄到高潮的免费视频| 中文字幕一二三区乱码老| 日本特黄特色特爽大片老鸭| 亚洲aaa视频| 欧美人猛交日本人xxx| 亚洲精品动漫在线| 秋葵视频在线观看在线下载| 同学麻麻下面好紧第一次| 色综合五月婷婷| 国产呻吟久久久久久久92| 色聚网久久综合| 国产系列在线播放| 99亚洲精品视频| 天天操天天射天天| 一级毛片免费全部播放| 放荡女同老师和女同学生| 久久只有这才是精品99| 晓青老师的丝袜| 亚洲一区二区三区在线观看蜜桃| 欧美日韩3751色院应在线影院| 人妻丰满熟妇无码区免费| 看国产一级毛片| 内射白浆一区二区在线观看| 美国亚洲成年毛片|