非平衡分類技術在人群糖尿病疾病風險預測模型中的應用

武海濱; 李康; 楊麗; 胡如英; 鐘節鳴; 游頂云; 郭彧; 卞錚; 李立明; 陳錚鳴 浙江省疾病預防控制中心; 310051; 哈爾濱醫科大學; 浙江醫院; 昆明醫科大學; 中國醫學科學院; 北京大學; 英國牛津大學

關鍵詞:風險預測 非平衡分類 機器學習 流行病 

摘要:目的分析比較幾種常用的非平衡分類技術在人群糖尿病疾病風險預測模型中的應用。方法利用中國慢性病前瞻性研究浙江省桐鄉市項目點基線調查數據和隨訪數據,使用機器學習算法建立人群糖尿病發病風險的預測模型,同時探討欠采樣、過采樣、SMOTE技術及替換切點技術對分類器性能的影響。結果本研究中神經網絡預測模型的AUC值最高,達0.7971,經最優切點的選擇和分類后,靈敏度和特異度分別為0.7149和0.7431,模型具有較高的預測能力,同時較好的平衡了靈敏度和特異度的分布。采樣法對不同分類器的AUC值影響不同,一般欠采樣比過采樣具有更高的AUC值;隨著SMOTE中少數類比例的上升,AUC出現下降的趨勢。結論使用神經網絡結合替換切點技術建立的人群糖尿病5年發病風險模型具有較高的預測能力,并能夠較好的處理非平衡數據的影響。

中國衛生統計雜志要求:

{1}計量單位以國家法定計量單位為準;統計學符號按國家標準《統計學名詞及符號》的規定書寫。

{2}本刊維護首發權,切勿一稿多投。稿件寄出3個月內未收到用稿通知者,作者可自行處理。來稿一律不再退還。

{3}文章題名應簡潔、確切、真實反映文章的主題特色。不超過20字,避免使用非公知公用的縮略字、代號等(一般不用副標題)。

{4}參考文獻:引文務必準確,參考文獻表中列出的應限于作者直接閱讀過的、最主要的、發表在正式出版物上并且在文章中直接引用的文獻;按GB7714-87的規定采用順序編碼標注制著錄。

{5}通訊作者(第一作者)簡介:包括姓名、出生年、性別、民族(指少數民族)、籍貫、職稱(學位)及研究方向(附Email與電話號碼)。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

中國衛生統計

北大期刊
預計1-3個月審稿

期刊主頁
相關期刊
我們的服務
主站蜘蛛池模板: 久久精品美女视频| 日本尤物精品视频在线看| 又大又硬又爽又深免费看 | 欧美性黑人极品hd| 免费看AV毛片一区二区三区| 韩国一级免费视频| 国产精品三级av及在线观看| 99热精品国产麻豆| 小四郎在线观看| 久久久久久久99精品国产片| 权明星商标查询| 亚洲欧美国产中文| 男人女人做30分爽爽视频| 四虎国产精品永久在线播放| 麻豆国产福利91在线| 国产第一福利136视频导航| 91亚洲精品第一综合不卡播放 | 亚洲欧美日韩中文无线码| 男女很舒服爽视频免费| 四虎成人精品无码| 青青草99热这里都是精品| 国产真实乱对白精彩| 91久久另类重口变态| 天天做天天添天天谢| 一区二区高清在线观看| 成人羞羞视频在线观看| 久久久噜噜噜久久中文字幕色伊伊| 樱桃视频影院在线观看| 亚洲国产精品无码久久| 步兵精品手机在线观看| 产国语一级特黄aa大片| 精品一区二区三区无卡乱码| 可以看污视频的网站| 色偷偷AV老熟女| 在线观看二区三区午夜| 一区二区在线播放视频| 成年人在线网站| 久久久久久亚洲av无码专区| 日韩av午夜在线观看| 久久精品国产亚洲av日韩| 欧美一级久久久久久久大片|