基于機器學(xué)習技術的H5Nx禽流感毒株緻病性場裡分類預測分析

2024-02-26 10:02:49

近幾十年來,全球各地都(dōu)有冷冷暴發(fā)禽流感疫情的報道(dào錯你),造成(chéng)了大規模的經(jīng)濟損失和家禽死亡遠人,并在某些情況下引發(fā)了人們對(duì)可能(néng照睡)發(fā)生禽流感人畜共患病的擔憂。可通過(拍雜guò)各種(zhǒng)方法推測個她H5Nx(如H5N1、H5N2)禽流感毒株對(duì)家禽的毒力和緻病性,其你近中常用的方法是檢測其血凝素(HA)基因中年影的某些緻病性标記。利用預測建模方法可以探索基因型與表跳冷型之間的關系,從而幫助專家确定禽流感流行毒株的緻病性。因此海分,本研究的主要目的是評估不同機器學(xué)習(ML)技算土術在利用HA基因的完整遺傳序列對(duì)家禽H5Nx病毒緻病性進(jìn)行能外預測的性能(néng)。本研究基于聚基性HA裂解吃學位點(HACS)的存在情況,對(duì)2137個H5Nx HA基因物店序列進(jìn)行了标記,其中46.33%和53.67%的序列先前已被(b大為èi)分别鑒定爲高緻病性(HP)草資和低緻病性(LP)。我們使用十倍交叉驗證法比較了不同的機器學(xué)習你行分類器(如具有套索和嶺正則化的邏輯回歸(LR),随機森林(RF),K最鄰個腦近法(KNN),樸素貝葉斯(NB),支持向(xiàng)量機(SVM)的影和卷積神經(jīng)網絡(CNN))對(duì)原話開始H5Nx核苷酸和蛋白質序列進(jìn)行緻病性分類的性能(néng)。我章術們發(fā)現,不同的機器學(xué)習技術可成(chéng照海)功用于H5序列的緻病性分類,分水白類準确率約爲99%。我們的研究結果表明,對(duì)于(1)對(duì花都)齊的脫氧核糖核酸(DNA)和蛋白質一務序列,NB分類器的準确率最低,分别爲98.41%(+/-0.89)和她輛98.31%(+/-1.06);(2)對(duì)齊的DNA和蛋白質序列山數,LR(L1/L2),KNN,SVM(徑向(xiàng)湖鐵基函數(RBF))和CNN分類器的準确率最高,分别爲99.2間妹0%(+/-0.54)和99.20%(+/-0.38);(3)未對(信樂duì)齊的DNA和蛋白質序列,CN船西N的準确率分别爲98.54%(+/-0.68)和99.2但訊0%(+/-0.50)。機器學(xué)習方法顯示了對(他讀duì)家禽物種(zhǒng)H5Nx病毒緻病性進(j自劇ìn)行常規分類的潛力,特别是訓著好練數據集經(jīng)常出現含常規标記的序列的河近情況。

原文鏈接:https://pu離輛bmed.ncbi.nlm.nih.gov/37224663算跳/