1.一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其特征在于,包括以下步
驟:
數據收集:收集多個時間點的兒童個體口腔樣本;
數據轉化:提取獲得口腔樣本的DNA信息,利用生物信息學方法將所述DNA信息轉化為
口腔微生物群落信息;
數據模型的初步構建:將獲得的口腔微生物群落信息作為輸入變量,利用隨機森林方
法,將其對年齡信息進行回歸,初步構建基于口腔微生物群落信息檢測生物年齡的初步數
學模型;
數學模型的優化和確定:根據變量在模型的重要性程度排序,在不影響模型性能前提
下簡化模型變量組合,最終確定兒童個體年齡檢測的模型;
兒童個體生物年齡的檢測:將所需微生物群落信息作為輸入變量,利用已建立的數學
模型進行回歸分析,獲得所檢測的兒童個體此時生物年齡。
2.根據權利要求1所述的一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其
特征在于,所述口腔樣本為唾液或齦上牙菌斑樣本。
3.根據權利要求1所述的一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其
特征在于,所述將DNA信息轉化為口腔微生物群落信息包括以下步驟:
通過高通量測序手段獲得DNA信息的16s RNA或全基因組信息;
針對16s RNA或全基因組信息進行從門到種水平細菌種系信息劃歸;
分別統計每個樣品在種水平上各物種的序列數,并與該樣品總體獲得的序列數計算其
比值,從而獲取每個各物種的相對豐度。
4.根據權利要求1所述的一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其
特征在于,所述數據模型的初步構建,包括以下步驟:
1)將獲得的口腔微生物的全部細菌種水平的組成及其相對豐度作為輸入變量;
2)利用隨機森林方法,將輸入變量對兒童個體的年齡信息進行回歸,初步構建基于口
腔微生物群落信息檢測生物年齡的初步數學模型。
5.根據權利要求1所述的一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其
特征在于,所述數據模型的優化和確定,包括以下步驟:
1)獲得初步數學模型中代表菌的種類的各個變量對模型性能的重要性程度;
2)按照變量對模型重要性程度從小到大排序,逐步減少變量數量,利用隨機森林方法,
進行對年齡的回歸分析,獲得不同變量組合的模型;
3)評價在不降低模型性能前提下的最簡化變量組合,確定為年齡相關變量,從而確定
最終優化模型。
6.根據權利要求1所述的一種基于口腔微生物群落獲得兒童個體生物年齡的方法,其
特征在于,所述兒童個體生物年齡的檢測,包括以下步驟:
1)獲取兒童個體口腔樣本的DNA;
2)利用生物信息學方法將DNA信息轉換為口腔微生物群落信息;
3)獲得兒童個體的年齡相關變量的相對豐度;
4)利用隨機森林方法,將年齡相關變量的組成及其豐度作為變量,對建立的年齡檢測
模型進行回歸分析,獲得兒童個體此時的生物年齡。
展開