1.基于分子結構預測有機化合物的牛血清白蛋白-水分配系數的方法,其特征在于該
方法采用以下的模型進行牛血清白蛋白-水分配系數預測:
logKBSA/W = 0.747×logKow + 0.476×EHOMO - 0.024×CCR + 0.870×q+ + 0.007×
CSEV + 4.342;
其中,logKow 表示正辛醇-水分配系數,EHOMO表示最高占據分子軌道能,CCR表示核-核
排斥能, q+表示最正凈電荷,CSEV 表示Connolly溶劑排斥體積;
所述的模型建立的方法包括以下的步驟:
1) 首先,選擇了來自于同一個實驗室使用相同方法測定的logKBSA/W值;整個數據集共
包括75個中性有機化合物,logKBSA/W的數值范圍為1.19~4.76,跨越3.6個數量級;
2) 根據化合物在BSA和水相之間分配機理的分析,共選擇21種分子結構描述符用于模
型的構建;所述的21種分子結構描述符分別為平均分子極化率α、偶極矩μ、μ2、標準生成熱
ΔHf、總能量TE、電子能EE、核-核排斥能CCR、最低未占據分子軌道能ELUMO、最高占據分子軌
道能EHOMO、碳原子最負凈電荷qC–、氫原子最正凈電荷qH+、最負凈電荷q–、最正凈電荷q+、
COSMO面積Acosmo、COSMO體積Vcosmo、分子量Mw、Connolly溶劑可及分子表面積CAA、Connolly分
子表面積CMA、Connolly溶劑排斥體積CSEV、橢圓度Ov和正辛醇-水分配系數logKow;
使用MOPAC2012中的PM6算法對分子結構進行優化并計算平均分子極化率α、偶極矩μ、
μ2、標準生成熱ΔHf、總能量TE、電子能EE、核-核排斥能CCR、最低未占據分子軌道能ELUMO、最
高占據分子軌道能EHOMO、碳原子最負凈電荷qC–、氫原子最正凈電荷qH+、最負凈電荷q–、最正
凈電荷q+、COSMO面積Acosmo和COSMO體積Vcosmo15種量子化學描述符,使用ChemOffice 2010和
EPI Suite分別計算分子量Mw、Connolly溶劑可及分子表面積CAA、Connolly分子表面積
CMA、Connolly溶劑排斥體積CSEV、橢圓度Ov和正辛醇-水分配系數logKow 6種性質參數;
3) 采用多元線性回歸MLR方法中的逐步回歸理論建立模型,具體過程由SPSS 17.0執
行;使用相關系數的平方r2和均方根誤差rms作為統計學指標表征模型的擬合性能,使用預
測相關系數的平方q2表征模型的預測性能;
經MLR分析得到的最優模型為:
logKBSA/W = 0.747×logKow + 0.476×EHOMO - 0.024×CCR + 0.870×q+ + 0.007×
CSEV + 4.342;
其中,logKow 表示正辛醇-水分配系數,EHOMO表示最高占據分子軌道能,CCR表示核-核
排斥能,q+表示最正凈電荷,CSEV 表示Connolly溶劑排斥體積。
2.根據權利要求1所述的基于分子結構預測有機化合物的牛血清白蛋白-水分配系數
的方法,其特征在于:有機化合物包括烷烴、烯烴、鹵代烴、醇、苯酚、醚、酮、苯胺、脂肪胺、硝
基化合物、多環芳烴、雜環化合物和苯的衍生物。
展開