CGBVSによる化合物スクリーニングソフトウェア「CzeekS」のマシンラーニングベース予測モデルが更新されました。主な更新内容は以下となります。
- ChEMBLデータのリリース30を使用しました
- Kinaseモデル対象タンパク質は495個になりました
- Esteraseモデルを新規追加し、合計9モデルになりました
- 全モデルで標的タンパク数は1595個になりました
尚、モデルは以下のように作成しています。
- データソースはChEMBLとTIMBAL DBを利用しています
- モデルはStandard (STD)とHigh Activity (HA)の2種があります
- 活性値のPositive/Negativeカットオフ は次の通りです→ STD:10uM/30uM、HA:1uM/3uM
モデルの内容については以下のテーブルをご確認ください。計算可能タンパクリストはこちらのリンクからご確認できます。
モデル | Standard Activity (STD) | High Activity (HA) | 対象タンパク ファミリー (一部) |
||
タンパク数 | 学習データ数 | タンパク数 | 学習データ数 | ||
Cytochrome P450 | 39 | 42,654 | 29 | 14,449 | Cytochrome P450, Aromatase |
Esterase | 171 | 106,874 | 146 | 46,836 | Phosphodiesterase, Phosphatase |
GPCR | 259 | 189,474 | 255 | 183,432 | ClassAα, ClassAβ, ClassAδ, ClassAγ, ClassB, ClassC |
Ion channel | 181 | 58,348 | 173 | 40,545 | Voltage-gated, Ligand-gated |
Kinase | 495 | 199,403 | 483 | 208,349 | AGC, CAMK, CMGC, STE, TK, TKL |
Nuclear receptor | 42 | 37,529 | 42 | 25,489 | NR1, NR2, NR3, NR4, NR5 |
PPI | 53 | 42,215 | 50 | 22,978 | Integrins, Bcl2, MDM |
Protease | 235 | 108,502 | 218 | 75,526 | Endopeptidase, Exopeptidase |
Transporter | 121 | 44,405 | 101 | 20,754 | Electrochemical, ATPase, ATP-binding casette |
Category: CGBVS/CzeekS