CGBVSによる化合物スクリーニングソフトウェア「CzeekS」のマシンラーニングベース予測モデルが更新されました。主な更新内容は以下となります。
- ChEMBLデータのリリース30を使用しました
- Kinaseモデル対象タンパク質は495個になりました
- Esteraseモデルを新規追加し、合計9モデルになりました
- 全モデルで標的タンパク数は1595個になりました
尚、モデルは以下のように作成しています。
- データソースはChEMBLとTIMBAL DBを利用しています
- モデルはStandard (STD)とHigh Activity (HA)の2種があります
- 活性値のPositive/Negativeカットオフ は次の通りです→ STD:10uM/30uM、HA:1uM/3uM
モデルの内容については以下のテーブルをご確認ください。計算可能タンパクリストはこちらのリンクからご確認できます。
| モデル | Standard Activity (STD) | High Activity (HA) | 対象タンパク ファミリー (一部) |
||
| タンパク数 | 学習データ数 | タンパク数 | 学習データ数 | ||
| Cytochrome P450 | 39 | 42,654 | 29 | 14,449 | Cytochrome P450, Aromatase |
| Esterase | 171 | 106,874 | 146 | 46,836 | Phosphodiesterase, Phosphatase |
| GPCR | 259 | 189,474 | 255 | 183,432 | ClassAα, ClassAβ, ClassAδ, ClassAγ, ClassB, ClassC |
| Ion channel | 181 | 58,348 | 173 | 40,545 | Voltage-gated, Ligand-gated |
| Kinase | 495 | 199,403 | 483 | 208,349 | AGC, CAMK, CMGC, STE, TK, TKL |
| Nuclear receptor | 42 | 37,529 | 42 | 25,489 | NR1, NR2, NR3, NR4, NR5 |
| PPI | 53 | 42,215 | 50 | 22,978 | Integrins, Bcl2, MDM |
| Protease | 235 | 108,502 | 218 | 75,526 | Endopeptidase, Exopeptidase |
| Transporter | 121 | 44,405 | 101 | 20,754 | Electrochemical, ATPase, ATP-binding casette |
Category: CGBVS/CzeekS