Hi, I'm Kotori 👋
个人简历
本科 长春中医药大学 药学 2014.09 - 2018.06
主修课程:药剂学,药理学,药物化学,药物分析,
有机化学,分析化学,生物化学,新药设计开发等。
硕士 中南大学 药物化学 计算机辅助药物设计 2018.09 - 2021.06
研究方向:基于人工智能的药物性质预测模型的开发,化学信息学工具的开发及应用等。
英语等级:CET-4
- 2019年第15届全国计算(机)化学学术会议优秀墙报 (13/150)
- 项目地址:https://github.com/kotori-y/Scopy
- 项目简介:高通量筛选(HTS)和虚拟筛选(VS)现已广泛用于在先导化合物发现。但是,大型化学文库中的许多分子表现出较差的类药性,多靶点结合性和潜在毒性,大大削弱了HTS和VS的效率。Scopy是基于Python语言的负向设计工具, 可用于过滤筛选库中的不良化合物,从而提升先导化合物发现的效率。
- 论文发表:Yang, Z. Y., Yang, Z. J., et al.,Lu, A. P., Hou, T. J., & Cao, D. S. (2020). Briefings in Bioinformatics
(doi: 10.1093/bib/bbaa194, IF=8.99). - 软著登记:基于python语言的高通量负向设计虚拟筛选系统(2020SR1189891)
- 项目地址:https://github.com/kotori-y/pySmash
- 项目简介:结构警示(Structural Alerts) 广泛用于分子生物活性和ADMET性质的评估,并且可以辅助解释先导化合物的优化。pySmash专为结构警示的提取及应用设计:提供三种子结构推导算法(环形指纹算法,路径算法,官能团算法);提供Python软件包和用户友好的软件;提供子结构应用的接口,便于其他药物发现工作流的调用。
- 论文发表:Briefings in Bioinformatics. (manuscript)
- 项目地址:http://chemmort.scbdd.com/
- 项目简介:ChemMort是一个结合分子翻译及性质优化的平台,可用于改善目标化合物的ADME/T性质,减少临床试验中由于不良的药物动力学性质而产生的损耗。首先使用当前先进的LSTM神经网络建立了一个分子翻译模型来实现从SMILES到512维的描述符的映射,该描述符经翻译模型还能返回至原始的SMILES,实现“逆向QSAR”。此外,ChemMort还包含了一个基于PSO优化算法及加权算法的优化模型,能够对分子进行多目标优化,在保持生物活性不变的情况下,改善化合物的ADMET性质。
- 论文发表:Nucleic Acid Research (in progress)
- 项目简介:QUANTUM是一个方便的/Python环境无依赖的量子化学描述符提取软件。量子化学描述符具有不依赖实验,无统计误差,物理意义明确,可解释性强,描述分子结构、电子结构及反应性精确等优势,可用于包括毒理学在内的QSAR模型的建立。然而,对于大多数药物化学家来说,从Gaussian等计算量子化学特征的软件输出的结果文件中,提取位于模型技术底层的量子化学描述符是一项非常困难且耗时的任务。QUANTUM基于Python语言,使用字符串匹配进行特征提取,可对Gaussian软件计算输出文件的17个局部和39个全局量子化学描述符进行自动提取。
- 频繁命中化合物预测系列平台:ChemAgg等.机器学习模型建立
- 集成靶点预测分析平台:metaTarFisher.底层爬虫编写及平台维护
- 基本分子描述符在线计算平台:BDes.描述符算法编写
- 掌握Python编程语言及相关项目开发;
- 掌握RDKit, OpenBabel及MOE等化学信息学工具;
- 掌握HTML, JavaScript及CSS等前端开发工具;
- 熟悉TensorFlow, pyTorch和Scikit-learn等主流人工智能学习框架及主流机器学习算法;
- 熟悉动态规划、二分查找、回溯等算法;
- 了解C++, Go, R等主流编程语言。
- Z. Yang, Z. Yang, J. Dong, L. Wang, L. Zhang, J. Ding, X. Ding, A. Lu, T. Hou, and D. Cao, Structural analysis and identification of colloidal aggregators in drug discovery. Journal of chemical information and modeling 59 (2019) 3714-3726.
- L. Fu, L. Liu, Z. Yang, P. Li, J. Ding, Y. Yun, A. Lu, T. Hou, and D. Cao, Systematic Modeling of log D 7.4 Based on Ensemble Machine Learning, Group Contribution, and Matched Molecular Pair Analysis. Journal of chemical information and modeling 60 (2019) 63-76.
- Z. Yang, J. Dong, Z. Yang, M. Yin, H. Jiang, A. Lu, X. Chen, T. Hou, and D. Cao, ChemFLuo: a web-server for structure analysis and identification of fluorescent compounds. Briefings in Bioinformatics (2020).
- Z. Yang, J. Dong, Z. Yang, A. Lu, T. Hou, and D. Cao, Structural analysis and identification of false positive hits in luciferase-based assays. Journal of chemical information and modeling 60 (2020) 2031-2043.
- Z. Yang, Z. Yang, A. Lu, T. Hou, and D. Cao, Scopy: an integrated negative design python library for desirable HTS/VS database design. Briefings in Bioinformatics (2020).
- L. Fu, Z. Yang, Z. Yang, M. Yin, A. Lu, X. Chen, S. Liu, T. Hou, and D. Cao, QSAR-assisted-MMPA to expand chemical transformation space for lead optimization. Briefings in Bioinformatics (2021).
- Z. Yang, Z. Yang, J. He, A. Lu, S. Liu, T. Hou, and D. Cao, Benchmarking the mechanisms of frequent hitters: limitation of PAINS alerts. Drug Discovery Today (2021).
- Z. Yang, Z. Yang, Y. Zhao, M. Yin, A. Lu, X. Chen, S. Liu, T. Hou, and D. Cao, PySmash: Python package and individual executable program for representative substructure generation and application. Briefings in Bioinformatics (2021).
- G. Xiong, Z. Wu, J. Yi, L. Fu, Z. Yang, C. Hsieh, M. Yin, X. Zeng, C. Wu, and A. Lu, ADMETlab 2.0: an integrated online platform for accurate and comprehensive predictions of ADMET properties. Nucleic Acids Research (2021).