药物知识挖掘课题

基于专属语料库开发和神经网络语义挖掘的药物推荐知识系统

Our Mission

我们的任务

药物重定位通过挖掘现有药物新用途,克服新药研发的长周期、高投入和低效益等弊端, 具有重要的科学意义和广阔的市场前景。

针对当前普遍面临的“机理解释困难”、“单组学数据稀疏”和“多组学数据弱关联”等困境,本项目拟提出一套药物重定位数据构建和算法流程 。通过构建“基因突变事件”语料库(AGAC)来刻画从突变基因到下游系列分子对象的生物活 动和机理,设计一套基于生物医药自然语言处理和多组学数据融合的算法流程进行知识推断。 该算法流程使用神经网络、变分推断和张量分解进行“基因突变事件”识别、“功能变化”分 类和知识条目预测,关联使用文本数据、突变、通路、药物、表型等多组学数据,同时解决数 据稀疏和数据弱关联的问题。

本项目最终拟针对常见疾病获得“突变基因-功能变化-疾病”知识条目库,进行大规模的“药物-突变基因-疾病”知识推断,为药物重定位提供科学依据,并构建“药物重定位”知识发现平台,提供知识服务。

Our Data and Guideline

AGAC语料库及其设计思路

自2017年开始,面向突变功能变化设计语料库并进行标注。语料库2.0版本发布于2019年7月。

AGAC语料库是课题组开发的语料库

设计思路

相关参考文献:

◆  Yuxing Wang, Xinzhi Yao, Kaiyin Zhou, Xuan Qin, Jin-Dong Kim, Kevin Bretonnel Cohen, Jingbo Xia*. Guideline Design of an Active Gene Annotation Corpus for the Purpose of Drug Repurposing. 2018 11th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI 2018), pp:1-5, Oct, 2018, Beijing.

Our Data and its Application

AGAC语料库及其在药物推荐上的应用

利用神经网络挖掘目标疾病的全PubMed文本,挖掘基于突变功能变换语义,为寻找有效靶标药物提供思路。

AGAC在药物推荐上的应用

构建神经网络挖掘语义关系
文本挖掘思路
注释语义的文本挖掘 和 生物组学知识结合 寻找有效药物

相关参考文献:

◆  Yuxing Wang, Kaiyin Zhou, Jin-Dong Kim, Kevin Cohen, Mina Gachloo, Yuxin Ren, Shanghui Nie, Xuan Qin, Panzhong Lu, Jingbo Xia*. An Active Gene Annotation Corpus and Its Application on Anti-epilepsy Drug Discovery. BIBM 2019: International Conference on Bioinformatics & Biomedicine, San Diego, U.S, Nov, 2019.

Our Data and Shared Task

AGAC语料库及其公开任务

语料库发布在2019年底举行的BioNLP Open Shared Task 2019上作为评测任务之一,有多家公司和院校参与评测。

AGAC是BioNLP公开评测任务的一部分

AGAC Track评测 ——2019年BioNLP公开共享任务之一
2019BioNLP公开评测任务

相关参考文献:

◆  Yuxing Wang, Kaiyin Zhou, Mina Gachloo, Jingbo Xia*. An Overview of the Active Gene Annotation Corpus and the BioNLP OST 2019 AGAC Track Tasks. BioNLP Open Shared Task 2019, workshop in EMNLP-IJCNLP 2019, Hong Kong.

◆  Mina Gachloo, Yuxing Wang, Jingbo Xia*. A Review of Drug Knowledge Discovery by Using BioNLP and Tensor or Matrix Decomposition. Genomics and Informatics, 2019, 17(2): e18.

%d bloggers like this: