课题组测试发布“AD-LitPathoNet/老年痴呆病病理网络”数据库

AD-LitPathoNet是“阿兹海默症-富文本证据病理网络”(Pathology Network with Rich Literature Evidence)的简称。AD-LitPathoNet提供便捷可交互的基因和表型搜索服务,从而提供关联推荐、互作富集,以及文本证据的可视化呈现。AD-LitPathoNet提供的启发性的文献证据自动化搜索服务无商业用途,旨在为AD-机理探索的科学研究提供服务。 数据访问网址:http://lit-evi.hzau.edu.cn/AD-LitPathoNet  指南视频: Part 1. 《数据服务总体框架》2分29秒 访问指南: Part 2. 《网页服务介绍,以基因搜索为例》2分57秒 访问指南: Part 3. 《知识发现算法,以表型搜索为例》3分24秒 数据内涵:数据包含阿兹海默(Alzheimer’s Disease, AD)相关PubMed摘要和PMC全文文献。针对以上文献数据,课题组利用所开发的语料库及自然语言处理工具获取了海量的基因、突变,表型实体及其关联性描述,从而搭建了AD-LitPathoNet文献证据网络并提供数据服务。 数据规模:AD-LitPathoNet 包含与AD病理机制知识表示相关的 PubMED摘要篇数:110,664 PMC全文篇数: 49,269 条目(句子)数量:864,855 携带突变描述的基因数量: 6,831 标准HPO条目数量: 1,678 标准HPO条目数量: 4,355 标准MeSH条目数量: 2,975 1. AD-LitPathoNet 的病理机制知识表示范式 AD-LitPathoNet 以丰富的基因-表型关联文本证据为基础,搭建可追溯的病理机制表示范式(Traceable pathology mechanism representation)。其中使用到的分子标记物主要为基因及突变,表型描述的术语采用Gene Ontology (GO), Human Phenotype Ontology (HPO)及Medical Subject Headings (MeSH)三个标准本体。 首先,AD-LitPathoNet 从文本中捕获突变、基因(或蛋白)实体以及 “occurred_in” 关系;同时,挖掘基因突变引发的下游生物过程(GO)、表型(HPO)和症状(MeSH),并识别基因和表型关联的“caused”关系。由此,“可追溯的病理机制表示范式”对上游基因、突变和下游表型数据间的机理描述给出了明确的定义。 可追溯性病理机制包含两个内涵:ContinueContinue reading “课题组测试发布“AD-LitPathoNet/老年痴呆病病理网络”数据库”

CFP— 27th International Conference on Knowledge Based andIntelligent information and Engineering Systems (KES2023)

Session IS35: Curative Power of Medical Data (Session IS35)  | 6th- 8th September 2023 | Athens, GreeceKES2023 Invited Sessions (kesinternational.org) Dear Colleague, You are invited to submit a paper (via the PROSE portal available on theconference website) for IS35: Curative Power of Medical Data at KES2023on topics lying within the scope of the conference. AllContinueContinue reading “CFP— 27th International Conference on Knowledge Based andIntelligent information and Engineering Systems (KES2023)”

《评测纵览:面向“基因-疾病”的关联语义挖掘任务》Published

欧阳思卓主持的CHIP2022评测任务-面向“基因-疾病”的关联语义挖掘任务-发表在《医学信息学杂志》。 论文引用方式: 欧阳思卓,姚昕智,王宇星,彭钱钱,贺芷涵,夏静波*. 评测纵览:面向“基因-疾病”的关联语义挖掘任务 [J].医学信息学杂志,2022,43(12):6-9.

《CIViCmine癌症标志物文本证据自动化挖掘》——GenMed2019论文评述

《CIViCmine》论文评述 文章:《Text-mining clinically relevant cancer biomarkers for curation into the CIViC database》https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6891984/  作者:Jake Lever, Martin R. Jones, Arpad M. Danos, Kilannin Krysiak, Melika Bonakdar, Jasleen K. Grewal, Luka Culibrk, Obi L. Griffith, Malachi Griffith, and Steven J. M. Jones 引用方式:Lever J, Jones MR, Danos AM, Krysiak K, Bonakdar M, Grewal JK, Culibrk L, Griffith OL, Griffith M, Jones SJM. Text-mining clinically relevant cancer biomarkers for curation into theContinueContinue reading “《CIViCmine癌症标志物文本证据自动化挖掘》——GenMed2019论文评述”

“登山志高远,冰上可飞仙。讨论能醉氧,行走方寸间。”

——愿来年,方寸间仍有万水千山。 前几日腾讯组会,尚在总结《噢,这不平凡的十二月》;不觉眨眼间2022年一霎那间就过去了。 新年的新愿景,历历在目; 青龙山的苍翠,尚在心中。 “登山志高远,冰上可飞仙。讨论能醉氧,行走方寸间。” 愿来年,方寸间仍有万水千山。

欧阳思卓将主持GDAS Track, CHIP2022评测(“面向“基因-疾病”的关联语义挖掘任务”)报告

基于AGAC语料库的丰富标注数据、针对基因-疾病的关联语义挖掘,围绕NLP算法在生物医药领域的应用,我们于今年暑期组织了GDAS Track,CHIP评测一:“GDAS Track/面向“基因-疾病”的关联语义挖掘任务”。 代表课题组,思卓师姐将于本周日下午参加第八届中国健康信息处理大会的评测论坛,并主持评测一。 本周日(11月27日),成绩最优的前三强队伍被邀请参加评测论坛。演讲题目为: 3:30-4:00 pm评测一:面向“基因-疾病”的关联语义挖掘任务3:30-3:40 pm《基因和疾病的关联机理挖掘:语义网络中的隐式关系推理方法》讲者: 姜逸文队伍:WinHealth-卫宁健康科技股份有限公司3:40-3:50 pm《基于数据增强的小样本疾病基因信息抽取研究》讲者: 苏鑫队伍:Forward-北京交通大学3:30-3:40 pm《面向小样本的医疗领域命名实体识别方法》讲者:任翔渝队伍:深藏blue队-北京理工大学 评测时间:3:30-4:00 pm. 大会直播入口:https://www.withzz.com/live/895402883 GDAS Track, CHIP 2022 评测任务网址: http://lit-evi.hzau.edu.cn/AGAC-CHIP2022/