多年来,各种 NLP 技术已应用于一系列文献挖掘任务,以证明该技术的准确性和多功能性。
以 PMS 为例,这是一个耗时且手动的智力审查过程,用于主动筛选生物医学数据库和文献以查找新的 ADE。研究人员能够根据历史筛选知识数据训练 ML 算法,以自动对相关文章进行智力审查。另一个使用三个 NLP 模块实现的深度学习管道不仅可以监控生物医学文献中的 ADR 信号,还可以在三个输出级别上过滤和排名出版物。
人们对基于 NLP 的管道的潜 伯利兹手机数据 力非常感兴趣,它可以自动从社交媒体和其他在线健康论坛中提取信息。
但这些数据源,特别是社交媒体网络,带来了一系列独特的挑战。例如,社交媒体上的ADR 提及通常包括冗长、多样且非正式的描述,与 PubMed 中的正式术语完全不同。解决这一挑战的一种方法是使用对抗性转移框架将辅助特征从 PubMed 转移到社交媒体数据集,以提高泛化能力、减轻噪音并提高 ADR 识别性能。
社交媒体数据的药物警戒主要侧重于使用带注释的数据集挖掘 ADE。要实现检测 ADE 信号和为公共政策提供信息这一更大的目标,需要开发端到端解决方案,以便对各种药物的社交媒体进行大规模分析。一个评估 Twitter 自动 AE 识别系统性能的项目警告称,公布的性能结果与基于独立数据的实际性能之间可能存在很大差异。该研究得出结论,AE 识别系统的可转移性将是其在药物警戒中更广泛使用的关键。
尽管如此,毫无疑问的是,互联网上用户生成的文本内容将对传统的药物警戒流程产生实质性影响。
综合药物警戒
药物警戒在数据收集和分析方面仍然是一个非常分散和不协调的过程。NLP 技术的价值在于它们能够从数据源中大规模地解锁实时现实世界的见解,从而能够更积极地预测和预防不良事件。但要做到这一点,重点必须放在开发基于结果的混合 NLP 模型上,这些模型可以统一临床试验、临床叙述、EHR、生物医学文献、用户生成内容等中的所有文本数据。同时,药物警戒中结构化数据的收集和分析方法也需要现代化,以提高效率、生产力和准确性。结合结构化和非结构化数据将开启数据驱动药物警戒的新时代。