前言
图1. 常见医药数据库的种类
国内医药数据库的发展现状
随着国家对医药政策的深入改革,大健康事业也提上了议程,各类医药平台及数据库也在蓬勃发展当中。逢迎大数据时代,目前数据库软件领域的国际软件巨头如Oracle、IBM、Microsoft、HP、SAP、Amazon和TeraData等占据着市场的绝大多数份额,国内阿里巴巴、华为、东软等企业也在医疗数据领域有所发展,大数据与医药领域的结合,更多的是运用信息技术的手段实现智慧医疗,包括人工智能在医药文本理解、医疗影像识别的应用等。但我们还不能忽略对传统及当前医药数据的整合,只有不断优化基础数据,完善各类基础数据库建设,我们的现代医药数据库发展才能稳步向前。以下分别从政府主导的医药数据库、企业主导的免费医药数据库、企业主导的商业医药数据库三个方面进行阐述。
政府主导的医药数据库:
1) 国家食品药品监督管理局CFDA
作为政府机构,其官网发布的信息是权威来源,涉及药品、食品、医疗器械、化妆品等信息,对以上信息均提供公众查询或企业查询,同时,也提供食品药品器械的标准查询官网。最常用的功能就是去该网查询某一药品/器械/保健品/企业/批准证号等是否存在或匹配。但跟美国FDA或欧盟EMA或日本PDMA相比较,我国CFDA可供查询的信息相对简单(如缺乏药物的适应症信息)、专业程度也有待提高(如缺乏检索说明及注意事项);另外,CFDA网站服务器不稳定,打不开查询界面的情况时有发生;最后吐槽一点,反馈问题时,连个联系邮箱都没有,有些问题还只有用图文的方式表达才能准确的反馈,CFDA网站的进步不能忽视公众的力量!
2) 国家食品药品监督管理总局药品审评中心CDE
该网主要是查询审评信息,如受理号、注册类型、企业名称、审评序列和审评结论等。其实这类信息主要使用第三方网站查询(本文下面有阐述),CDE网站数据貌似是满足基本的查询即可。目前CDE网站上有“数据查询”和“信息公开”两个查询板块,数据查询板块给人实际的感觉是友情链接,还需领导重视重视。信息公开板块则比较实用,但与日本PDMA尽可能公开各家企业申报材料的透明做法相比,CDE还有待改革。我们医药研发者只可参考部分上市药物的审评综述报告来获取某药的详细信息。另外,药品/器械/保健品/化妆品的注册进度查询也可进入国家食品药品监督管理总局行政事项受理服务查询。
3) 药物临床试验登记与信息公示平台
药物上市必须经过严格的临床试验来证明其有效性和安全性,所以临床试验数据显得尤为重要。目前该平台只含基本的招募信息,暂不含结果信息,希望决策者能向美国clinicaltrials学习,敦促第三方上传临床试验的结果供公众查询参考。而且国内此类数据库平台起步较晚,经查询,只从2013年开始收录信息,有待完善,另外。高级查询的字段也有待丰富(如增加试验阶段和日期等)。
4) 中国药品电子监管平台(停止更新)
虽然药品电子监管码已成过去,但还得提一提,因为我们现在验证药物的真伪时,显然少了一种便捷的途径。当前CFDA不再强制药品电子监管系统,取而代之的药品追溯体系还未成型。建立完备的药品追溯体系需要专业化的监管团队、可靠的数据设备、严格的法律和制度。在这方面,美国的“一物一码”制度(National Drug Code),或者欧盟的“安全档案”,都为我国尽快完善药品追溯体系提供了借鉴。
图2. 中国药品电子监管网首页截图
5) 其他信息
医药领域涉及面广,其他政府部门的数据信息包括中国药典、中国医疗器械信息网、卫计委数据查询等,在此就不逐一列举。政府主导的医药数据库都是相对较成熟的信息,供公众或企业查询,医药研发或者医药数据整理目前还主要是企业主导。对于政府层面来说,公众对其政策新闻的关注是一种被动接受形式,但公众使用政府部门的数据库,是一种双方互动,对其体验性也有好评、中评、差评之分,虽然政府部门可通过招标或者委托第三方等形式来建立网站数据库,但若能提供反馈渠道、提升服务器稳定、及时更新、增多查询字段等措施定会好评如潮。
企业主导的免费医药数据库:
相信各位读者都会通过谷歌/百度/必应/雅虎等搜索引擎来检索网络上免费的医药数据信息,当搜索引擎不能解决问题或者搜索引擎检索质量不理想的时候,建议使用相对专业的医药数据库,首选当然是免费且质量有保障的医药数据库。
药品信息查询:
查询药物信息时,权威的信息基本来自药品说明书,目前说明书检索有很多医药数据库提供免费应用,甚至包括医药电商也可查询相关药品的说明书(图片版)。丁香园用药助手较好地整理了该类信息并且能实现多字段的关键字检索。其实药品说明书的信息非常丰富,各药物、适应症、不良反应等均存在着某种关联,更深入的说明书数据库建设有待开发。对于药品信息,如医保用药目录、基本药物目录、药品中标等信息,除了政府官网和免费网站途径,此文下面所述的商业医药数据库目前对此类药品基本信息均是免费提供查询的。如果是进口药物信息,除了国内的信息来源,可通过国外官方(FDA/EMA/PDMA等)及医药信息查询网站(如drugs 、medlineplus、emedicine、mayoclinic等)获取更完善的信息。
疾病信息查询:
某种疾病(包含病因、诊断、治疗、预防等)权威的信息还是来自权威机构发布或出版的疾病指南或专家共识,这方面的主要来源是文献数据库。另外,丁香园网站也提供“指南共识”查询,谷歌/百度/必应/雅虎检索治疗指南也可以获取相应信息,但前提是需辨别检索结果的来源。其次,有许多医生在丁香医生、微医、好大夫在线等平台注册,许多疾病领域的专家团队发布了该疾病领域的科普文章,平台提供了检索功能,所以也可以找到某疾病的最新权威信息。以上免费途径都是简单去检索疾病信息,并不具备优秀数据库所具有的重要特征:完整的层级索引和定期的权威更新。当然,要处理成千上万的疾病信息和定期更新(因为对疾病的理解、诊断和治疗等都会随着研究的深入而会有更新),需要众多人力物力(包括对各医院/医生资源数据库的整合),而且需要一定的商业模式才可长久运营。笔者想表达的是,我们不希望有太多的疾病百科似的网站,因为关于生命健康,我们希望有少数权威且全面的医药数据库网站。建好了全面的疾病数据库,做到实时更新,定会利国利民!国外疾病数据库的建设如WHO、Merck Manuals、webmd、medlineplus、emedicine、mayoclinic、integrity (商业)等主流网站均有相应的信息,尤其是在肿瘤领域,NCI网站提供的信息权威且及时更新。所以,国内综合疾病(网站)数据库的建设和完善还有很长的一段路要走。
医药研发查询:
药物研发数据库主要面向专业的医药工作者,一般会利用文献数据库(收费,但个人都会找免费途径),如中国知网、维普网、万方数据等查询医药领域的文献(当然,质量较高的文献还是建议查询Webof science/Pubmed等国外数据库)。另外专利文献也是企业关注的重点,国内主要有国知局、大为INNOJOY、Soopat、佰腾专利、润桐专利、智慧牙(商业)等专利数据库(但还是需要用国外专利库,如欧专局、USPTO、WIPO等权威网站)。
其它免费医药数据库包括药渡数据(含各制药企业研发和结构化学信息)、药物在线(含国内外权威机构药物信息)、药智数据(含CDE注册申报信息,部分功能免费)等。实际上,药物研发数据库也比较多,药渡导航、药研网数据库导航整理了医药相关数据库信息。但如果涉及化学或生物信息学,国内的数据库难以满足科研的需求,虽然上海有机所化学专业数据库提供了化学、药物、结构、活性、毒性等信息查询,但对企业而言,这类免费查询途径只是一种参考。目前免费化学/生物信息主要是来自国外的数据库,如PubChem、ChEMBL、ChemSpider、GenBank、UniProt、PDB等免费资源。
企业主导的商业医药数据库:
使用商业医药数据库比较频繁的当属于医药研发人员或医药投资及证券从业者,主要是立项调研、市场调查、竞争对手、专利情报、临床试验等信息查询。国内目前缺乏能提供化学/生物/市场专业信息的商业数据库,国外此类商业医药数据库主要是Clarivate Analytics产品(原Thomson Reuters)、IMS(现与Quintiles合并)、SciFinder、STN、Datamonitor、GlobalData、evaluateGroup、GBI Research、Reaxys等。数据库的选择需根据自己的信息需求来选取,但若需要跟踪国内的药物研发,最好也关注下国内相应的数据库产品。目前国内有7家企业有自己的数据库产品上市,企业大本营主要位于北上广杭渝,如下表所示(企业排名不分先后)。商业医药数据库主要侧重于药物注册申报信息(来源于CDE/CFDA,对数据二次处理的深度不足)、等级医院或药店的销售信息(有待建立疾病市场统计分析的模型)、医药项目的综合分析(缺乏SWOT分析)等。各数据库阐述如下:
丁香园Insight是近年发展成熟的一个商业数据库,紧跟中国医药研发政策,目前包含一致性评价、申报进度、药品、制药企业、上市产品、全球专利、招投标等数据库板块。
药智数据可查询的信息比较丰富,包含药品研发、生产检验、合理用药、市场信息、中药材、医疗器械、食品、化妆品等,而且不断上新各类新的数据库模块。药智数据有些板块提供部分免费查询的功能,这也是数据库发展的一大战略,互联网时代,医药数据库的发展壮大也需要走流量,使更多的人接触或受益。
医药地理为中国医药工业信息中心旗下全媒体平台,目前有3大类数据库,PDB药物综合数据库收录的数据为国内20多个重点城市医院用药市场销售信息,CPM中国新药研发监测数据库主要是药物注册申报的信息,RAS医院处方分析系统主要是将医生处方(患者用药)的情况进行统计来分析当前情况及未来趋势。
米内数据库由国家食品药品监督管理总局南方医药经济研究所下属企业广州标点医药信息股份有限公司负责管理,目前建有60余个医药信息数据库,除了基本的工具型数据库,还有细分程度较高的医药市场数据库,官网还定期发布各类疾病/药物市场报告。
CHIS中国健康产业智能情报系统涵盖基础数据库、注册申报、临床试验、市场信息等,为国内药企和风投机构提供相关服务。
医药魔方是最近发展起来的医药数据库,目前主要是查询国内药物信息及注册申报信息,其他数据库还在开发中,希望能给医药界带来好的产品。
咸达数据主要提供药物注册情报和市场信息,从这一块看,以上众多数据库均有此功能,可谓竞争激烈,除了比拼价格优势,数据库的信息“智能/人工整合”能力也有待提升。
结语
在互联网时代,数据就是价值,此话放在医药领域更加合适。医药领域信息广阔,从临床前到批准上市,从药品到医疗器械,从患者到医生等等,相关的医药数据库可多达成百上千个(此文不能逐个列举)。对于医药研者究来说,优秀的商业医药数据库可使其工作效率大大提升,也在一定程度上避免资源的浪费。对于普通大众来说,优秀的免费医药数据库可提升其医药素养,为自己和家人的健康多一份关心。值得一提的是传统的文本数据和非结构化数据与机器学习的搭配,将使现代医药数据库大有作为。提升优秀医药数据库的建设,除了信息技术的支持,医药领域完整的层级索引、定期的权威更新和完善的反馈机制也是成功的主要因素。免费难以为继,政府主导或者商业化方可长久运营。国内专业且高质量的医药数据库的发展任重道远,认清实际,借鉴国外同行经验,结合国内特点,脚踏实地完善我们的医药数据信息,为中国的大健康事业贡献一点力量。