研究设计和统计分析计划


顺序或自适应设计的临床试验

与标准的研究设计相比,顺序/自适应设计方案为研究者提供灵活的、低成本高收益效益的解决方案。它允许用户进行中期数据分析,从数据中提取证据并观察不断变化的学习环境,做出主动地自适应决策,比如,无效或缺乏足够疗效证据,试验可能提前终止。人们可以根据两组反应率调节参与者随机分到治疗组比安慰剂组的比例。我公司有专业的团队和完善的软件开展临床I-III期试验的贝叶斯自适应设计。

分子水平上高通量技术的临床前研究

我们熟练掌握最流行的PCR、基因芯片和新一代测序(NGS)技术,在新药研究中发现或鉴定生物标志物。我们熟悉全基因组关联研究(GWAS)、表观遗传学研究(如DNA甲基化)和微阵列基因表达研究。


统计建摸、数据分析和知识发现


具有复杂结构的 Bayessian 分层模型(BHMS)

在实践中,我们经常会遇到由于嵌套或多层数据结构而导致非独立分布的数据。例如,虽然在独立的个体之间进行重复测量,但受试者中是高度相关的。医院内部病人之间是独立的,但同一个医院内的病人相互关联。通过应用贝叶斯分层模型(BHMS)、广义线性混合模型(GLMM)等模型,我们可应用随机效应或协方差矩阵来建模解决关联的数据或异构分布的数据。

具有缺失值数据的插值分析

对于不完整的纵向数据,Bayessoft开发了多重差补(multiple partial imputation ,MPI)方法及相应的软件包。应用MPI技术,在忽略/不可忽略机制的假设基础上,间歇性缺失和完全性剔除可以分别建模进行插值。对于其他的变量,如分类变量,连续性变量,或混合格式的变量,我们可以应用常规多重插补方法:首先一个数据集多次差补,然后用标准方法分析每一个完整数据集,最后结合估计值进行总体推断。

非参或半参数贝叶斯模型

在护理质量研究中,许多服务(例如, 在121医院进行冠状动脉旁路移植术)提供者之间进行比较的时候,我们需要采取分层线性/ Logistic回归模型调整病人的危险因素后,来估计医院的随机效应。在这个模型中,我们假设所有的121医院服务质量服从正态分布,但在现实中这样的假设可能是不对的。例如,有可能是几类医院,每类医院正态分布的均值和方差不同。要允许随机效应自由分布,我们可以采用多形式的非参数和半参数贝叶斯分层建模策略。在杨晓伟2013年发表的一篇文章中,通过模拟数据对这种方法和其他标准方法进行了评估。我们发现,传统的方法通常是有问题的,通常夸大效果,将表现正常的医院判定为统计意义的异常(更糟或更好)

综合性贝叶斯变量选择(IBVS)用于分子生物标志物的发现

高通量组学数据中,“大N,小P”理论阐明了著名的生物标志物的发现问题,其中( N表示样本的大小,P指的候选生物标志物的数量)。例如,在GWAS数据,通常P有上百万,而N仅1000左右。在基因表达数据集中,P > 20,000,但N < 100 。所以,发现生物标志物就像大海捞针。传统的P值基于单因素分析方法,如分别对每个基因或遗传变异进行独立样本t检验或卡方检验。该方法不仅存在多重比较的问题,而且还缺乏生物学解释的问题。为了解决这些问题, Bayessoft开发了综合性贝叶斯变量选择(IBVS)策略,借鉴了基因网络的分层模型,可用于同时识别单核苷酸多态性,基因和通路等。这一策略已经编程为R软件包,用于从GWAS ,基因表达和RNA序列数据中发现生物标志物发现。

通过文本挖掘和数据挖掘进行知识发现

数据挖掘是指从不同的角度分析数据,并总结出有用信息的过程。它并不局限于统计学习方法,也包括启发式分类和聚类方法。文本挖掘是用于搜索和处理在线文档和结构化数据以发现知识或融合知识源的一组算法。在Bayessoft,我们的团队成员尤其精通从生物信息学数据集(GWAS,微阵列,或RNA测序数据)或在线基因组学/遗传学数据库发现知识。


统计编程,计算和数据采集


编程服务范畴

Bayessoft 团队擅长使用流行的统计语言或包(例如,R/ Bioconductor,SAS,SPSS 和Stata)和先进的工具(如 MATLAB,C+ +,JAVA 和C程序)。

基于云计算的高性能计算解决方案

Bayessoft借助Windows Azure(微软的公共云计算平台)和AWS(亚马逊的公共云计算平台)平台进行编程。通过MCMC算法在AWS或Windows Azure平台,将作业分成若干小任务,并将其分配给不同的处理器,进行并行计算,实现高效率贝叶斯分析。在AWS和Windows Azure中,还可以存储大型数据集(如基因组测序数据),为数据存储提供了巨大的空间。

健康信息学

Bayessoft 咨询服务,还着眼于建立远程医疗,数据收集,或决策支持系统的基础设施。使用贝叶斯范式,我们可以帮助临床专业人士从当地的临床数据库和公开发表的文献中,过滤和融合全球知识,提供证据,以提高决策的质量。