艾滋病疗法的评价及疗效的预测
【摘要】本问题要求我们利用艾滋病服药治疗期间测试所得的数据预测继续治疗的效果并评价各种疗法的优劣。对三个问题我们都运用回归分析方法和方差分析方法来建立统计模型。
就问题一,首先对所有数据进行处理,建立了一元多项式回归模型,将多项式回归模型转化为多元线性回归模型运用Matlab软件求解,通过最小二乘法参数估计和统计检验,得到关于与测试时刻的比较准确的函数关系及其回归曲线,由此预测出药物治疗的效果,最终得出在药物治疗的第25.0000周停止用药最为合适的结论。然后提出分类的思想,即按不同病人在服药前期的CD4浓度大小不同将数据分成三组,对每组数据同样按前面的思路建立回归模型并求解,确定最佳治疗终止时间依次为第25.1295周,第24.0000周,第25.0000周。分类前后的预测结果大致相符。
问题二在增多了病人年龄因素的基础上对四种疗法的优劣进行了评价。首先,对每组治疗方案建立4种多元回归子模型进行定性分析,利用Matlab统计工具箱来处理,拟合出交互式图形,并分析剩余标准差s,筛选出每组治疗方案最佳模型。然后分析CD4浓度曲线,对4种疗法的优劣进行了排序,选择疗法四为最终方案,它的最佳终止服药时间为第17.8854周。然后用方差分析进行定量评价。定性和定量评价的结果相符。
问题三在问题二基础上增加了对治疗费用的考虑,建立多元回归模型,同样利用Matlab统计工具箱来处理。然后提出“疗效性价比”这一概念并建立模型,以单位费用的治疗的效果来评价4种治疗效果,在交互式图形中分别取治疗费用为0和200美元的两个时刻作为观测点,分析4种疗法的疗效性价比,最后得到第1,2,3,4种疗法依次较优,即疗法四为最优方案,在预测继续治疗的效果不佳的情况下,确定最佳终止时间为第17.8854周,终止治疗时共花费453.2464美元。
关键词:回归分析 治疗效果预测 方差分析 疗效性价比
1
一、问题的重述
艾滋病是当前人类社会最严重的瘟疫之一,是由艾滋病病毒(英文简称HIV)引起的,这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。
艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。现在得到了美国艾滋病医疗试验机构ACTG公布的同时服用3种药物疗法和另外一组4种疗法的相关数据。
要求: 1)、预测继续治疗的效果,或者确定最佳治疗终止时间。 2)、评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
3)、如果病人需要考虑4种疗法的费用,找出对2)中的评价和预测(或者提前终止)有什么改变。
二、模型的假设
1、附件1、2数据所反映的规律基本符合AIDS病人药物治疗过程的病况规律,即能客观的反映现实情况。
2、在测试和预测期间AIDS病人不会死亡。 3、病人在服药测试初始CD4浓度相等。 4、问题三第一种疗法中第奇数个月(如第1个月)服用400mg didanosine (0.85美元/天),第偶数个月(如第2个月)服用600mg zidovudine(1.60美元/天)。 5、问题三治疗费用只由治疗药品费用组成。 6、每月按30天计算。
三、符号说明
符号 c h 表示意义 病人的CD4浓度(0.2个/ml) 病人的HIV浓度(单位不详) 第i类病人的CD4浓度(0.2个/ml),i?1,2,3 第i类病人的HIV浓度(单位不详),i?1,2,3 测试CD4和HIV浓度的时刻(单位:周) 问题二、三中第j种疗法的时刻(单位:周),j?1,2,3,4 对数处理后第j种疗法病人体内CD4浓度,j?1,2,3,4 ci hi d dj yj 2
符号 表示意义 第j种疗法的AIDS病人年龄,j?1,2,3,4 第j种疗法的拟合曲线的斜率的绝对值,j?1,2,3,4 第j种疗法的费用(单位:美元),j?1,2,3,4 停止治疗时为奇数月份时总的治疗费用 停止治疗时为偶数月份总的治疗费用 采用第j种疗法时费用增量,j?1,2,3,4 费用增量为?fj时CD4的浓度增量j?1,2,3,4 疗效性价比,j?1,2,3,4 aj kj fj s1 s2 ?fj ?yj pj
四、问题的分析、模型的建立及求解
4.1
问题一的分析及模型建立:
4.1.1 问题一的提出和数据分析
已知:同时服用3种药物(zidovudine,lamivudine,indinavir)的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。
要求:预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。
分析:题目的附件1给出的CD4和HIV浓度是300多名病人每隔几周测试的,每个病人测试3到6次不等,加起来共有1665组数据。根据题目要求,我们应当寻找出药物治疗过程中CD4和HIV浓度随治疗时间变化而变化的规律图线,以此来判断和预测。
首先,以测试时刻(周)为横轴,分别以CD4、HIV的浓度为纵轴,作出浓度关于时刻的散点图进行观测,由于数据点太多,测试时刻相对较集中且每个病人测试次数只有几次,从散点图上不容易看出它们之间的规律。于是,再用回归分析法拟合出浓度和时刻的关系曲线并做统计检验。仔细观察分析数据我们发现,不同的病人在初始时刻CD4浓度(或HIV浓度)有所不同,即每个病人的病程是不一样的,于是我们提出按服药前(第0周或者第1周)CD4浓度的不同将病人分为三类,如表1所示:
3
表1 以CD4浓度为标准分类 第pi类病人 CD4浓度(0.2个/ml) p1 0-75 p2 75-150 p3 >150 然后对每一类数据各自分析讨论,同样用回归分析法拟合出浓度和时刻的关系曲线并做统计检验。以上两种方法同时用来解决问题一(即预测继续治疗的效果,确定最佳治疗终止时间),再比较两种方法的优劣。
4.1.2 模型的建立及求解
(一)模型一:分类前的回归模型
首先,记病人的CD4浓度(0.2个/ml)为c,HIV浓度(单位不详)为h(为了便于在同一个图像上作出CD4和HIV浓度与时刻的回归曲线,在数据时
d为测试CD4和HIV浓度的时刻均将HIV浓度数据扩大了50倍),(单位:周),
由附件1初步分析,随着服药时间的增加,CD4浓度先是增加,但是随着时间增加过多后c反而减少,而HIV浓度h先是减少然后又增加,所以不应拟合线性函数,可能是二次函数比较合适。
建立如下CD4浓度的回归模型:
c??0??1d??2d2?? (Ⅰ)
h??0??1d??2d2?? (Ⅱ)
其中?0~?2为回归系数, ?是相互独立的、期望为0、方差为?2、正态分布的随机变量,即??N(0,?2),?称(随机)误差。
1) 利用最小二乘法进行参数估计,确定系数?0~?2,得到预测方程; 2) 给定显著水平?=0.05,对回归系数进行相关系数检验及F检验,确定回归
分析的效果,直到回归分析的效果好。
用Matlab软件命令regress求解,将回归系数的估计值如表2所示,并代入(Ⅰ)、(Ⅱ)式得到CD4浓度c和HIV浓度h的预测方程为
c?97.7277?6.6004d?0.1114d2 (Ⅲ)
h?439.7715?16.2617d?0.3289d2 (Ⅳ)
4
表2 模型一CD4和HIV浓度的计算结果 回归系数 回归系数估计值 CD4浓度 97.7277 6.6004 -0.1114 HIV浓度 439.7715 -16.2617 0.3289 回归系数置信区间 CD4浓度 [89.3095 106.1458] [5.2526 7.9481] [-0.1452 -0.0776] CD4浓度 [429.4523 450.0907] [-17.9164 -14.6071] [0.2874 0.3705] ?0 ?1 ?2 CD4浓度 HIV浓度 R2=0. 1113 F=98.1 p=0 s2=9990.4 R2=0.2401 F=247.3568 p=0 s2=1.5001×104 HIV and CD47006005004003002001000-100-10
由预测方程(Ⅲ)(Ⅳ)及图1上的回归曲线可以看出c是开口向下的抛物线而h是开口向上的抛物线,这符合AIDS患者用药后体内CD4浓度和HIV浓度随时间变化的规律。
回归系数?0~?2的置信区间比较短,而且都没有包含零点,表明回归模型有效。
HIV*50 or CD4? HIV? CD4010203040date(week)50607080图1 HIV浓度×50和CD4浓度的回归曲线
回归模型的统计检验 检验水平为?=0.05 1) 相关系数检验法:相关系数R是反映随机变量X与Y呈线性程度的
一个度量指标,其取值范围R?1,当R接近于1时,变量X与Y呈密切线性相关,当R接近于0时,变量X与Y非线性相关。本模型CD4浓度和HIV浓度的计算结果中R2分别为0.1113和0.2401,都明显偏小,可见HIV和CD4浓度与检测时刻呈非线性相关,与我
们的模型假设是相符的。
5
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库数学建模_B题 艾滋病疗法的评价及疗效的预测(答案)在线全文阅读。
相关推荐: