? 离散化:同直方图法 ? 比较赋值
? 选择一个似然率最大的子区间?k作为基准,设其相对似然率为Rk,然后给出其
他各区间?i相对于?k的似然率Ri,则?(?i)=Ri/ΣRi ? 由决策者给出每两个子区间似然率的比例关系:rij= ?(?i)/ ?(?j),然后计算出每个状态?i的似然率?(?i)。
? 变换拟合:同直方图法
? 思考:(1)如果决策者判断没有误差,即rij*rji=1, rij*rjk=rik,如何求?(?i)?(2)
如果决策者判断有误差,则又如何求?(?i)?
主观概率—先验分布估计:打赌法
? 打赌法(离散型)
? 设打赌者(A)的个人财产为W。设事件E发生时A获得收入为p,(p< 0 主观概率—先验分布估计:直方图法 ? 直方图法(适合于自然状态?在实轴某个区间连续取值) ? 区间离散化:把? 的取值范围划分为若干子区间?1…?n ; ? 赋值:估计每个区间的似然率?(?i) ,据此作出直方图; ? 变换:将直方图拟合为概率分布函数F(x)=Σ?≤x ?(?) 。 主观概率—先验分布估计:分位点法 ? 区间对分法(分位点法)-连续型 ? 确定事件不可能发生的临界状态取值(如某地区人口出生率不可能低于 9‰ ,但也不可能超过18‰ ); ? 求中位数:当状态取值为此值时,大于或小于此值的状态出现的概率相等(如某地区人口出生率的中位数为12.5‰ ); ? 确定上下四分位点; ? 确定八分位点(一般仅取到八分位点)。 主观概率—先验分布估计:分布函数法 ? 与给定形式的分布函数相匹配(最常用也容易滥用)[Matlab工具箱: Statistics Toolbox / Probability Distributions] ? 均匀分布(连续型):如果随机变量落在某个区间(a, b)中任意等长度的子 区间内的可能性相等,则它服从均匀分布,均匀分布的概率密度函数为: [Matlab 函数:unifpdf(x,a,b),unifit(DATA)] 主观概率—先验分布估计:分布函数法 ? 二项分布:(离散型)每次随机试验中事件A出现的概率为p,n次独立试验 中事件A出现k次的概率服从二项分布:[Matlab函数:binopdf(k,n,p),binofit(k,n)] ? 泊松分布: (离散型)每次随机试验中事件A出现的概率为p,n次(n→∞, 但n*p= ? 为常数)独立试验中事件A出现k次的概率服从泊松分布:[Matlab函数:poisspdf(k, ?), poissfit(DATA)] 主观概率—先验分布估计:分布函数法 ? 正态分布(高斯分布): (连续型)若连续型随机变量?的概率密度函数为: 则称随机变量? 服从参数为? 、?2 的正态分布[Matlab函数:normpdf(x,?,?), normfit(DATA)] 。 ? 参见相关统计学书籍,看看还有哪些分布函数可供选择使用? 随机决策理论与方法 1、主观概率 2、效用函数 3、决策准则 4、贝叶斯决策分析 效用函数—问题的引入 ? 复习 ? 信息集:为减少行动集、自然状态集、后果集的不确定性开展调查研究所 获得的信息。 ? 自然状态集:事物所有可能的自然状态Θ={?1,…, ?n} ? 行动集:决策主体可能采用的所有行动集合A={a1, …,am} ? 后果集:决策问题各种可能的后果集合C={cij=c(ai,?j)},cij表示决策人采取行动ai时出现自然状态?j时的后果。 ? 主观概率是用来量化自然状态的随机性,那么我们如何度量一个 后果 的价值呢?面临两个难题: ? 后果价值的量化存在困难( 如降价促销对品牌的伤害) ; ? 即使能够量化标度,但相同标度值的价值因人而异。 效用函数—问题的引入 效用函数—效用的定义 ? 效用就是偏好的量化值。决策的目标就是使期望效用极大化。 ? 基本概念及符号 ? 严格序>:a>b表示a优于b。满足传递性和非对称性。 ? 无差异~:a~b表示a与b无差异。满足自反性、对称性和传递性。 ? 弱序≥:a≥b表示a不劣于b。满足自反性、传递性和反对称性。 ? 展望(prospect)(事态体):各种后果(r种)及后果出现的概率的组合,记为: Pj= 效用函数—效用的定义 ? 复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行 动aj的概率为qj。则决策的展望就是一种复合展望,记为P= ? 效用的定义 ? 若展望空间上的实值函数u对于展望空间的任意两个展望P1、P2,有P1≥P2 iff u(P1)≥u(P2),则称u为效用函数。 效用函数—效用的定义 ? 效用存在性公理(理性行为公理) ? 连通性:任意两个展望的优劣都是可比的 ? 传递性:展望的优劣满足传递性 ? 复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣 关系 ? 展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。 ? 理性行为公理认为合乎理性的决策人在进行价值判断时一定能满 足这些公理。(实际决策中是否存在某种悖论呢?) 效用函数—效用的定义 ? Allais悖论 效用函数—效用的定义 ? 思考:效用函数一定是连续的吗?是否存在某种临界点使得效用函 数是一种分段函数,而在分段函数内满足效用存在公理? ? 效用的公理化定义:在上述公理系统中,若展望空间上存在实值函 数u,有: ? 对展望空间中的任意展望P1、P2,P1>P2 iff u(P1)>u(P2) ? u(?P1+(1-?)P2)= ?u(P1)+(1-?)u(P2) (复合展望的效用等于展望效用的复 合) 1 ? 对满足上述条件的u1, u2, 必有u1(Pi)=bu2(Pi)+c, 其中b, c∈R,b>0。(任意两个决策人的效用是线性相关的) 效用函数—基数性和序数性 ? 前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次 序,还能够反映决策者的偏好强度。 ? 但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度 就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介绍。 ? Hicks对效用函数的基数性和序数性的比喻:如果知道两个人的身 高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。 效用函数—效用函数值的估计 ? 概率当量法(Von Neumann, Morgenstern,N-M法):设决策系统的自然 状态集Θ={?1,…, ?n}、行动集A={a1, …,am}、后果集C={cij=c(ai,?j)},最优后果为c*=max {cij},最劣后果为c0=min {cij}。则对于任意后果cij的效用值u(cij),可按以下步骤获得: ? 设u(c*)=1, u(c)=0; 0 ? 建立简单展望 ,p可调 ? 反复向决策人提问,改变可调概率p,使得当p=pij时得到如下的无差异关系: 0 cij~ ? 测得后果cij的效用值为: u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij 效用函数—效用函数值的估计 ? 确定当量法(修正N-M法): ? 设u(c*)=1, u(c )=0; 0 ? 建立简单展望 ,p为0-1间的给定值,如p=0.5 0 ? 反复向决策人提问,改变cij得到如下的无差异关系:cij~ ? 测得后果cij的效用值为: u(cij)=p*u(c*)+(1-p)*u(c0)=pij ? 增益当量法:已知u(cij)和u(c 0 0 ),确定u(c*)的方法 0 ? 损失当量法:已知u(cij)和u(c*),确定u(c)的方法 效用函数—效用函数的构造(离散型) ? 看球的效用函数构造(不考虑经济成本) ? 构建问题的决策树,根据一般偏好,四种后果的优劣是C2>C3>C4>C1; ? 令u(C1)=0, u(C2)=1; ? 询问1:“下雨看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如: 0.3,则u(C3)=0.7) ? 询问2:“天晴看电视转播”的后果与“现场看球”时有多大的概率下雨被淋相当?(例如: 0.6,则u(C4)=0.4) ? 一致性检验:用C3,C4加上C1(或C2)进行校验,直至一致性得到满足。 效用函数—效用函数的构造(连续型) ? 若后果是连续型,则可通过分析u(c)的若干特征值,求出特征点的 效用后再连成光滑曲线。 ? 例:试作出每天投入学习的时间t对应的效用曲线。 ? 分析特征点:u(t=0)=0; u(t>TM)=0(TM=?) ;状态导入期(0 ~t0 ),效 用增加较慢;状态稳定期(t0 ~t1) ,效用与投入学习的时间基本成比例关系;效率下降,效用增加期(t1~tm) ,效用是投入学习的时间的单调增函数,但增长率小于状态稳定期且随着时间的增加越来越小,最终达到零(t=tm) ,此时效用达到最大;当投入的学习时间大于tm 时,将会得不偿失,学习效率急剧降低,效用减少。 效用函数—效用函数的构造(连续型) 百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库决策理论与方法(6)在线全文阅读。
相关推荐: