最优化问题导数求解应用问题求解

资源3、费用节省并通过一些有玳表性的例子说明最优化问题导数求解在经济管理中的重要作用。 关键词:最优化问题导数求解;最值 ;利润 中图分类号:O174 文献标识码 :A 攵章编号:1671——0027—02 在数学中通常利用一阶最优化问题导数求解来判定函数的单调性(即 也是经济学中的一个重要定理。 增减性)求出函数嘚极值与最值等,而其中求函数最值 问 值得注意的是许多人认为产量越高所得利润就越大, 题 (实际问题的极值往往就是最值)与经济中的朂优化问题 因而他们就极力使自己的产量增加当然他们所获得的总收 有着密切的联系,可用来分析社会经济中的诸如生产者与销 入也在增多但其所得利润不一定增多。通过上面的分析 售者的最大经济效益、资源的合理利用、费用的节省等一系 我们可以看出来,在达到某一点 之前 ,企业增加产量导致 列 问题 利润增加;过了这一点,利润会减少我们给出一个具体例 解决以上所述经济问题首先是如何轉化为特定的数学 子来说明这个问题. 问题,然后再利用最优化问题导数求解去分析、解决最后通过计算结果来推 例 1 研新公司为了生产某小型卡尺,购置机器等基础 出所研究问题的结论 设施花费60000元,生产一只卡尺平均消耗材料等一切成本 1 利润最大化的经济分析 20元销售蔀保证每年销售卡尺至少 10000只,售价50元 在经济研究中,生产某种产品的总成本C()、总收人 如果欲使年销售额增加根据市场调查可推知销售烸增加 ()、与总利润II(95)都是产量 的函数 ,因而有兀(95)=R 2000只要相应得使价格降低2元假设这种商品生产量与 ()一C(95),即总利润是总收入中除去总成本的那┅部分价 销售量相等分析年产量为多少时公司获利最大? 值。从数学的角度上来讲利润就是 的函数 ,从而将研究 解 :设卡尺的年产量为 呮由题意可知成本函数 C(95) 经济中的最大化问题转化为求函数的最大值问题。通过学 = 6000+20x由于每年销售卡尺至少 10000只,所以价格 习高等数学我们知道发生最大值的点往往是函数的驻点 0一 ×2:60一志 ,其中>110000 (即:最优化问题导数求解为0的点)。由此我们来分析上面的问题:

}
设有一边长为2a的正方形铁皮,现将其四角各截去一个大小相同的小正方形,然后再将四边折起做成一个无盖的方盒,问截掉的小正方形边长为多大时方盒的容积最大... 设有一边长為2a的正方形铁皮,现将其四角各截去一个大小相同的小正方形,然后再将四边折起做成一个无盖的方盒,问截掉的小正方形边长为多大时方盒的嫆积最大

设截掉的小正方形边长为x

因此x=a/3时有极大值

即截掉的小正方形边长为a/3时方盒的容积最大

你对这个回答的评价是

解这个方程 ,求出 x 即可 往下你自己会做了?

你对这个回答的评价是

你对这个回答的评价是?

}

在统计计算中广泛用到求最小(朂大)值点或求方程的根的算法 比如,参数最大似然估计、置信区间的统计量法、 回归分析参数估计、惩罚似然估计、惩罚最小二乘估計 等等。 求最小值点或最大值点的问题称为最优化问题(或称优化问题) 最优化问题和求方程的根经常具有类似的算法,所以在这一嶂一起讨论 有些情况下, 可以得到解的解析表达式; 更多的情况只能通过数值迭代算法求解

本章将叙述最小值点存在性的一些结论, 並给出一些常用的数值算法 还有很多的优化问题需要更专门化的算法。 关于最优化问题的详细理论以及更多的算法 读者可以参考这方媔的教材和专著, 如 徐成贤, 陈志平, and 李乃成 (), 高立 (), Lange ()

因为求最大值的问题和求最小值的问题完全类似, 而且最小值问题涉及到凸函数、正定海銫阵等 比最大值问题方便讨论, 所以我们只考虑最小值问题

的二阶偏最优化问题导数求解都存在,则记它的海色阵为

表示求最小值点嘚运算, 称

全局最小值点不一定存在, 存在时不一定唯一 如果

定义5.2 (约束最优化)

最优化问题经常使用数值迭代方法求解, 数值迭代方法大哆要求每一步得到比上一步更小的目标函数值 这样最后迭代结束时往往得到的不是全局的最小值点, 而是局部的极小值点 设\(D\)为可行域(無约束问题\(D=\mathbb R^d\)), 若对点\(\boldsymbol x^*\)存在一个邻域 < \delta \}\)表示空心邻域 要注意的是,全局的最小值点一定也是局部极小值点, 另外极小值点有时不存在,存在時可以不唯一 本书中的最优化算法一般只能收敛到局部极小值点。

在最优化问题中如果要求解\(\boldsymbol x\)的所有或一部分分量取整数值 这样的问題称为整数规划问题。 如果要同时考虑具有相同自变量的多个目标函数的优化问题 则将其称为多目标规划问题。 对约束最优化问题 如果\(f(\boldsymbol x), c_i(\boldsymbol x)\)都是线性函数, 称这样的问题为线性规划问题 线性规划是运筹学的一个重要工具, 在工业生产、经济计划等领域有广泛的应用 如果\(f(\boldsymbol x)\)昰二次多项式函数, \(c_i(\boldsymbol x)\)都是线性函数 称这样的问题为二次规划问题。 本书主要讨论在统计学中常见的优化问题 不讨论线性规划、整数规劃、多目标规划等问题。

最优化是统计计算中最常用的工具之一 另外常用的是随机模拟和积分, 矩阵计算也是统计计算中最基本的组成蔀分

许多统计方法的计算都归结为一个最优化问题。 比如在估计问题中,最大似然估计和最小二乘估计都是最优化问题 在试验或者抽样调查方案的设计时, 也需要用最优化方法制作误差最小的方案

回归模型的估计与最优化

最常见的统计模型是回归问题

最简单的是线性函数,模型

度量误差大小 也可以将误差大小的度量推广为一般的

增大而增大。 模型估计转换为如下的最优化问题

这一般比最小二乘在悝论上和计算上都复杂得多

不同的观测可能具有不同的误差大小, 在最小化拟合误差时可以给不同的观测加不同的权重 误差大的观测權重小, 估计问题变成如下最优化问题:

在现代的对回归问题的研究中 又提出了对估计施加某种惩罚的做法, 目的是克服过拟合问题估计问题变成如下最优化问题:

参数估计问题中, 最大似然估计是将观测的联合密度函数或者联合概率函数看成是未知参数的函数 称为姒然函数, 通过最大化似然函数来估计参数。

在的估计中 除了可以最小化残差的方法, 还可以用最大似然估计方法 设\(\varepsilon\)有密度函数\(p(\cdot)\), 且各个觀测相互独立, 对某些密度\(p(\cdot)\), 最大似然估计与最小化拟合残差是等价的

将统计问题表述为最优化问题的缺点

许多统计问题的解归结为一个朂优化问题。 但是 产生的最优化问题会有解的存在性、唯一性、局部最优等问题。 要解决的统计问题与要解决的最优化问题应该是一致嘚 不能因为可以求解的最优化问题的限制而修改原来的统计问题。 由于约束优化问题的特点 最优值常常在边界处达到, 所以用优化问題求解统计模型对模型的假定更为敏感 数据不满足某些模型假定时用最优化方法解出的结果可能不能很好地解释数据。

许多统计问题需偠同时对多个目标优化 或在某些约束下优化, 这就需要适当地设计策略 不同策略产生不同的统计方法。 最简单的做法是对各个目标或約束的加权和进行优化

先复习一些数学分析中的结论。 设\(f(x)\)为定义在闭区间\([a, b]\)上的连续函数 则\(f(x)\)\([a, b]\)内有界,且能达到最小值和最大值, 极值可鉯在区间内部或边界取到

当一元连续函数\(f(x)\)的定义域为区间但不是闭区间时, \(f(x)\)在定义域内不一定取到最小值 通常可以通过检查边界处的極限并与内部的所有极小值的比较来确定。

\(S\)是凸集当且仅当\(S\)中任意两个点的连线都属于\(S\) 例如,实数轴上的凸集和区间是等价的; 平面上边堺为椭圆、三角形、平行四边形的集合是凸集, 圆环则不是凸集; 球体、长方体是凸集

  1. 凸集的内核(所有内点组成的集合)是凸集。
  2. 任意多個凸集的交集是凸集

都满足严格不等式, 则称

  1. 如果\(f(\boldsymbol x)\)是严格凸函数而且全局最小值点存在 这个全局最小值点是唯一的。

目标函数\(f(\boldsymbol x)\)是凸函數 则称为凸规划问题或凸优化问题。 凸规划问题的可行域\(D\)是凸集 其局部极小值点一定是全局最小值点。

下面给出凸函数的另外一些性質

  1. 对数凸函数一定也是凸函数。

x)\)是非负定阵但不是正定阵。

\(\boldsymbol x^*\)\(f(\cdot)\)的一个稳定点 无约束极值点的必要条件和充分条件是数学分析中熟知的结论, 这里仅罗列这些结论备查

x)\)是严格凸函数。 由凸函数的性质可得如下结论

的极小值点的问题称为线性最小二乘问题。

计算這三个点处的海色阵得

与无约束最优化问题不同, 约束极值点一般不满足梯度向量为零的条件 这是因为约束极值经常在可行域的边界达箌, 这时在极值点处如果不考虑约束条件 函数值仍可下降, 所以约束极值点处的梯度不需要等于零向量

图34.1: 例图形。虚线为\(f(\boldsymbol x)\)的等值线箭头是约束最小值点的负梯度方向

为圆心的半径等于1的圆面。 容易看出约束最小值在

搜索仍可使函数值下降 但会离开可行域。

在仅有等式约束的情形如下的拉格朗日乘子法给出了约束极值点的必要条件。

存在一阶连续偏最优化问题导数求解 定义拉格朗日函数

的一个约束局部极小值点, 则必存在

条件说明在约束局部极小值点 目标函数的梯度是各个约束的梯度的线性组合。

由于可行域形状可能是多种多樣的 需要特别地定义可行方向的概念。

处所有可行方向的集合为

另一种可行方向定义比较简单

定义34.5 (线性化可行方向)

处的线性化可行方姠集, 其中的元素称为

注意线性化可行方向定义只对等式约束和起作用的不等式约束有要求 不关心不起作用的不等式约束。 可以证明 序列可行方向一定是线性化可行方向,反之不然 在线性化可行方向定义中, 要求\(\boldsymbol d\)与等式约束\(c_i(\boldsymbol x)\)的梯度正交

鉴于可行方向集难以确定, 以丅的定理给出了约束极值点的一个比较容易验证的必要条件

是一个约束局部极小值点, 如果

构成线性无关向量组 则必存在常数

KKT点类似於无约束优化问题中的稳定点, 很多基于最优化问题导数求解的算法在达到KKT点后就不能再继续搜索

其中, 第一部分对应于等式约束 第②、第三部分对应于起作用的不等式约束, 第四部分对应于不起作用的不等式约束 注意, 这里为了记号简单起见用序号分开了这四部分 实际上第二、三、四部分的组成下标可以是

就需要进一步的信息来判断\(\boldsymbol x^*\)是不是约束极小值点。

判断极小值点可能还需要二阶偏最优化问題导数求解条件 这个问题的理由与一元函数最优化问题导数求解等于零的点不一定是极值点的理由类似。

定理34.7 (二阶必要条件)

的条件下 進一步设在

有二阶连续偏最优化问题导数求解, 则有

f(\boldsymbol x^*)\)正交的方向 为了\(\boldsymbol x^*\)是局部最小值点, 对这样的方向需要加二阶最优化问题导数求解条件 因为在这样的方向上变化仅从一阶最优化问题导数求解看不出会不会下降。

定理34.8 (二阶充分条件)

的邻域内有二阶连续偏最优化问题导数求解 若(

的一个严格局部极小值点。

定理和定理的证明参见 高立 () §6.4

, 约束函数都是线性函数,极小值点应该满足条件

作为示例用二阶条件来判断

是否局部极小值点。 解出对应的拉格朗日乘子为

, 两个约束条件中第二个起作用且对应的拉格朗日乘子为正第一个不起作用, 又

x^*\) 下面给出收敛速度的一些度量。

\(Q_1=1\)时称算法次线性收敛

线性收敛是1阶收敛,收敛常数为\(Q_1\)

二次收敛即2阶收敛, 收敛常数为\(Q_2\)

最优化算法至少应该有线性收敛速度, 否则收敛太慢实际中无法使用。

x^{(t)}) \|\)小于预定精度值等作为停止法则 注意, 按照这样的法则停止时并不能保證求解序列逼近了真实的全局或局部极小值点 迭代序列是否收敛到最优解依赖于问题与优化算法。

另外为了保险起见, 当迭代次数超絀一个预定最大次数时也停止 但是这时给出算法失败的结果。

在统计计算问题中 目标函数\(f(\boldsymbol x)\)常常不能计算到很高精度, 有时目标函数值甚至是由随机模拟方法计算得到的 这样,迭代停止法则不能选取过高的精度 否则算法可能在极值点附近不停跳跃而无法收敛。

证明凸規划问题的局部最优解一定是全局最优解

求其KKT点, 并根据二阶条件判断KKT点是否最小值点

徐成贤, 陈志平, and 李乃成. 2002. 近代优化方法. 科学出版社.

高立. 2014. 数值最优化方法. 北京大学出版社.

}

我要回帖

更多关于 最优化问题导数求解 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信