系列文章 分享 模型,了解更多👉 模型_思维模型目录。正交验证:多因素影响下的最优解探索。
1 模型正交验证的应用
1.1 磁疗对烫伤治疗消肿效果的研究
背景简介: 某研究所为了研究磁疗对烫伤治疗的消肿效果,对白鼠进行试验。研究中选取了三个因素:强度(A)、磁疗时间(B)和振动(C)。
分析目的: 使用正交设计安排实验,以考察各因素的效应,并选取最佳消肿效果的条件。将得到的数据进行极差分析。
正交试验设计: 本案例中共涉及3个因子(因素),每个因素均有3个水平。研究所选用了合适的正交表,将表中各列因子下的数字“1”、“2”、“3”,分别换成各因子在试验中的水平值,并根据此表格安排试验方案。其中表格最后一栏为试验结果。
正交表设计示例:
试验编号 | 强度A | 磁疗时间B | 振动C | 消肿效果(%) |
---|---|---|---|---|
1 | 1 | 1 | 1 | 20 |
2 | 1 | 2 | 2 | 25 |
3 | 1 | 3 | 3 | 30 |
4 | 2 | 1 | 2 | 28 |
5 | 2 | 2 | 3 | 32 |
6 | 2 | 3 | 1 | 35 |
7 | 3 | 1 | 3 | 33 |
8 | 3 | 2 | 1 | 38 |
9 | 3 | 3 | 2 | 40 |
极差分析计算方法解读和说明:
-
计算每个因素在不同水平下的平均响应值:对于每个因素,计算其在每个水平下的平均消肿效果。
-
计算每个因素的极差:极差 = 最高水平的平均响应值 - 最低水平的平均响应值。
-
确定因素的重要性:极差越大,表示该因素对响应变量的影响越大。
极差分析计算方法:
-
计算K值:对于每个因素的每个水平,计算该水平下所有试验的消肿率之和。
- 强度A:
- K1 = 20% + 25% + 30% = 75%
- K2 = 28% + 32% + 35% = 95%
- K3 = 33% + 38% + 40% = 111%
- 磁疗时间B:
- K1 = 20% + 28% + 33% = 81%
- K2 = 25% + 32% + 38% = 95%
- K3 = 30% + 35% + 40% = 105%
- 振动C:
- K1 = 20% + 28% + 33% = 81%
- K2 = 25% + 30% + 38% = 93%
- K3 = 30% + 32% + 40% = 102%
- 强度A:
-
计算Kavg值:Kavg值 = K值 / 水平数。
- 强度A:
- K1_avg = 75% / 3 ≈ 25%
- K2_avg = 95% / 3 ≈ 31.67%
- K3_avg = 111% / 3 ≈ 37%
- 磁疗时间B:
- K1_avg = 81% / 3 = 27%
- K2_avg = 95% / 3 ≈ 31.67%
- K3_avg = 105% / 3 = 35%
- 振动C:
- K1_avg = 81% / 3 = 27%
- K2_avg = 93% / 3 = 31%
- K3_avg = 102% / 3 ≈ 34%
- 强度A:
-
计算R值:R值 = max(Kavg) - min(Kavg)。
- 强度A:
- R_A = 37% - 25% = 12%
- 磁疗时间B:
- R_B = 35% - 27% = 8%
- 振动C:
- R_C = 34% - 27% = 7%
- 强度A:
结果解读: 从极差分析结果表格可以得知,从3个因子来看,结合R值(因素极差值)的大小对比可知,因子A(强度)为最优因子,其次为因子B(磁疗时间),最后是因子C(振动)。因此3个因素的优劣排序为强度A > 磁疗时间B > 振动C。
具体结合最佳水平(Kavg最大时对应的水平)可知:
- 因子A强度对应水平3时最优;
- 因子B磁疗时间对应水平3时最优;
- 因子C振动对应水平3时最优;
所以,正交验证得出最佳消肿效果的条件为“磁场强度A3、磁疗时间B3、振动C3”。开始实验验证,发现消肿率为44% 。与当前的消肿率最大值40%对应的一组数据相比A3、B3、C2对比更好,说明 正交验证得出的组合更佳。(这里需要注意,有时候存在 正交验证 得出的数据和当前实验中所有数据的相比弱的情况,因此最后一步一定不能少)。
结论: 本案例为三因素三水平正交试验设计,按照正交表进行了9次试验,然后通过极差分析寻找最佳消肿效果的条件。最后正交验证得出的最佳消肿效果条件为“磁场强度A3、磁疗时间B3、振动C3”。实际验证后比当前最佳数据比A3、B3、C2还要好。
1.2 提高水稻播种机穴盘育秧播种装置性能的正交验证
背景简介: 为了改善原有水稻播种机穴盘育秧播种装置中窝眼辊轮结构,提高播种量的稳定性和播种的均匀性,某研究所进行了一系列的试验。研究团队选取了三个因素:生产率(A)、播种量(B)、投种高度(C)。
分析目的: 通过正交验证来评估不同因素和水平组合对播种性能的影响,并确定最佳播种装置设计参数。
正交试验设计: 本案例中共涉及3个因子(因素),生产率有2个水平,播种量和投种高度因素均有4个水平。研究所选用了L16(4^4)正交表,设计了16次试验。以下是正交表和实验数据:
试验编号 | 生产率A | 播种量B | 投种高度C | 性能评分 |
---|---|---|---|---|
1 | 1 | 1 | 1 | 80 |
2 | 1 | 1 | 2 | 85 |
3 | 1 | 2 | 3 | 90 |
4 | 1 | 2 | 4 | 95 |
5 | 1 | 3 | 1 | 88 |
6 | 1 | 3 | 2 | 92 |
7 | 1 | 4 | 3 | 97 |
8 | 1 | 4 | 4 | 100 |
9 | 2 | 1 | 3 | 82 |
10 | 2 | 1 | 4 | 87 |
11 | 2 | 2 | 1 | 91 |
12 | 2 | 2 | 2 | 96 |
13 | 2 | 3 | 3 | 89 |
14 | 2 | 3 | 4 | 94 |
15 | 2 | 4 | 1 | 98 |
16 | 2 | 4 | 2 | 102 |
极差分析计算方法:
- 计算K值:对于每个因素的每个水平,计算该水平下所有试验的性能评分之和。
- 计算Kavg值:Kavg值 = K值 / 水平数。
- 计算R值:R值 = max(Kavg) - min(Kavg)。
计算过程:
-
生产率A的K值:
- K1 = 80 + 85 + 90 + 95 + 88 + 92 + 97 + 100 = 727
- K2 = 82 + 87 + 91 + 96 + 89 + 94 + 98 + 102 = 749
-
生产率A的Kavg值:
- K1_avg = 727 / 8 = 90.875
- K2_avg = 749 / 8 = 93.625
-
生产率A的R值:
- R_A = 93.625 - 90.875 = 2.75
-
播种量B的K值:
- K1 = 80 + 85 + 82 + 87 = 334
- K2 = 90 + 95 + 91 + 96 = 372
- K3 = 88 + 92 + 89 + 94 = 363
- K4 = 97 + 100 + 98 + 102 = 397
-
播种量B的Kavg值:
- K1_avg = 334 / 4 = 83.5
- K2_avg = 372 / 4 = 93
- K3_avg = 363 / 4 = 90.75
- K4_avg = 397 / 4 = 99.25
-
播种量B的R值:
- R_B = 99.25 - 83.5 = 15.75
-
投种高度C的K值:
- K1 = 80 + 85 + 91 + 96 = 352
- K2 = 90 + 95 + 89 + 94 = 368
- K3 = 88 + 92 + 82 + 98 = 360
- K4 = 97 + 100 + 87 + 102 = 386
-
投种高度C的Kavg值:
- K1_avg = 352 / 4 = 88
- K2_avg = 368 / 4 = 92
- K3_avg = 360 / 4 = 90
- K4_avg = 386 / 4 = 96.5
-
投种高度C的R值:
- R_C = 96.5 - 88 = 8.5
结果解读: 从极差分析结果表格可以得知,从3个因子来看,结合R值(因素极差值)的大小对比可知,因子B(播种量)为最优因子,其次为因子C(投种高度),最后是因子A(生产率)。因此3个因素的优劣排序为播种量 > 投种高度 > 生产率。
具体结合最佳水平(Kavg最大时对应的水平)可知,因子A生产率对应水平2即生产率2时最优;因子B播种量对应水平4即播种量4时最优;因子C投种高度对应水平4即投种高度4时最优。所以,通过正交验证得出最佳播种效果的条件为“生产率2、播种量4、投种高度4”。
通过实验验证该方案,实际的性能评分为100,是少于组合中的“生产率2、播种量4、投种高度2”的,此时如果悬额再最有方案,需要调整为“生产率2、播种量4、投种高度2”。
结论: 本案例为三因素四水平正交试验设计,按照正交表进行了16次试验,然后通过极差分析寻找最佳播种效果的条件。由极差分析结果得知,最优因子为播种量,3个因子的优劣排序为播种量 > 投种高度 > 生产率;通过正交验证得出的最佳播种效果的条件为“生产率2、播种量4、投种高度4”。但是经过真实实验验证后,此时选择最佳方案为“生产率2、播种量4、投种高度2”。
2 模型 正交验证
2.1 什么是正交验证?
在解读正交验证前我们需要对一些基本概念有所了解,这里列一下:
正交验证中涉及的一些基本概念包括:
- 正交性(Orthogonality):指在正交表中,任意两个因素的任意两个水平组合在实验中出现的次数是相等的,这样可以确保每个因素的效果可以独立评估,不受其他因素影响。
- 正交表(Orthogonal Array):一种特殊的设计表格,用于安排多因素实验,使得各因素各水平的组合能够均匀覆盖,从而减少必要的实验次数。
- 因素(Factor):实验中可以变化的变量,它们对实验结果有影响。
- 水平(Level):每个因素可以取的不同值或状态。
- 试验编号(Trial Number):每个实验的唯一标识,对应于正交表中的一行,表示一个特定的因素水平组合。
- 响应变量(Response Variable):实验的结果变量,是实验的目的,比如产品的性能、产量等。
- 极差(Range):指某个因素在不同水平下的平均响应值之差,用来衡量该因素对响应变量的影响程度。
- 方差分析(Analysis of Variance, ANOVA):一种统计方法,用于分析各因素对响应变量的影响是否显著。
- 主效应(Main Effect):一个因素在不同水平上对响应变量的平均影响,不考虑其他因素。
- 交互作用(Interaction):不同因素之间相互作用对响应变量的影响。
- 信噪比(Signal-to-Noise Ratio, SNR):用于衡量实验结果的稳定性和可靠性,计算方法通常是响应变量的标准差的倒数。
- 综合分析(Comprehensive Analysis):对所有因素和水平的组合进行分析,以确定最优的实验条件。
- 验证实验(Confirmation Test):在正交实验完成后,对最优条件进行的额外实验,以验证其效果。
这些概念构成了正交验证的理论基础,帮助研究者设计和分析多因素实验,以优化产品或过程。接下来开始解读正交验证的概念。
正交验证是一种实验设计方法,它通过选择一组互相正交的试验方案,使得每个因素对结果的影响都可以独立地测量和分析,从而降低试验的复杂性。这种方法的主要优点是能够在多因素多水平的实验中,通过有限次的实验来确定多个因素对响应变量的影响,提高实验效率。
正交验证的起源可以追溯到20世纪初的工业实验中。由于实验条件的复杂性和资源的有限性,科学家和工程师面临着如何进行高效实验设计的问题。早期的实验设计方法主要是全因子试验设计,但随着因素的增加,实验的规模变得庞大且复杂,需要大量的资源和时间。
1926年,英国数学家R.A. Fisher首次提出了正交实验法的基本概念,他认为通过选择一组互相正交的试验方案,可以减少试验次数,并获得有效的结果。
后来,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出,为试验设计的更广泛使用作出了巨大的贡献。
2.2 为什么会有正交验证?
正交验证之所以存在和发展,主要有以下几个原因:
- 多因素同时考察的需求:在实际工作中,常常需要同时考察多个因素对某一结果的影响。全面实验由于时间和成本的限制往往不可行,因此需要一种方法能够在较少的实验次数中考察多个因素的交互作用。
- 提高实验效率:正交验证可以在有限的实验次数中考虑多个因素的互动效应,从而提高实验的效率。
- 减少实验成本:通过正交验证,可以用较少的试验次数达到全面实验的效果,有效减少实验成本。
- 优化决策和设计:正交验证可以帮助确定最优的因素组合,为决策提供支持,从而优化产品设计和工艺流程。
- 科学实验设计的需要:随着科学技术的发展,对于科学实验设计的需求日益增长,正交验证作为一种高效的实验设计方法,满足了这一需求。
- 统计学和质量管理的发展:正交验证的发展与统计学的进步和质量管理理念的提升密切相关,特别是在工业化生产中,对于提高产品质量和生产效率的需求推动了正交验证方法的应用。
- 国际标准型正交试验法的提出:日本质量管理专家田口玄一提出的国际标准型正交试验法,进一步推动了这种方法在国际上的应用和认可。
- 软件测试中的应用:在软件测试中,正交验证可以帮助设计更有效的测试用例,减少测试资源的浪费,同时确保测试覆盖面尽可能广泛。
这些原因共同推动了正交验证方法的发展和应用,使其成为研究和工业实践中不可或缺的工具之一。
2.3 正交验证的步骤
正交验证的步骤通常包括以下几个阶段:
- 确定实验目标:明确实验的目的和需要优化的关键性能指标。
- 选择因素和水平:确定影响实验结果的因素(自变量)。为每个因素确定不同的水平(不同的设定值或条件)。
- 设计正交表:根据因素和水平的数量选择合适的正交表。正交表是一种特殊的矩阵,它能够确保每个因素的每个水平都能与其他因素的每个水平以相等的频率组合出现,从而实现正交性。
- 制定实验方案:根据选定的正交表,设计具体的实验方案,包括实验的顺序和条件。
- 实施实验:按照实验方案进行实验操作,收集数据。
- 数据收集与分析:收集实验结果数据。使用统计方法(如方差分析ANOVA)分析数据,确定哪些因素对结果有显著影响。
- 结果解释:解释分析结果,确定哪些因素对响应变量有显著影响。识别最优的因素水平组合。
- 验证实验:根据正交实验的结果,进行验证实验以确认最优条件的实际效果。
- 报告和应用结果:编写实验报告,总结实验过程和结果。将实验结果应用于实际生产或研究中,以优化过程或产品。
- 后续改进:根据实验结果和实际应用情况,可能需要进行进一步的实验来细化优化条件或解决新出现的问题。
正交验证的关键在于通过正交表的设计,能够在较少的实验次数内评估多个因素和它们之间的交互作用,从而提高实验效率和结果的可靠性。