本文是个人翻译的粗糙校对版,原文发表于2020年12月的Defence and Peace Economics。鉴于缺少表格和公式编辑工具的问题,这些内容以截图形式发布,有些内容有个人补充。
全文长11310字,已经译毕,因为篇幅需要分两次放出。目前没有精细校对过,一些地方存在错误之处。
本文旨在介绍和讨论一种评估军事装备质量的方法,同时还将这种方法同以前为相同目的创造的方法进行了比较。以主战坦克为例,介绍了建议方法的结构和初步结果,同时讨论了其潜在的优点和局限性。该方法的初步结果表明,美国和西欧的坦克传统上具有质量优势。然而,它们也表明现代俄罗斯和中国的坦克已经缩小了这一差距。装备性能分析模型,例如本文中介绍的,可以在评估全球和区域力量平衡以及估计购买力平价和设备成本升级时提供额外的见解。本文有望鼓励进一步讨论如何衡量和比较军事装备质量。
随着国际紧张局势的加剧和大国竞争再次回到国家安全议程的首位,准确评估和比较军事能力的需求变得越来越重要。《国防与和平经济》刊物一直努力准确地描述不同国家分配给国防的资源以及这些投入产生的能力。
军费开支是评估相对军事实力时最常用的衡量标准之一[1]。然而,虽然军费开支确实提供了对分配给国防的货币资源的估计,但这些数字并不会自动转化为军事能力方面的产出。
用于更直接估计能力的措施包括军事装备的数量[2]。这些数据确实可以根据国家之间的数量和随时间变化的趋势来了解相对实力,但不能说明趋势和质量差异。装备质量数据确实存在(即使很难获得),但在很大程度上缺乏帮助我们构建、比较和分析军事装备质量的广泛接受或完善的方法。
这种方法可以帮助国防经济学家和军事分析家更深入地了解各国之间军事装备质量的差异以及装备质量随时间的变化。尽管对军事装备质量的任何估计都或许只能在整体能力难题中再增加一块,但这将是至关重要的一块。连同有关设备数量和军费开支的可用数据,它可以进一步了解全球和地区的力量平衡,有助于解释成本上升的原因,并在估计国防特定项目上涨和购买力平价时很有用。[3]
本文的主要目的是介绍和讨论一种评估军事装备质量的方法。建议的方法称为军事性能指数 (MPI),之前已在瑞典国防研究局 (FOI) 发布的一份备忘录(参见Olsson 2018)中提出。[4]本文应被视为这项工作的延续和发展。建议的MPI方法将与其他先前开发的用于估计军事装备质量的方法和措施相关地进行介绍和讨论。本文还将介绍MPI方法的初步结果,并讨论解释这些结果的方法。
虽然说没有公认的或普遍接受的测量军事装备质量的方法,但相反的是,这并不意味着该主题尚未开发。国防研究人员和作战分析师在评估军事能力和装备质量方面有着悠久的传统,使用专家分析、兵棋推演和模拟等方法达到这一目的。在获得新能力时,采购机构自然而然地必须定期评估设备性能。
在国防研究人员社区内,冷战期间完成了许多关于评估和比较军事装备质量以及特定物资系统对整体军事能力的贡献的工作。在2000年代也进行了一些工作,但从那时起,针对设备质量的研究一直是零星的。
一种常用的设备质量评估办法是专家评估法,武器效能指数(MEI)使用这种主观评估来根据火力、生存能力和机动性对设备进行排名[5]。另一个种方法,例如Middleton等人(2006)提出的,是军用装备质量。该方法还旨在通过在总体水平上捕获设备质量来比较各国的能力。这是通过联合分析完成的,专家在三分制上对系统进行排名:更好,相似或更差。专家排名的优势在于能够对大量的军事系统进行分类。然而,这种方法总是依赖于专家的主观判断,并且可能难以复制,因为它有些依赖劳力了。
过去的军事装备性能指标包括代值和实际性能指标。重量已被用作质量的代表用于许多军事系统,例如Pugh(2007)。同样,Löfstedt(2004)使用服役年限作为对现代性的估计,并间接用于系统性能。代值具有使用容易获得的数据的优势。但是,时长和重量等代值最多只能捕获一个维度的性能,最坏的情况是可能与实际性能的相关性非常弱。大而重的坦克并不自动意味着更好的坦克。
其他的研究者,例如Arena(2006)将代值和实际性能指标结合,以评判许多系统的质量。NATO RTO(2011)的一份研究类似的使用了年限和重量等代值,并结合了主武器射程和单一油箱的续航等实际性能。在一项模拟飞机成本升值的研究中,Horowitz,Harmon和Levine(2016)使用重量和先进材料的份额,速度与虚拟变量生成垂直起降能力。Hove和Lillekvelland (2014) 还使用代值和实际性能指标的组合来解释一系列系统的质量改进。 Nordlund、Khodabandeh 和 Åkerström(2018)紧随其后,并结合使用代值和实际值来模拟瑞典军事装备成本上升的原因。虽然与一维代值相比有了显着的改进,但这些方法仍然严重依赖仅间接捕获性能的指标。
完全依赖实际性能数据的研究数量很小,很可能是因为这类数据很难获得。战术数字确定性模型 (TNDM) 使用历史数据来估计性能[6]。虽然稳健,但这种方法需要定期更新。 Löfstedt (2002) 开发了一种使用实际性能指标的方法,其中使用了一个相当复杂的模型来测量多用途战斗机的性能。 该模型包括发动机性能、飞机机动性以及武器的射程和速度。 然而,本研究中使用的数据来自未公开的来源。此方法与本文中介绍的方法非常相似,尽管目的、方法和复杂性有所不同。
很自然,上述每种方法都各有利弊(见表1)。基于易于访问的代值(例如年限或重量)的方法易于复制,因此可以说具有较高的可靠性。但是,代值的有效性可能会有很大差异,具体取决于它们捕获实际设备性能的能力。如果这种能力很低,代值实际上可能会产生误导性的结果。增加飞机的重量并不一定会使它变得更好,虽然年限是现代性的一般指标,但一些较新的设备实际上可能是旧型号的降级版本。
专家评估法规避了数据可用性问题。通过让专家排名或分配分数,研究人员可以创建自己的数据集。这为专家评估提供了相对较高的有效性,因为他们衡量的是他们打算衡量的内容。然而,专家评估依赖于主观判断,由于个人偏见或过时的经验,这可能是不正确的。在比较国家之间的设备时,这一点变得尤为重要,因为很少有专家拥有操作来自少数几个国家和最多几代人的设备的直接经验。
基于实际性能数据的评估具有较高的有效性,因为它实际评估的是设备性能。然而,这只有在模型构建正确的情况下才是正确的。虽然数据可靠性很高,因为它不依赖于主观判断,但数据可用性构成了挑战,因为实际性能指标通常是绝密的。
上述方法只是以前衡量性能的几个例子,但可以看出衡量军事装备质量的一些一般原则。有几种方法使用参考系统,即与其他系统进行比较的特定设备,例如在构建数值性能指标时。在其他情况下,例如专家评估,其中各种系统相互关联,并根据其评估得出能力进行排名。但无论是专家评估还是数值指标,所有的方法都是建立在设备质量可以量化比较的前提下的。
如上所述,本文提出的方法称为军事绩效指数 (MPI),之前已在FOI发布的备忘录中提出(参见 Olsson 2018)。
任何给定系统i的通用MPI方程MPIi表示为配额 Xi/Xr 或系统i的性能值除以参考系统的性能值(参见方程1)。然后将该配额除以n(包含变量的数量),所得平均值乘100。
MPI 是由多个子索引组成的复合索引。 每个子指数应代表一个与军事性能相关的因素(例如火力)。子指数的因素反过来又被转化为可测量的变量,这些变量应该捕捉到该因素的关键要素(例如主要武器的射程)。 然后将每个变量的值与参考系统的相应值相关联。
一般原则是包含变量的数量应保持在最低限度,以便某个绩效指标的任何改进都不会被大量变量稀释。这也将包含值之间重叠的风险降至最低。少量变量使得包含的变量实际捕获系统性能变得更加重要。
由于该模型的目的是为不同时间和国家之间的比较生成数据,因此MPI是一个通用模型,旨在捕捉任何特定作战或战术场景范围之外的军事绩效。换句话说,它是一个“靶场”模型,其中设备质量通过定量性能指标来估计,而其他所有条件都保持相同或不受上下文影响,在其他条件不变的情况下。
2018 年的 FOI 研究以主战坦克为例来说明如何对设备质量进行建模。本文介绍和讨论的正是这些结果。之所以选择主战坦克作为例子,是因为坦克的军事性能相当直截了当。坦克的性能通常分为三个因素;火力、保护和机动性[7]。
系统i的MPI-MBT 函数可以用方程式2表示,其中Fi表示系统i的火力,Fr表示参考系统的火力。类似地Pi和Pr分别表示系统 i 和参考系统的保护,而Mi和Mr表示系统 i和参考系统的移动性。然后将配额的总和除以包含变量的数量,在本例中为3,并乘100。这里给出了参考系统的平均值100,系统i的其余部分与之比较。
为了使模型不受上下文影响,到目前为止,所包含的因素以未加权的形式呈现。 原因是火力、保护和机动性的相对重要性可能因作战或战术环境而有很大差异。 这并不意味着如果包含因素的相对重要性已知或可以由合理的假设推动,则可以或不应该将权重包含在模型中。
在确定了主战坦克性能的相关因素之后,每个因素都需要操作化为一个可量化的变量。在 MPI-MBT的示例中,火力已通过可用的最佳尾翼稳定脱壳穿甲弹 (APFSDS)或动能穿透弹的穿深进行计算。穿深以轧制均质钢装甲当量 (RHAe) 的毫米为单位测量。RHAe用于表示穿透深度或复合装甲或反应装甲的厚度,在本文中以2公里的射击距离为单位。
炮塔正面针对APFSDS和高爆破甲 (HEAT) 弹药或化学能穿透弹的最大装甲强度同样可以起到保护作用,也以毫米RHAe为单位。炮塔的前部几乎毫无例外地是现代坦克中最受保护的部分,因为这部分最有可能受到敌人的火力攻击。选择2公里距离火力和炮塔正面防护的另一个原因是这些指标值是最常用的。
机动性通过马力通过以公吨测量的重量来评价。由于发动机马力和油箱重量都是相当常见的值,因此可以相对容易地识别出这个变量。它还与其他移动性指标(例如以每小时公里数衡量的速度)具有高度相关性。
关于实际军事表现的开源数据通常很少。这一事实本身限制了包含变量的范围,其后果将在下面进一步讨论。但是,一些性能数据确实存在。MPI MBT 中包含的变量数据来自 2014 年全球设备指南 (WEG 2014)和《钢铁猛兽》(Steelbeast.com)。WEG 2014由美国陆军训练和条令司令部 (TRADOC) 发布,大多数俄罗斯和中国坦克的数据都是从该来源收集的。
同时,《钢铁猛兽》是一款虚拟模拟游戏,它模拟坦克火力和装甲,在可玩的场景中产生逼真的结果。大多数美国和西欧坦克的数据都是从这个站点检索的。虽然不是官方的军事模拟工具,但《钢铁猛兽》似乎确实被专业人士使用。一些系统出现在两个来源中,这使得某种程度的验证成为可能。此类系统的平均重叠率约为 90%,为Steelbeast.com 数据的可靠性提供了支持。
与海湾战争实况手册(参见Chadwich Caffrey 1991)和沙漠之盾实况手册(参见Chadwick 1991)中提供的性能数据相比,WEG 2014和《钢铁猛兽》的数据也有显着重叠。对所包括的坦克和国家的选择主要是数据可用性的结果,但一些额外的重点已经放在主要军事大国上。
表2中的数据显示,最佳的已有APFSDS的火力范围从二战末期投入使用的英国百夫长(Centurion)坦克的270毫米RHAe到21世纪美国M1A2艾布拉姆斯(Abrams)坦克的840毫米。
炮塔正面的APFSDS防护范围从法国 AMX-30 的仅81毫米到英国挑战者(Challenger)2的1250毫米。对HEAT的防护范围从81毫米,同样来自AMX-30到豹(Leopard)2A5 的2000毫米,由德国开发和生产。请注意,旧坦克的防护等级在APFSDS和HEAT弹药之间没有太大差异。这是因为前几代坦克通常由均质钢制成,而现代坦克的复合材料、反应性和间隔装甲通常相比APFSDS动能穿透弹,能够提供更好的抗HEAT化学能穿透弹保护。
与火力和保护相比,机动性随着时间的推移更加稳定。早期的坦克,如英国百夫长Mk.5和中国的59式坦克可以分别产生每吨12.5和14.2马力的功率,而美国M1A2艾布拉姆斯和中国99A型等现代坦克的每吨马力分别为23.1和25.9马力。
在详细介绍和解释MPI-MBT的结果之前,需要解决建议方法的局限性和合理的界限。
试图衡量军事装备质量,包括主战坦克的性能,必然是对极其复杂的现实的简化。首先,军事装备的真实性能在很大程度上取决于单个系统本身的外生因素。没有人员的一件装备只是一堆复合材料和金属板,人员的训练和士气对整体战场性能至关重要。对于主战坦克来说,来自步兵、步兵战车的支援以及来自火炮或战斗机的间接火力支援也可能具有决定性意义。领导力、通信、后勤和维护支持也是决定整体设备性能的重要因素。
来自不同国家的坦克通常在设计时考虑到不同的预期角色,因此很难进行彻底的质量比较。然而,为了获得通用且独立于特定操作条件的数据,这些外生因素必须从本文提出的模型中排除。此外,为了捕捉最重要性能因素的变化并避免重叠和不必要的复杂性,目标是尽可能少地使用最相关的变量。
尽管如此,一些潜在的有趣变量已被排除在火力、保护和机动性因素之外。 应该解决这些排除的原因和潜在后果,如果没有别的,那么考虑透明度,因为这一点对于此处建议的任何方法的可复制性和可靠性至关重要。[11]
MPI-MBT中的火力是通过给定系统可用的最佳APFSDS弹来衡量的。但是,这意味着已排除了几种其他类型的弹药。高爆破甲弹(HEAT)包含在模型的早期版本中。但由于坦克发射的HEAT弹在对抗现代装甲时失去了大部分效力,并且通常只占现代坦克战斗载荷的一小部分,因此它们已被排除在模型之外。
由于目前对间隔装甲和内部防剥落衬里的使用,高爆碎甲弹 (HESH) 弹药在对抗现代装甲失去了大部分的能力。此外,这些炮弹仅由少数国家使用,这使得比较毫无意义,因此被排除在模型之外。
高爆破片弹(HEF或HE-Frag)通常占坦克战斗载荷的很大一部分,按照这种逻辑应该包括在内。然而,由于现代HEF弹对步兵和大多数轻型装甲车辆都有致命影响,因此它们被排除在模型之外,因为其原则是仅包括可能揭示性能差异的最相关变量。
从坦克发射的反坦克导弹(ATGM)提供了更大的作战范围。 但是,这些仅被俄罗斯和中国等少数国家使用,因此被排除在外。如果将它们包含在MPI-MBT的未来版本中,它们将需要与当前包含的变量进行不同的建模,因为ATGM的成功使用很大程度上取决于它们是否可以命中目标,而不是可计计量的穿深数值。
坦克之间的机枪数量和口径确实有所不同。然而,机枪仅构成主战坦克的次要武器。 现代坦克上机枪的数量和口径也趋向于标准的一挺7.62毫米机枪和一挺12.7毫米重机枪。因此,机枪被排除在模型之外。
主炮的射程通常与穿透值有很好的相关性(R2 = 0.71)。然而,关于火炮射程的数据通常以最大值给出(例如3000-4000米),其精度低于2000米的穿深。射速对于坦克的火力也很重要。但事实上数据可用性是一个问题,虽然有些坦克有自动装弹机,但其他坦克则依赖手动装弹,而装弹机的技能决定了射速。因此,该变量已被排除。 主炮的精度是与火力相关的一个重要变量,最好包括在内。然而,由于缺乏开源数据,这个变量被排除在外。
MPI-MBT中的保护是通过炮塔正面装甲的最大强度来衡量的。该模型隐含地假设炮塔前部代表了整体防护水平,但这并非没有问题。炮塔前部通常是坦克受到最好保护的地方,但炮塔保护良好并不一定意味着坦克整体保护良好。尽管如此,经验数据表明,炮塔的正面是坦克最容易被击中的部分。此外,炮塔正面保护是最广泛可用的数据,因此用于 MPI-MBT。任何更详细的分析都需要不同部分的油箱保护数据,以及这些部分被击中的可能性数据。目前,此类数据不可用,并且由于其机密性质,可能仍然如此。
其他防御变量有可用的数据,但由于各种原因被排除在外。红外烟雾弹是现代坦克的标准配置,由于限制变量数量的原则,已被排除在外。扫雷犁是某些坦克上的固定组件,可以安装在其他坦克上。但是,此功能因用于替代其他扫雷车辆,并未包含在此模型中。化学、生物、辐射和核 (CBRN) 保护也是大多数现代坦克的标准功能,即使性能可能会有所不同,但此类数据不可用。因此,该变量已被排除。
主动保护系统 (APS) 正成为现代坦克越来越普遍的特征。APS可以使用软杀伤措施(例如烟雾弹、红外干扰弹或激光干扰器)或硬杀伤措施(例如可爆炸小弹丸发射器,严格点说,反应装甲也是一种硬杀伤措施)。 APS主要针对来袭的反坦克导弹或火箭推进榴弹提供额外的保护,但也可能用于对抗其他类型的射弹。包含 APS 将改进模型,但由于缺乏有关其相对效率的数据,因此未将它们包含在此版本中。模拟APS的一个主要挑战是,它们与导弹类似,要么起作用要么不起作用。它们性能的可计量性变得困难。
坦克的大小,或者更具体地说是外形轮廓,是影响被对手瞄准和击中的总体可能性的另一个变量。但这是一个难以量化的因素,需要考虑到对手火力的精准度。因此被排除在外。
MPI-MBT的机动性是通过发动机输出(马力)除以重量(吨)来衡量的,数据相对容易获得。公路和越野速度是数据可用性高的其他移动变量,尤其是公路速度。然而,这些测量值通常与通过重量测量的马力密切相关,R2=0.81表示公路速度。为了减少重叠变量的数量,该模型中排除了速度。
航程是一个重要的性能变量,一些坦克配备了额外的燃料桶,以扩大其航程。然而,较差的操作范围或缺少添加的燃料桶可以通过优质的补给来弥补,相反,可以安装额外的燃料桶以首先弥补劣质的补给。因此范围已被排除。
坦克旨在应对崎岖多变的地形。能够攀爬障碍物和涉水水域对于坦克的机动性很重要。穿越地形的能力也随着坦克的整体地面压力而变化。然而,这些特征的重要性通常取决于特定类型的地形。爬升、涉水深度和地面压力可以包含在该模型的未来迭代中,但首先需要有一种方法来衡量这些变量相对于整体机动性的重要性。目前,这些变量被排除在外。
除了火力、防护和机动性之外,还有一些与坦克性能相关的因素,但不包括在这个版本的MPI-MBT中。其中最重要的是指挥和控制以及可维护性或技术可靠性。
C4ISR[12]的能力,如光学、光电、传感器和显示器的质量,也因坦克而异。事实证明,红外视觉和激光瞄准器等功能对坦克性能至关重要。与早期的第三代坦克(例如 M1A1艾布拉姆斯)相比,排除这些变量可能会导致低估最现代的第三代坦克(例如 M1A2艾布拉姆斯)的整体性能。C4ISR功能很可能会包含在模型的未来迭代中,但这再次需要一种方法来将这些与当前包含的变量联系起来。坦克与其他系统之间的通信在现代战场上变得越来越重要。通过数据链快速、可靠和安全的信息绝对是坦克性能的一部分。由于缺乏公开数据,该变量迄今已被排除在外,但通信很可能会包含在未来的版本中。
可维护性,例如直到维护结束的时间也因坦克而异。发动机、车轮悬架、履带和其他运动部件的可靠性是影响性能的重要因素。这一因素对采购机构尤为重要。然而,可维护性取决于储罐的使用频率和使用条件,这对系统本身来说是外生的。缺乏数据是此版本模型中排除技术可靠性的另一个原因,即使在理想情况下可能已包含在内。
评论区
共 3 条评论热门最新