在之前的章节中，我们已经通过简单类型的λ演算，研究了各种语言特征的类型化行为。本章将介绍一个基本类型的扩展：子类型（有时也称为子类型多态性）。与我们迄今为止所研究的特征不同，子类型或多或少可以相互正交地表达，子类型是一种横向扩展，以非平凡的方式与大多数其他语言特征相交互。

子类型是面向对象语言的特征，通常被认为是面向对象风格的基本特征。我们将在第18章详细探讨这种联系;不过，现在我们只介绍函数和records的子类型。

一、子类型概述

如果没有子类型，简单类型的lambda表达式的规则可能会非常僵化，不具灵活性。类型系统会要求参数类型与函数的域类型需要完全匹配，对于许多对程序员来说明显表现良好的程序，类型编译器反而会报错。例如，回想一下函数应用的键入规则：

(T-APP)

根据这一规则，行为良好的项

是被认为类型不匹配的，因为参数的类型是{x：Nat，y：Nat}，而函数接受的却是{x：Nat}。但是，很明显，函数只要求它的参数是一个带有字段x的records;它并不关心参数是否包含其他字段。

此外，我们还可以从函数的类型中看到一点，我们并不需要查看它的主体来验证它是否使用了除x之外的任何字段。将类型为{x：Nat，y：Nat}的参数传递给期望类型为{x：Nat}的函数总是安全的。

子类型的目标是细化类型规则，以便它们可以接受类似于上面的项。我们假设S是T的一个子类型，记作S <：T，表示任何S类型的项都可以安全地用在上下文中期望T类型的项中。这种子类型的观点常被称为安全替换原则。

更简单的解释是将S <：T读成“由S描述的每个值也由T描述”，即“S的元素是T的元素的子集”。

通过添加新的类型规则--所谓的包含规则--可以提供类型关系和该子类型关系之间的一个桥梁：

(T-SUB)

这个规则告诉我们，如果S <：T，则S的每个元素t也是T的元素。例如，如果我们定义子类型关系,使得{x：Nat，y：Nat} <：{x：Nat}，那么我们可以使用规则T-Sub来推导出{x = 0，y = 1} ：{x：Nat}。

二、子类型关系

子类型关系被形式化为S <：T，读作“S是T的一个子类型”（或“T是S的一个超类型”）。我们考虑每种类型（例如函数类型、记录类型等），对于每一种类型，我们引入一个或多个规则来规范允许在需要使用另一种类型的情况下安全地使用这种形式的一种类型的元素的情况。

在讨论特定类型构造函数的规则之前，我们先做两个一般性规定：首先，子类型应该是自反的，

(S-REFL)

第二，子类型是具有传递性的：

(S-TRANS)

这些规则直接来自于安全替换的直觉。

现在，对于records类型，假设我们想定义S={k1:S1…km:Sm}是T={t1:T1…Tn:Tn}的子类型，那么就有如下性质：即子类型的元素个数是大于等于父类的:

(S-RCDWIDTH)

看起来可能令人惊讶的是，“较小”的类型（子类型）居然是具有更多字段的类型。理解这一点最简单的方法是将records类型{x：Nat}描述为“至少有一个Nat类型的字段x的所有记录的集合”。像{x=3}和{x=5}这样的值是这种类型的元素，像{x=3，y=100}和{x=3，a=true，B=true}这样的值也是。

类似地，records类型{x：Nat，y：Nat}描述至少具有字段x和y的records，这两个字段的类型都是Nat。像{x=3，y=100}和{x=3，y=100，z=true}这样的值是此类型的成员，但{x=3}不是，{x=3，a=true，b=true}也不是。因此，属于第二类型的值的集合是属于第一类型的集合的真子集。records越长，要求越高，就定义了信息更多的规范，因此描述了一组较小的值。

宽度子类型规则仅适用于公共字段相同的records类型。只要两个records中每个对应字段的类型处于子类型关系中，允许各个字段的类型变化也是安全的。意思就是对于任意一个i，如果Si是Ti的子类型，那么，属于Si的li也将会是属于Ti的li的子类型。深度子类型规则描述了这种关系：

(S-RCDDEPTH)

下面的子类型派生将S-RcdWidth和S-RcdDepth一起使用，来显示嵌套records类型{x：{a：Nat，b：Nat}，y：{m：Nat}}是{x：{a：Nat}，y：{}}的子类型：

如果我们想使用S-RcdDepth来细化单个records字段的类型（而不是细化每个字段，就像我们在上面的示例中所做的那样），我们可以使用S-Refl来获取其他字段的子类型派生。

我们还可以结合宽度和深度，使用动词的规则,子类型化S-Trans。例如,我们可以来获得一个超类型:

对于records的子类型，我们还有一个规则，就是顺序无关性，即假如Kj:Sj是Li:Ti的一种排列，那么Kj:Sj就是Li:Ti的子类型。

(S-RCDPERM)

例如，S-RcdPerm告诉我们{c：Top，B：Bool，a：Nat}是{a：Nat，b：Bool，c：Top}的子类型，反之亦然。(这个表示子类型关系不是反对称的。）

S-RcdPerm可以与S-RcdWidth和S-Trans结合使用，以便于可以从记录类型中的任何位置删除字段，而不仅仅是在末尾。

练习：画一个衍生图，来证明{x: Nat, y: Nat, z: Nat}是{y: Nat}的一个子类型。

S-RcdWidth、S-RcdDepth、S-RcdPerm每个都体现了在使用records时的不同灵活性。为了便于讨论，将它们作为三个单独的规则提出是有益的。特别是，有些语言允许其中的一些，但不允许另一些。例如Abadi和Cardelli的对象演算（1996）的大多数变体省略了宽度子类型。然而，为了实现的目的，将它们组合成一个同时做所有三件事的单个宏规则是更方便的。这条规则将在下一章讨论。

由于我们使用的是高阶语言，所以不仅是数字和records，函数也可以作为参数传递给其他函数，因此我们还必须定义函数的子类型规则。

(S-ARROW)

注意，对于左边前提中的参数类型，子类型关系的意义是相反的（逆变），而对于结果类型，它的方向与函数类型本身的方向相同（协变）。直观感觉，如果我们有一个类型为S1->S2的函数f，那么我们知道f接受类型为S1的输入;显然，f也将接受S1的任何子类型T1的元素。f的类型也告诉我们它返回类型S2的元素;我们还可以查看属于S2的任何超类型T2的这些结果。也就是说，任何类型为S1->S2的函数f也可以被视为具有类型T1->T2。

另一种观点是，允许一个类型S1->S2的函数在一个期望另一个类型T1->T2的上下文中使用是安全的，只要在这个上下文中传递给函数的参数没有一个会让它不匹配（T1<:S1），并且它返回的结果中没有一个会使上下文不匹配（S2<:T2）的数据。

最后，定义一个类型是每个类型的超类型是很方便的。我们引入了一个新的类型常量Top，以及一个使Top成为子类型关系的最大元素的规则。

Top (S-TOP)

形式上，子类型关系是在我们给出的规则下最小闭合的关系。为了便于参考，图15-1、图15-2和图15-3概括了带有records和子类型的简单类型lambda演算的完整定义，突出了我们在本章中添加的语法形式和规则。注意，自反性和传递性规则的存在意味着子类型关系显然是一个前序;然而，由于记录置换规则，它不是偏序：存在许多不同类型对，其中每一类型是另一类型的子类型。

为了完成子类型关系的讨论，我们现在验证一下本章开头的示例。使用以下缩写以避免超出页面边缘。

Nat Rxy Nat, Nat

在此再定义一下通常的数值常量的类型规则，我们可以构造类型语句⊢ fxy : Nat的派生如下：

下图是未引入子类型时的简单类型的λ演算：

该图则是引入子类型后的λ演算：

三、子类型和类型的属性

在确定了具有子类型的lambda演算的定义之后，我们现在要做一些工作来验证它是否是有意义的，特别简单类型的lambda演算的定理在存在子类型的情况下仍然成立。

之前我门所学习的都是很正常的条件推结论格式。而子类型关系反演这部分呢，就是告诉我们，在结论满足的条件下，条件也是成立的。

3.1

我们从records子类型关系的一个关键性质开始，对在简单类型的λ演算中类型关系的反演引理进行模拟。如果我们知道某个S是一个arrow类型的子类型,子类型化反演引理告诉我们,S本身必须是一个arrow类型;此外,它告诉我们,箭头的左边必须(逆变)相关,右边必须(协变)。

3.2 引理【子类型关系的反转】

如果S :< T1->T2，并且T1 <: S1 、 S2 <: T2，那么S是S1类型到S2类型的函数，即S1->S2。
如果 , 并且 -i.e., 、对每一个， ,那么有如下形式。

3.3 引理

如果 , 那么并且 .
如果 , 那么并且 : 对每一个都满足。

接下来，我们需要一个类型关系的替换引理。这个引理的陈述与简单类型的lambda演算并没有变化，并且他们的证明几乎是相同的。

3.4 引理【替换】

如果并且 , 那么。

保持理论的陈述和以前一样。然而，它的证明由于在几个点上进行了子类型化而变得有些复杂。

3.5 引理【保持】

如果并且 , 那么。

证明：类型推导的直接归纳法。大多数情况下类似的证明与简单类型的λ演算是相同的，为了证明records类型和包容引理，我们还需要引入一些新的例子。

Case T-VAR:

不可能发生（变量没有求值规则）。

Case

不可能发生（t已经是值）。

Case -APP:

从E-App1, E-App2, and E-AppAbs，我们可以推出t->t'。

Subcase E-APP1:

这个结果是根据诱导假说和T-App得出的。

Subcase E-APP2:
Subcase E-AppABS:

根据引理15.3.3（1），我们可以得知，并且。通过。通过上述和包容引理，我们可以得知。

Case T-RCD: for each

左侧为records类型的唯一求值规则是E-Rcd。从这一规则的前提出发，我们可以看到对于每一个，。这一结果来自归纳假说（应用于相应的假设）以及T-RCD。

Case T-PROJ:

可以被E-Proj和E-ProjRcd推导出来。

Subcase E-ProJ:

这一结论是由诱导假说和T-Proj推导出来的。

Subcase E-PROJRCD:

根据引理15.3.3（2），我们得知并且对每个 . In 总的来说就是, 。

Case -Sub:

由归纳假说， S。通过 T-SUB, 。

为了证明类型良好的术语不会被卡住，我们从标准型引理开始，它会告诉我们属于函数和records类型的值的可能样子。

3.6 引理【标准形式】

如果是一个类型的固定值, 那么用有如下形式：。
如果是类型的固定值, 那么拥有如下形式 , 。

进展定理及其证明非常接近于我们在简单类型lambda演算中看到的。处理子类型的大部分负担已经被推到了规范形式引理中，这里只需要做一些小的修改。

3.7 定理【进展】

如果是一个固定的，类型良好的项, 那么要么是一个值，要么有一个，。

证明：通过类型推导的直接归纳法。变量case不能出现（因为t是封闭的）。λ抽象的情况是直接的，因为抽象是值。剩下的案例更有趣。

Case T-App:

根据归纳假设，要么是一个值，要么可以进行一步评价; 也是如此。如果可以进行进一步操作，则规则E-App1将会应用于t。如果是一个值，并且可以进行进一步操作，则应用规则E-App2。最后，如果和都是值，则规范型引理 (15.3.6) 告诉我们拥有的形式, 因此规则 -APPABS 适用于。

Case T-RcD: for each

通过归纳假设，每个要么已经是一个值，要么可以进行一步评估。如果它们都是值，那么t是值。另一方面，如果至少有一个可以继续往下操作，那么规则E-Rcd就适用于t。

Case T-ProJ:

通过归纳假设，每个要么已经是一个值，要么可以进行一步评估。如果可以进行一步评估，那么（由E-Proj）t也可以。如果是一个值, 那么由标准形引理 (15.3.6), 拥有的形式, 并且 , 对每个，。尤其, 是在的标签内, 根据该规则E-ProjRcd告诉我们测试本身可以采取评估步骤。

Case -Sub:

这个结果直接来自归纳假说。

四、Top和Bottom类型

Top不是具有子类型的简单类型λ演算的必要部分;可以在不损害系统性能的情况下将其除去。但是，出于许多原因，大多数语言都包含了Top。首先，它对应于大多数面向对象语言中的Object类型。第二，Top是一个方便的技术设备，在更复杂的系统中结合了子分型和参数多态性。例如，在系统（第26章和第28章），Top的存在允许我们从有界量化中恢复普通的无界量化，简化了系统。实际上，在系统中，records也可以被编码，这样进一步简化演示文稿（至少为了正式学习的目的），该编码关键地依赖于Top。最后，由于Top的行为是直接的，并且在示例中经常是有用的，所以没有什么理由不保留它。

我们很自然地会问，我们是否也可以用一个最小的元素来完成子类型关系呢？因此我们就定义了一个Bot，它是每个类型的子类型。

Bot

Bot <: T

首先要注意的是Bot是空的，没有Bot类型的封闭值。如果有的话，就说v，那么包含规则加上S-Bot将允许我们导出 v : Top Tор，由此，规范型引理（15.3.6，在推广下仍然成立）告诉我们，对于某些S1和t2，v必须具有形式。另一方面，通过包含，我们同样可以得到 ,由此规范形式引理告诉我们v一定是records类型。但我们又规定了v不能同时既是函数又是records，因此假设 : Bot把我们引向了一个矛盾。

Bot的空虚并不使它无用。相反地，Bot提供了一种非常方便的方式来表示某些操作（特别是引发异常或调用延续）不打算返回的情况。为此类表达式指定Bot类型具有两个良好的效果：首先，它向程序员发出信号，表示不期望有结果（因为如果表达式确实返回了结果，它将是Bot类型的值）;其次，它向类型检查器发出信号，表明这样的表达式可以安全地用于期望任何类型值的上下文中。例如，如果第14章中的异常引发术语error被指定为Bot类型，则：

.

if check that is reasonable then

compute result>

else

error

可以被很好的定义，因为无论正规结果的类型是什么，通过包含，项error总是可以被赋予相同的类型，因此if的两个分支是兼容的。

不幸的是，Bot的存在使为系统构建类型检查器的问题变得非常复杂。对于具有子类型的语言，一个简单的类型检查算法需要依赖于这样的推论：“如果应用程序是良好类型的，那么必须具有arrow类型。”在存在Bot的情况下，我们必须将其改进为“如果是良好类型化的，则必须具有arrow类型或Bot类型”,这一点将在16.4节中进行扩展。

这些复杂性表明添加Bot比添加Top更重要。

五、子类型及其他功能

当我们用子类型将简单的演算扩展为成熟的编程语言时，必须仔细检查每个新功能，以了解它如何与子类型化交互。在本节中,我们将考虑我们看到的一些特性。后面的章节将讨论子类型化和特性之间的交互作用，比如参数多态（第26和28章）、递归类型（第20和21章）和类型运算符（第31章）。

5.1 归属和转换

在11.4节中，我们引入了归属运算符t as T，作为一种检查文档的形式，允许程序员在程序文本中记录断言，即复杂表达式的某个子项具有某种特定类型。在我们所举的例子中，属性也被用来控制类型的打印方式，迫使类型检查器使用更可读的缩写形式，而不是它实际计算的类型。

在Java和C++等具有子类型的语言中，归属变得更加有趣。在这些语言中，它通常被称为强制转换，并被写成（T）t。实际上有两种完全不同的强制转换形式：被称为向上强制转换和向下强制转换。前者直截了当，后者涉及动态类型测试。

向上转换是标准归属运算符的实例，在向上转换中，术语被赋予类型检查器自然分配给它的类型的超类型。我们给出一个项t和一个类型T，我们打算在它上面“看”t。类型检查器通过尝试使用t的“自然”类型、包含规则T-Sub和11.4中的归属规则来构建一个派生来验证T确实是t的类型之一：

as

(T-Ascribe)

向上转换可以被看作是一种抽象形式，是一种隐藏值的某些部分的存在的方式，这样它们就不能在周围的上下文中使用。例如，如果t是一个records（或者更一般地说，是一个对象），那么我们可以使用上转换来隐藏它的一些字段（方法）。

另一方面，向下转换允许我们将类型赋值给类型检查器不能静态派生的项。为了允许向下强制类型转换，我们对as输入规则做了一个有点令人惊讶的更改：

(T-Downcast)

也就是说，我们检查是否是类型良好的（即，它是类型S），然后指定它为类型T，而S和T之间不做任何的要求。例如，我们可以写一个函数f，它接受任何参数，将其向下转换为一个records，该记录的a字段包含一个数字，然后返回这个数字：

Top as

当然,盲目信任这样的断言将产生灾难性的影响。如果程序员犯了个错,f适用于不包含任何字段的records,结果可能(取决于编译器的细节)是完全任意的!相反，我们的座右铭应该是“信任，但要核实”。在编译时，类型检查器只接受向下转换中给定的类型。

as (E-Ascribe)

(E-Downcast)

例如，如果我们将上面的函数f应用于参数{a=5，b=true}，那么这个规则将（成功地）检查出{a=5，b=true}：{a：Nat}。另一方面，如果我们将f应用于{b=true}，则E-Downcast规则将不适用，并且求值将在这一点上停滞。

当然，我们会失去进度，因为一个类型良好的程序肯定会因为试图计算一个坏的向下转换而被卡住。提供向下转换的语言通常会以下列两种方式之一来解决这个问题：通过使失败的向下强制转换引发可由程序捕获和处理的动态异常，或者用动态类型测试的形式替换向下转换操作符：

(T-TYPETEST)

(E-TYPETEST1)

在Java等语言中，向下强制转换的使用实际上相当普遍。例如，“集合类”（如Set和List）在Java中是单态的：Java不是为每个类型T提供类型List T（包含类型T的元素的列表），而是仅提供List，即其元素属于最大类型Object的列表的类型。由于Object是Java中所有其他类型对象的超类型，这意味着列表实际上可以包含任何内容：当我们想向列表中添加一个元素时，我们只需要使用包含将其类型提升为Object即可。然而，当我们从列表中取出一个元素时，类型检查器所知道的只是它的类型是Object。这种类型不保证调用对象的大多数方法，因为Object类型只提到了一些非常通用的打印方法，这些方法由所有Java对象共享。为了对它进行处理，我们必须首先将它向下转换为某个预期的类型T。

向下强制转换在Java的反射功能中也扮演着重要的角色。使用反射，程序员可以告诉Java运行时系统动态加载字节码文件，并创建它所包含的某个类的实例。显然，类型检查器无法静态地预测此时将要加载的类的形式（例如，字节码文件可以根据需要从网络上获得），因此它所能做的最好的事情是将最大类型Object分配给新创建的实例。同样，为了做任何有用的事情，我们必须将新对象向下转换为某个预期的类型T，处理运行时异常（如果字节码文件提供的类实际上与该类型不匹配），然后继续将其与类型T一起使用。

在结束向下转换的讨论之前，需要注意一下实现。从我们给出的规则来看，在一种语言中包含向下强制转换似乎涉及到在运行时系统中添加所有类型检查的机制。更糟糕的是，由于值在运行时的表示方式通常与在编译器内部的表示方式不同（特别是，函数被编译成字节码或本地机器指令），因此我们似乎需要编写一个不同的类型检查器来计算动态检查所需的类型。为了避免这一点，真实的的语言将向下转换与类型标记结合起来--单个单词标记（在某些方面类似于ML的数据类型构造函数和11.10节中的变体标记），它捕获编译时类型的运行时“残留”，并足以执行动态子类型测试。

5.2 变体

变体的子类型规则与records的基本相同;唯一的区别是宽度规则S-VariantWidth允许在从子类型移动到父类型时添加而不是丢弃新的变体。单例变量类型l1:T1精确地告诉我们它的元素用什么标签来标记;一个两变量类型〈l1:T1，l2:T2〉告诉我们它的元素要么有标签l1要么有标签l2等等。相反，当我们使用变量值时，它总是在case语句的上下文中，对于类型列出的每个变量，它必须有一个分支列出更多的变量,意味着强制case语句包括一些不必要的额外分支。然后，我们可以使用包含加上S-VariantWidth来获得任何更大的变体类型。

(T-VARIANT)

(S-VARIANTWIDTH)

(S-VariantDepth)

(S-VariantPerm)

5.3 Lists

我们已经看到了一些协变类型构造函数的例子（记录和变量，以及函数类型，在它们的右边）和一个逆变构造函数（箭头，在左边）。List构造函数也是协变的：如果我们有一个列表，其元素具有类型S1，并且S1〈：T1，那么我们可以安全地认为我们的列表具有T1类型的元素。

(S-List)

5.4 References

并非所有类型构造函数都是协变或逆变的。例如，Ref建构函式必须视为不变量，才能保留类型安全。

(S-Ref)

要使Ref S1成为Ref T1的子类型，我们要求S1和T1在子类型关系下是等价的，即每个都是另一个的子类型。这使我们能够灵活地对Ref构造函数下的记录字段进行重新排序，例如 Bool, b:Nat Nat, a:Boo1 ，但仅此而已。

这个非常严格的子类型化规则的原因是，类型Ref T1的值可以在给定上下文中以两种不同的方式使用：对于两个读数（!）和书写（：=）。当它用于阅读时，上下文期望获得T1类型的值，因此如果引用实际上产生S1类型的值，那么我们需要S1〈：T1以避免违反上下文的期望。另一方面，如果相同的参考单元用于写入，则由上下文提供的新值将具有类型T1。

5.5 Arrays

显然，引用的不变子类型规则背后的动机也适用于数组，因为数组上的操作包括解引用和赋值两种形式。

(S-Array)

有趣的是，Java实际上允许数组的协变子类型：

(S-ArrayJava)

这个特性最初是为了弥补在一些基本操作（如复制数组的一部分）的类型化中缺少参数多态性而引入的，但现在通常被认为是语言设计中的一个缺陷，因为它严重影响了涉及数组的程序的性能。原因在于，不健全的子类型规则必须通过对任何数组的每次赋值进行运行时检查来弥补，以确保写入的值属于数组元素的实际类型。

5.6 References Again

直观地，Source T被认为是从单元读取类型T的值的能力（但不允许赋值），而Sink T是向单元写入的能力。Ref T是这两种功能的组合，提供读取和写入权限。

(T-Deref)

(T-Assign)

现在，如果我们只有从单元格读取值的能力，并且如果这些值保证具有类型S1，那么只要S1是T1的子类型，就可以安全地将其“降级”为读取类型T1的值的能力。也就是说，Source构造函数是协变的。

(S-Source)

相反，将类型S1的值写入给定单元的能力可降级到写入某一较小类型T1的值的能力：Sink构造函数是逆变的。

(S-Sink)

最后，我们通过两个子类型化规则来表达Ref T1是读和写能力的组合的直觉，这两个子类型化规则允许Ref降级为Source或Sink。

: Source (S-RefSource)

Sink (S-RefSink)

5.7 Channels

关键的观察结果是，从子类型的角度来看，通信信道的行为与参考细胞完全相同：它既可以用于读，也可以用于写。由于很难静态地确定哪些读操作对应于哪些写操作，因此确保类型安全的唯一简单方法是要求沿着通道传递的所有值必须属于同一类型。现在，如果我们只传递给某人写入给定通道的能力，那么他们可以安全地将此能力传递给承诺写入较小类型值的其他人，“输出通道”类型构造函数是逆变的。类似地，如果我们只传递从通道读取的功能，则此功能可以安全地降级为阅读任何更大类型的值的功能，“输入通道”构造函数是协变的。

5.8 基础类型

在具有丰富的基本类型集的成熟语言中，在这些类型之间引入原语子类型关系通常是很方便的。例如，在许多语言中，布尔值true和false实际上是由数字1和0表示的。如果愿意，我们可以通过引入一个子类型公理Bool<：Nat。现在我们可以写出像5*B这样的简洁表达式，而不是if b then 5 else 0。

六、子类型的强制语义

在本章中，我们的直觉是子类型化“在语义上是无关紧要的”。子类型化的存在不会改变程序求值的方式;相反，子类型化只是在键入术语时获得额外灵活性的一种方式。这种解释简单而自然，但它会带来一些性能损失（特别是对于数值计算和访问records字段），这在高性能实现中可能是不可接受的。我们在这里描述了一个替代的强制语义，并讨论了它反过来提出的一些新问题。

6.1 子集语义的问题

正如我们在15.5节中看到的，允许在不同的基类型之间进行子类型化是很方便的。但是，基类型之间的一些“直观合理”的包含可能会对性能产生不利影响。例如，假设我们引入公理Int<:Float，这样就可以在浮点计算中使用整数了，而无需编写显式强制。例如，允许我们编写4.5 + 6，而不是4.5 + intToFloat（6）。在子集语义下，这意味着整数值集必须是浮点值集的子集。但是，在大多数真实的机器上，整数和浮点的具体表示完全不同：整数通常以二进制补码的形式表示，而浮点数则分为尾数、指数和符号，以及一些特殊情况，如NaN（非数字）。

为了协调这些表示法的差异和子类型的子集语义，我们可以采用一种常见的数字标记（或框）表示法：整数被表示为机器整数加上标记（在单独的头字中或者在与实际整数相同的字的高阶位中），而浮点被表示为机器浮点加上不同的标记。然后类型Float引用整个带标记的数字集（float和int），而Int只引用带标记的ints。

这个方案并不是不合理的：它对应于在许多现代语言实现中实际使用的表示策略，其中也需要标记位（或字）来支持垃圾收集。缺点是，对数字的每个原始操作实际上都必须实现为对参数的标记检查、几条对原始数字进行拆箱的指令、一条用于实际操作的指令以及几条对结果进行重新装箱的指令。聪明的编译器优化可以消除一些这种开销，但是，即使使用当前可用的最佳技术，它也会显著降低性能，尤其是在大量数字代码（如图形和科学计算）中。当记录与子类型化（特别是与排列规则）结合时，会出现不同的性能问题。我们的域投射的简单评估规则可以读作“在记录的标签中搜索，并产生关联值 ”。

(E-ProjRcd)

但是，在真实的实现中，我们当然不希望在运行时通过记录的字段执行线性搜索来找到所需的标签。在没有子类型的语言中（或者有子类型但没有置换规则），我们可以做得更好：如果标签在记录类型中出现在第三位，则我们静态地知道，具有该类型的所有运行时值都将作为它们的第三个字段，所以在运行时，我们根本不需要查看标签（事实上，我们可以从运行时表示中完全忽略它们，从而有效地将记录编译成元组）。为了获得字段的值，我们通过指向记录开头的寄存器生成间接加载，偏移量为3个字。置换规则的存在阻碍了这种技术，因为知道某个记录值属于其中作为第三个字段出现的类型，现在根本没有告诉我们关于字段实际存储在记录中的位置。同样，巧妙的优化和运行时技巧可以缓解此问题，但一般而言，字段投影可能需要在运行时进行某种形式的搜索。

6.2 强制语义

我们可以通过采用不同的语义来解决这两个问题，在这种语义中，我们通过用运行时强制替换子类型来“编译掉”子类型。例如，如果在类型检查过程中将Int提升为Float，那么在运行时，我们将该数字的表示形式从机器整数物理地更改为机器浮点数。类似地，记录排列子类型规则的使用将被编译成一段代码，该代码按字面意义重新排列字段的顺序。基元数值操作和字段访问现在可以继续进行，而无需取消装箱或搜索的开销。

直观地，具有子类型的语言的强制语义被表示为将术语从该语言转换为不具有子类型的较低级别语言的函数。最终，低级语言可能是一些具体处理器的机器代码。然而，为了说明目的，我们可以将讨论保持在更抽象的水平上。对于源语言，我们选择一个我们一直使用的简单类型与子类型化演算和记录。对于低级目标语言，我们选择带有记录和Unit类型的纯简单类型lambda演算。

从形式上讲，编译由三个转换函数组成-一个用于类型转换，一个用于子类型转换，一个用于类型转换。对于类型，转换仅将Top替换为Unit。我们将此函数写为[[-]]。

为了翻译一个项，我们需要知道在类型检查中包含使用的位置，因为这些位置是运行时强制插入的位置。形式化这种观察的一种方便的方法是将翻译作为键入语句的派生的函数给出。类似地，要生成将类型S的值转换为类型T的强制函数，我们不仅需要知道S是T的子类型，还需要知道为什么。我们通过从子类型派生生成强制子来实现这一点。

需要一些命名派生的符号来使翻译形式化。写入表示 " 是一个子类型派生树，其结论是 T"，类似地 T 表示 " 是一个类型化推导，其结论是 "

让我们首先看一下函数，对于子类型关系式S<:T，给出一个衍生C，生成强制[[C]]。这种强制只不过是一个从类型[[S]]到类型[[T]]的函数。C语言中使用的最后一条规则是按情况定义的。

6.2.1 引理

证明：C语言上的直接归纳法。

类型化派生以类似的方式进行翻译。如果是的衍生, 那么它的转换 [[D]]是一个类型为[[T]]的目标语言项。这种翻译功能通常被称为宾夕法尼亚翻译，以宾夕法尼亚大学的研究小组的名字命名。

6.2.2 引理

如果 , 那么[[ ]] [[ ]]:[[ ]] , 其中么[[ ]]是类型转换到上下文的逐点扩展：[[ ]] 并且[[ ]]=[[ ]]，x:[[T]]。

在定义这些转换后，我们可以删除具有子类型的高级语言的求值规则，然后通过对项进行类型检查（使用高级类型化和子类型化规则）来评估项，将他们的类型翻译成低级目标语言，然后利用该语言的评价关系得到它们的运算行为。这种策略实际上用于一些具有子类型的语言的高性能实现中，例如耶鲁编译器组的实验性Java编译器。

6.3 一致性

当我们为具有子类型的语言给予强制语义时，有一个我们需要小心避免的潜在陷阱。例如，假设我们用基本类型Int、Bool、Float和String扩展了当前的语言。下列基本胁迫型转可能都很有用：

函数intToString和floatToString是构造数字的字符串表示形式的基元。为了便于示例，假设intToString（1）=“1”，而floatToString（1.0）=“1.000”。

现在,假设我们被要求使用强制语义评估项： String. true;这个项是可类型化的，给定了上面的基本类型公理。事实上,它是两个不同方面的可类型化:我们可以用包容来促进Bool、Int和字符串,表明真正的是一个适当的参数类型String→String的函数,或者我们可以把Bool变成Float，然后再变为String。但是如果我们将这些派生转化为λ→,我们得到了不同的行为。

如果我们强制将true转为Int类型,那么我们会得到1,intToString则会得到字符串“1”。但是如果我们先将true转为Float类型,然后再通过floatToString，则会得到字符串“1.000”。但是“1”和“1.000”是非常不同的字符串：它们甚至不具有相同的长度。换句话说，如何证明（λx：String.x）true：String影响翻译后的程序的行为方式！但是这种选择完全是编译器内部的程序员只写术语，不写派生，所以我们设计了一种语言，在这种语言中，程序员不能控制甚至不能预测他们所写程序的行为。

对这些问题的适当反应是对翻译功能的定义提出一个额外的要求，称为连贯性。

定义：从一种语言中的类型化导子到另一种语言中的术语的转换[[-]]是连贯的，对于具有相同结论的每对导子D1和D2，译文[[D1]]和[[D2]]是目标语言的行为等效术语。

特别是，上面给出的翻译（没有基本类型）是一致的。

当我们考虑基本类型时恢复一致性时（使用上面的公理），改变floatToString原语的定义使得floatToString（0.0）=“0”和floatToString（1.0）=“1”就足够了。证明一致性，特别是对于更复杂的语言，可能是一件棘手的事情。

七、交集和并集类型

通过向类型语言添加交集运算符，可以获得子类型关系的强大细化。T1 ∧ T2意味着T1和T2的交集，其元素既属于T1，又属于T2。

还有一个规则允许交叉点和箭头类型之间的自然交互。

(S-Inter4)

允许交集和箭头类型之间的自然交互这个规则背后的直觉是，如果我们知道一个项具有函数类型S→T1和S→T2，那么我们肯定可以传递给它一个S，并期望得到T1和T2。

另外，交集类型的另一更实用表现是他们支持的有限性的重载形式。例如,我们可能会指定类型(Nat→Nat→Nat)∧(Float→Float→Float)的加法操作符可以用自然数和浮点数。

此外，并集T1∨T2,也是非常有用的。不像求和和变体类型，T1 ∨ T2表示属于T1的值的集合和属于T2的值的集合的普通并集。因此,Nat∨Nat是Nat的另一个名称而已。

不相交和非不相交联合类型之间的主要形式差异是后者缺少任何类型的格构造：如果我们只知道一个值v具有类型T1 ∨ T2，那么我们能够对v安全地执行的唯一操作是对T1和T2都有意义的操作。C语言中未标记的联合类型是违反类型安全的根源，允许对T1 ∨ T2的元素进行对T1或T2有意义的任何操作。

八、总结

处理记录的类型化规则，尤其是子类型化规则，比我们所看到的大多数其他规则都要复杂一些，它们要么涉及可变数量的前提（每个字段一个），要么涉及附加机制，如字段索引的排列。还有许多其他的方式写这些规则,但所有其他方式都逃不掉类似的复杂性或避免它通过引入非正式的约定。这些操作的输入规则相当微妙,特别是参数多态性的存在,所以大多数语言设计者倾向于坚持普通记录。