控制流程

控制流程(也称为流程控制)是电脑运算领域的用语,意指在程序执行时,个别的指令(或是陈述子程序执行英语Execution (computing)或求值的顺序。不论是在宣告式编程语言或是函数编程语言中,都有类似的概念。

在宣告式的编程语言中,流程控制指令是指会改变程序执行顺序的指令,可能是执行不同位置的指令,或是在二段(或多段)程序中选择一个执行。

不同的编程语言所提供的流程控制指令也会随之不同,但一般可以分为以下四种:

  • 继续执行位在不同位置的一段指令(无条件分支指令)。
  • 若特定条件成立时,执行一段指令,例如C语言的switch指令,是一种有条件分支指令。
  • 执行一段指令若干次,直到特定条件成立为止,例如C语言的for指令,仍然可视为一种有条件分支指令。
  • 执行位在不同位置的一段指令,但完成后会继续执行原来要执行的指令,包括子程序协程(coroutine)及续体(continuation)。
  • 停止程序,不执行任何指令(无条件的终止)。

中断以及Unix系统中的信号等较低端的机制也可以造成类似子程序的效果,不过通常这类机制会用来回应外部的事件或是输入。程序自修改因为其对代码的影响,也会影响控制流程,但多半不会有明显的流程控制指令。

机器语言汇编语言中,流程控制是借由修改程序计数器数值来达到。一些中央处理器只支持条件分支(branch)或是无条件分支(有时会称为jump)。

基本概念

标记

标记是一个标示在源代码固定位置中的名称或数字,其他位置的流程控制指令可以参考标记的位置,执行标记位置所对应的程序。标记本身不影响程序的进行,除了标示位置外,对程序执行没有其他的作用。

有一些编程语言(像FortranBASIC等)利用行号作为标记。行号是标示在每一行程序最前面的自然数,不一定要是连续的数字,在不受流程控制指令影响的情形下,程序会从最小的行号依序执行,而流程控制指令需指定对应的行号。以下是一个BASIC的例子:

10 LET X = 3
20 PRINT "*"
30 LET X = X - 1
40 IF X > 0 THEN GOTO 20
50 END

在像是CAda等编程语言中,标记是一个标识符,一般出现在一行的最前面,后面会加一个冒号作为识别,以下是C语言的例子:

Success: printf ("The operation was successful.\n");

ALGOL 60语言同时支持整数(类似行号)及标识符的标记(二者后面都要加上冒号),不过其他Algol语言几乎都不支持整数的标记。

Goto

goto 指令(来自英文goto的组合)是无条件流程控制指令中最基本的型式。一般在程序中会用以下的方式出现(指令大小写可能会依编程语言而不同)

   goto label

goto 指令的效果是调整程序的控制流程,后续就执行标记位置的程序。

goto 指令是许多的计算机科学家视为有害的指令,像荷兰计算机科学家艾兹格·迪科斯彻(Edsger Wybe Dijkstra)就提出了goto有害论[1]

子程序

子程序(subroutine)可以用许多不同的术语来表示,例如程序、函数(尤其是有传回值时)或是方法(特别是子程序属于一个的一部分)等。

子程序是是完成一项特定工作的代码序列,其他程序可以将流程移转到子程序中,执行特定工作后再回到原来的程序,若程序中有许多部分都需要执行一特定工作,利用子程序的方式可以利用一段程序达到上述的功能,可以减少代码的长度。

如今子程序也常用来使得程序更加的结构化,例如可以将一些特殊的算法或特殊的资料访问方式放在子程序中,和其他代码隔离。子程序也是程序模块的一种,若许多程序员共同开发一个程序,子程序也有助于其工作的分割及分工。

最简结构化控制流程

1966年5月Corrado Böhm及Giuseppe Jacopini在《Communications of the ACM》期刊发表论文[2],说明任何一个有goto指令的程序,可以改为完全不使用goto指令的程序,goto指令可以用选择指令(IF THEN ELSE)及循环(WHILE 特定条件 DO 特定程序)取代,可能会再多一些重复的代码及额外的布尔变量。后来的研究者已证明选择指令也可以用循环取代,不过需要更多的布尔变量。Böhm及Jacopini的论文说明程序可以完全不使用goto,但是在实务上大家不一定会想要这么进行。

其他的研究说明若控制结构只有一个进入点(entry)及一个结束点(exit),这样的程序会比其他型式的程序容易理解。因此这样的程序可以像一个指令一样放在程序的任何部分,不必担心会破坏其结构,换句话说,这种程序是“可组成的”(composable)。

常用的控制结构

若一编程语言支持控制结构,控制结构开始时多半都会有特定的关键字,以标明是使用哪一种控制结构。但只有部分编程语言在控制结构结束时会有特定的关键字表示结束,因此可以依控制结构结束时是否有特定关键字来将编程语言分为二类。

  • 没有特定关键字的语言:ALGOL 60CC++HaskellJavaPascalPerlPHPPL/IPythonWindows PowerShell。这类语言需要有关键字可以将group程序指令together:
    • ALGOL 60及 Pascal:begin ... end
    • C, C++, Java, Perl, PHP, and PowerShell:利用大括号{ ... }
    • PL/1:DO ... END
    • Python:利用缩进的层次,详细内容请参考Off-side规则
    • Haskell:可以利用缩进或大括号,两者可以混用
  • 有特定关键字的语言:AdaALGOL 68Modula-2Fortran 77Visual Basic,使用的特定关键字依编程语言而不同:
    • Ada: 其关键字为 end + space + 启始控制结构的关键字,如if ... end if, loop ... end loop
    • ALGOL 68, Bourne shell, Mythryl:将启始关键字反写,如if ... fi, case ... esac
    • Fortran 77: 其关键字为 end + initial keyword,如IF ... ENDIF, DO ... ENDDO
    • Modula-2: 不论何种控制结构,其关键字均为END
    • Visual Basic: 每种控制结构均有各自的结尾关键字,如If ... End If; For ... Next; Do ... Loop
  • 没有任何特征的语言:logo

条件判断

条件判断是依指定变量或表达式的结果,决定后续执行的程序,最常用的是if-else指令,可以根据指定条件是否成立,决定后续的程序。也可以组合多个if-else指令,进行较复杂的条件判断。 许多编程语言也提供多选一的条件判断,例如C语言的switch-case指令。[3]

循环

循环是指一段在程序中只出现一次,但可能会连续执行多次的代码。常见的循环可以分为二种,指定执行次数的循环(如C语言的for循环)以及指定继续执行条件(或停止条件)的循环(如C语言的while循环)。

在一些函数编程语言(例如HaskellScheme)中会使用递归不动点组合子来达到循环的效果,其中尾部递归是一种特别的递归,很容易转换为迭代。

结构化的非区部控制流程

有些编程语言会提供非区部的控制流程(non-local control flow),会允许流程跳出目前的代码,进入一段事先指定的代码。常用的结构化非区部控制流程可分为条件处理异常处理续体(Continuation)三种。

条件处理

PL/I编程语言中有22种标准的条件(如 ZERODIVIDE SUBSCRIPTRANGE ENDFILE),可以在程序中设置,当特定条件成立时需进行的指令,程序设计者也可以定义自己的条件,并在程序中使用。

条件成立时,只能设置一个需进行的指令(类似未结构化的if指令),大部分的应用中,都会指定执行goto指令,跳到其他代码执行对应的流程。

不过因为有些条件处理的实现会增加许多代码及执行时间(特别SUBSCRIPTRANGE),所以许多程序设计者会尽量不使用条件处理。

条件处理的语法如下:

 ON 條件 GOTO label

异常处理

有些编程语言可提供不需要使用GOTO的结构化异常处理程序:

try {
    xxx1                                  // Somewhere in here
    xxx2                                  //     use: '''throw''' someValue;
    xxx3
} catch (someClass& someId) {             // catch value of someClass
    actionForSomeClass 
} catch (someType& anotherId) {           // catch value of someType
    actionForSomeType
} catch (...) {                           // catch anything not already caught
    actionForAnythingElse
}

try{...}的区块中,若有异常情形时,程序就会离开try的区块,由后续的一个或多个catch子句判断需执行何种异常处理。在D、Java、C#及Python编程语言中,try{...}区块中还可以加入一个finally子句,不管程序流程是否离开try{...}区块,finally子句中的程序都一定会执行,常用在当程序结束处理时,需要放弃一些外部资源(文件或数据库链接)的情形下:

FileStream stm = null;                    // C# example
try {
    stm = new FileStream ("logfile.txt", FileMode.Create);
    return ProcessStuff(stm);             // may throw an exception
} finally {
    if (stm != null)
        stm. Close();
}

由于上述情形相当普遍,C#提供一种特殊的语法进行相同的处理:

using (FileStream stm = new FileStream ("logfile.txt", FileMode.Create)) {
    return ProcessStuff(stm);             // may throw an exception
}

只要离开 using区块,编译器会自动释放stm对象,Python的 with指令及也有类似的功能。

这些语言都有定义标准的异常情形及其出现的条件,程序设计者也可以丢出自己产生的异常(其实C++及Python的throw和catch支持绝大多数形态的对象)。

若某一个throw指令找不到对应的catch,控制流程会离开目前的副程序或控制结构,设法找到对应的catch,若到主程序的结尾还是找不到对应的catch,程序会强制结束,并显示适当的错误消息。

AppleScript脚本语言可以将"try"区块分为几个部分,提供不同的消息及异常:

try
    set myNumber to myNumber / 0

on error e  number n  from f  to t  partial result pr

    if ( e = "Can't divide by zero" ) then display dialog "You idiot!"

end try

续体

续体(Continuation)实化了延续性,它可以将目前子程序的执行状态(包括目前的堆栈,区部变量及执行到的位置)存储成一个对象,后续在其他子程序中可以利用此对象回到此子程序现在的执行状态。

续体一词也可以指第一类续体(first-class continuation),是指编程语言可以在任意时间点存储目前的执行状态,并在之后回到之前存储的执行状态。

程序需要分配空间给子程序用到的区域变量,而且在子程序结束时需发布这些变量用到的空间。许多编程语言利用调用堆栈来存放这些变量,可以简单快速的分配及发布空间。也有一些编程语言使用动态存储器分配来存储变量,可以较灵活的分配变量,但分配及发布空间较不方便。这二个架构下续体的处理方式也会不同,各有其优点及缺点。

Scheme语言利用call-with-current-continuation函数(缩写为call/cc) 可提供续体功能。

参考资料

  1. ^ Edsger Dijkstra. Go To Statement Considered Harmful (PDF). Communications of the ACM. March 1968, 11 (3): 147–148 [2011-02-23]. doi:10.1145/362929.362947. (原始内容存档 (PDF)于2014-05-13). 
  2. ^ Böhm, Jacopini. "Flow diagrams, turing machines and languages with only two formation rules" Comm. ACM, 9(5):366-371, May 1966.
  3. ^ 施威铭. TURBO C語言實務. 台北: 旗标出版社. 79: p274. ISBN 957717017X. 

相关条目