C++编程中的数据类型和常量学习教程

C++数据类型
计算机处理的对象是数据，而数据是以某种特定的形式存在的（例如整数、浮点数、字符等形式）。不同的数据之间往往还存在某些联系（例如由若干个整数组成一个整数数组）。数据结构指的是数据的组织形式。例如，数组就是一种数据结构。不同的计算机语言所允许使用的数据结构是不同的。处理同一类问题，如果数据结构不同，算法也会不同。例如，对10个整数排序和对包含10个元素的整型数组排序的算法是不同的。

C++的数据包括常量与变量，常量与变量都具有类型。由以上这些数据类型还可以构成更复杂的数据结构。例如利用指针和结构体类型可以构成表、树、栈等复杂的数据结构。

C++并没有统一规定各类数据的精度、数值范围和在内存中所占的字节数，各C++编译系统根据自己的情况作出安排。表2.1列出了Visual C++数值型和字符型数据的情况。

几点说明：
1) 整型数据分为长整型(long int)、一般整型(int)和短整型(short int)。在int前面加long和short分别表示长整型和短整型。

2) 整型数据的存储方式为按二进制数形式存储，例如十进制整数85的二进制形式为1010101，则在内存中的存储形式如下图所示。

3) 在整型符号int和字符型符号char的前面，可以加修饰符signed（表示“有符号”）或unsigned（表示“无符号”）。如果指定为signed，则数值以补码形式存放，存储单元中的最高位(bit)用来表示数值的符号。如果指定为unsigned，则数值没有符号，全部二进制位都用来表示数值本身。例如短整型数据占两个字节，

有符号时，能存储的最大值为215-1，即32767，最小值为-32768。无符号时，能存储的最大值为216-1，即65535，最小值为0。有些数据是没有负值的，可以使用unsigned，它存储正数的范围比用signed时要大一倍。

4) 浮点型(又称实型)数据分为单精度(float)、双精度(double)和长双精度(long double)3种，在Visual C++ 6.0中，对float提供6位有效数字，对double提供15位有效数字，并且float和double的数值范围不同。对float分配4个字节，对double和long double分配8个字节。

5) 表中类型标识符一栏中，方括号[ ]包含的部分可以省写，如short和short int等效，unsigned int和unsigned等效。

常量的值是不能改变的，一般从其字面形式即可判别是否为常量。常量包括两大类，即数值型常量(即常数)和字符型常量。如12, 0, -3为整型常量，4.6, -1.23为实型常量，包含在两个单撇号之间的字符为字符常量，如′a′, ′x′。这种从字面形式即可识别的常量称为“字面常量”或“直接常量”。

C++常量(C++数值常量、字符串常量、符号常量)
数值常量

数值常量就是通常所说的常数。在C++中，数值常量是区分类型的，从字面形式即可识别其类型。

整型常量（整数）的类型
在上一节中已知道：整型数据可分为int, short int,long int以及unsigned int, unsigned short, unsigned long等类别。整型常量也分为以上类别。为什么将数值常量区分为不同的类别呢？因为在进行赋值或函数的参数虚实结合时要求数据类型匹配。

那么，一个整型常量怎样从字面上区分为以上的类别呢？
一个整数，如果其值在-32768~+32767范围内，认为它是short int型，它可以赋值给short int型?int型和long int型变量。
一个整数，如果其值超过了上述范围，而在-2147483648~+2147483647范围内，则认为它是long int型，可以将它赋值给一个int或long int型变量。
如果某一计算机系统的C++版本（例如Visual C++）确定int与long int型数据在内存中占据的长度相同，则它们能够表示的数值的范围相同。因此，一个int型的常量也同时是一个long int型常量，可以赋给int型或long int型变量。
常量无unsigned型。但一个非负值的整数可以赋值给unsigned整型变量，只要它的范围不超过变量的取值范围即可。

一个整型常量可以用3种不同的方式表示：
十进制整数。如1357, -432, 0等。在一个整型常量后面加一个字母l或L，则认为是long int型常量。例如123L, 421L, 0L等，这往往用于函数调用中。如果函数的形参为long int，则要求实参也为long int型，此时用123作实参不行，而要用123L作实参。
八进制整数。在常数的开头加一个数字0，就表示这是以八进制数形式表示的常数。如020表示这是八进制数20，即(20)8，它相当于十进制数16。
十六进制整数。在常数的开头加一个数字0和一个英文字母X（或x），就表示这是以十六进制数形式表示的常数。如0X20表示这是十六进制数20，即(20)16，它相当于十进制数32。
浮点数的表示方法

一个浮点数可以用两种不同的方式表示：
1) 十进制小数形式。如21.456, -7.98等。它一般由整数部分和小数部分组成，可以省略其中之一（如78.或.06, .0），但不能二者皆省略。C++编译系统把用这种形式表示的浮点数一律按双精度常量处理，在内存中占8个字节。如果在实数的数字之后加字母F或f，表示此数为单精度浮点数，如1234F, -43f，占4个字节。如果加字母L或l，表示此数为长双精度数(long double)，在GCC中占12个字节，在Visual C++ 6.0中占8个字节。

2) 指数形式（即浮点形式）。一个浮点数可以写成指数形式，如3.14159可以表示为0.314159×101, 3.14159×100, 31.4159×10-1, 314.159×10-2等形式。在程序中应表示为：0.314159e1, 3.14159e0, 31.4159e-1, 314.159e-2，用字母e表示其后的数是以10为底的幂，如e12表示1012。其一般形式为：
数符数字部分指数部分

上面各数据中的0.314159, 3.14159, 31.4159, 314.159 等就是其中的数字部分。可以看到：由于指数部分的存在，使得同一个浮点数可以用不同的指数形式来表示，数字部分中小数点的位置是浮动的。例如：

 a=0.314159e1;
 a=3.14159e0;
 a=31.4159e-1;
 a=314.159e-2;

以上4个赋值语句中，用了不同形式的浮点数，但其作用是相同的。

在程序中不论把浮点数写成小数形式还是指数形式，在内存中都是以指数形式（即浮点形式）存储的。例如不论在程序中写成314.159或314.159e0, 31.4159e1, 3.14159e2, 0.314159e3等形式，在内存中都是以规范化的指数形式存放，

数字部分必须小于1，同时，小数点后面第一个数字必须是一个非0数字，例如不能是0.0314159。因此314.159和314.159e0, 31.4159e1, 3.14159e2, 0.314159e3在内存中表示成0.314159×103。存储单元分为两部分，一部分用来存放数字部分，一部分用来存放指数部分。为便于理解，在图2.3中是用十进制表示的，实际上在存储单元中是用二进制数来表示小数部分，用2的幂次来表示指数部分的。

对于以指数形式表示的数值常量，也都作为双精度常量处理。
字符常量

1) 普通的字符常量
用单撇号括起来的一个字符就是字符型常量。如'a', '#', '%', 'D'都是合法的字符常量，在内存中占一个字节。注意：
字符常量只能包括一个字符，如'AB' 是不合法的。
字符常量区分大小写字母，如'A'和'a'是两个不同的字符常量。
撇号(')是定界符，而不属于字符常量的一部分。如cout<<'a';输出的是一个字母"a"，而不是3个字符"'a' "。

2) 转义字符常量
除了以上形式的字符常量外，C++还允许用一种特殊形式的字符常量，就是以 "\"开头的字符序列。例如，'\n'代表一个"换行"符。"cout<<'\n'; " 将输出一个换行，其作用与"cout<<endl; " 相同。这种"控制字符"，在屏幕上是不能显示的。在程序中也无法用一个一般形式的字符表示，只能采用特殊形式来表示。

3) 字符数据在内存中的存储形式及其使用方法
将一个字符常量存放到内存单元时，实际上并不是把该字符本身放到内存单元中去，而是将该字符相应的ASCII代码放到存储单元中。如果字符变量c1的值为'a'，c2的值为'b'，则在变量中存放的是'a'的ASCII码97，'b' 的ASCII码98，如图2.4(a)所示，实际上在内存中是以二进制形式存放的，

既然字符数据是以ASCII码存储的，它的存储形式就与整数的存储形式类似。这样，在C++中字符型数据和整型数据之间就可以通用。一个字符数据可以赋给一个整型变量，反之，一个整型数据也可以赋给一个字符变量。也可以对字符数据进行算术运算，此时相当于对它们的ASCII码进行算术运算。

【例】将字符赋给整型变量。

#include <iostream>
using namespace std;
int main( )
{
 int i, j; //i和j是整型变量
 i='A'; //将一个字符常量赋给整型变量i
 j='B'; //将一个字符常量赋给整型变量j
 cout<<i<<' '<<j<<'\n'; //输出整型变量i和j的值,'\n' 是换行符
 return 0;
}

执行时输出

 65 66

i和j被指定为整型变量。但在第5和第6行中，将字符'A'和'B'分别赋给i和j，它的作用相当于以下两个赋值语句：

 i=65;j=66;

因为'A'和'B'的ASCII码为65和66。在程序的第5和第6行是把65和66直接存放到i和j的内存单元中。因此输出65和66。

可以看到：在一定条件下，字符型数据和整型数据是可以通用的。但是应注意字符数据只占一个字节，它只能存放0~255范围内的整数。

【例】字符数据与整数进行算术运算。下面程序的作用是将小写字母转换为大写字母。

#include <iostream>
using namespace std;
int main( )
{
 char c1,c2;
 c1='a';
 c2='b';
 c1=c1-32;
 c2=c2-32;
 cout<<c1<<' '<<c2<<endl;
 return 0;
}

运行结果为

A B

'a'的ASCII码为97，而'A'的ASCII码为65，'b'为98，'B'为66。从ASCII代码表中可以看到每一个小写字母比它相应的大写字母的ASCII代码大32。C++符数据与数值直接进行算术运算，'a'-32得到整数65，'b'-32得到整数66。将65和66存放在c1，c2中，由于c1，c2是字符变量，因此用cout输出c1，c2时，得到字符A和B（A的ASCII码为65，B的ASCII码为66）。
字符串常量

用双撇号括起来的部分就是字符串常量，如"abc"，"Hello!"，"a+b"，"Li ping"都是字符串常量。字符串常量"abc"在内存中占4个字节（而不是3个字节），见图。

编译系统会在字符串最后自动加一个'\0'作为字符串结束标志。但'\0'并不是字符串的一部分，它只作为字符串的结束标志。如

  cout<<"abc"<<endl;

输出3个字符abc，而不包括'\0'。

注意: "a"和'a'代表不同的含义，"a"是字符串常量，'a' 是字符常量。前者占两个字节，后者占1个字节。请分析下面的程序片段：

 char c; //定义一个字符变量
 c='a'; //正确
 c="a"; //错误，c只能容纳一个字符

请思考：字符串常量"abc\n"包含几个字符？不是5个而是4个字符，其中"\n"是一个转义字符。但它在内存中占5个字节（包括一个"\0"字符）。编译系统遇到"\"时就会把它认作转义字符的标志，把它和其后的字符一起作为一个转义字符。

如果"\"后面的字符不能与"\"组成一个合法的转义字符（如"\c"），则在编译时显示出错信息。如果希望将"\"字符也作为字符串中的一个字符，则应写为"abc\\n"，此时字符包括5个字符，即a，b，c，\，n。如果有以下输出语句：

 cout<<"abc\\\n"<<endl;

则会输出：

 abc\ (然后换行)

同理执行

 cout<<"I say \"Thank you!\"\n";

的输出是：

 I say "Thank you!"

如果在一个字符串中最后一个字符为"\"，则表示它是续行符，下一行的字符是该字符串的一部分，且在两行字符串间无空格。如

 cout<<"We must study C\ //本行最后的"\"后面的空格和换行均不起作用
 ++ hard!"; //本行的字符紧连在上一行最后的"\"前面字符之后

则输出：

 We must study C++ hard!

符号常量

为了编程和阅读的方便，在C++程序设计中，常用一个符号名代表一个常量，称为符号常量，即以标识符形式出现的常量。

【例】符号常量的使用。

#include <iostream>
using namespace std;
#define PRICE 30 //注意这不是语句,末尾不要加分号
int main ( )
{
 int num,total;
 num=10;
 total=num * PRICE;
 cout<<"total="<<total<<endl;
 return 0;
}

程序中用预处理命令#define指定PRICE在本程序单位中代表常量30，此后凡在本程序单位中出现的PRICE都代表30，可以和常量一样进行运算，程序运行结果为

 total=300

请注意符号常量虽然有名字，但它不是变量。它的值在其作用域（在本例中为主函数）内是不能改变的，也不能被赋值。如用赋值语句"PRICE=40;"给PRICE赋值是错误的。使用符号常量的好处是：含义清楚，在需要改变一个常量时能做到"一改全改"。如：

 #define PRICE 35