本章将更新《Python语法规范与数据类型》的内容,主要是让大家了解Python有哪些编程模式类型,掌握Python的基本语法,Knowhow命令行参数的输出和基本应用。了解了Python的数据类型之后,就可以进行更多的相关操作了。常用编程方式①Python交互式命令编程。②Python脚本编程。③中文编码处理。1.交互式命令编程方式交互式命令编程方式是典型的逐行读取执行方式。这种编程方式是程序只有一行或更少时的典型应用方式。下图使用PythonIDLE编辑器进行编程,编辑器的编程方式是典型的交互式命令代码符号。>>>是输入交互命令的提示符。每次输入后回车,Python解析器就会执行命令。2.脚本编程方式当我们需要编写比较复杂或者大段的代码时,命令式编程就不够方便了。因此,Python提供了一种脚本编程模式。可以创建一个后缀为*.py的脚本文件,将大量代码写入该文件,方便代码维护和更新,然后使用交互式命令执行或IDE工具运行。3.字符编程字符串是一种数据类型。但是,字符串也有一个比较特殊的编码问题。因为计算机只能处理数字,所以如果要处理文本,必须先将文本转换为数字,然后才能处理。补充:字符编码史上最早的计算机使用8位(bit)作为一个字节(byte),所以一个字节所能表示的最大整数是255(二进制11111111=十进制255),如果要表示更大的整数,必须使用更多的字节。例如,两个字节可以表示的最大整数是65535,四个字节可以表示的最大整数是4294967295。由于计算机是美国人发明的,所以最早只有127个字符被编码进计算机,即大小写英文字母、数字和一些符号。这种码表称为ASCII码。比如大写字母A的编码是65.,小写字母z的编码是122扩展名:unicode字符集Python3之所以能解决中文乱码问题,是因为它把所有的字符串都用unicode编码。●Unicode将所有语言统一为一个编码,这样就不会出现乱码。●Unicode也在不断发展,但最常用的是用两个字节来表示一个字符(如果遇到非常稀有的字符,就需要4个字节)。我们今天看到的大多数操作系统和大多数编程语言都支持unicode。ASCII编码是1个字节,而Unicode编码通常是2个字节。扩展名:UTF-8字符集新的问题又出现了:如果统一成Unicode编码,乱码问题从此消失。但是,如果你写的文字基本都是英文的话,使用Unicode编码需要的存储空间是ASCII编码的两倍,无论从存储还是传输上都是非常不经济的。解决方案的诞生:将Unicode编码转换为“变长编码”的UTF-8编码再次出现。●UTF-8编码将一个Unicode字符按照不同的数字编码成1-6个字节。常用的英文字母编码为1个字节,汉字通常为3个字节。只有非常罕见的字符才会被编码。被编码成4-6字节。●如果要传输的文本中包含大量英文字符,UTF-8编码可以节省空间。●UTF-8编码的另一个优点是ASCII编码实际上可以看作是UTF-8编码的一部分,因此大量只支持ASCII编码的遗留软件可以在UTF-8编码下继续工作。特别说明:计算机内存统一使用Unicode编码。Python3字符编码在Python3版本中,字符串都是Unicode编码,也就是说Python字符串支持多种语言。对于单个字符的编码,Python提供了ord()函数获取单个字符的十进制整数表示,chr()函数将编码转换为对应的字符。例子:>>>ord('A')65>>>ord('中')20013>>>chr(66)'B'>>>chr(25991)'文'Python源码也是文本文件,因此,当你的源代码中包含中文时,在保存源代码时,需要指定保存为UTF-8编码。Python解释器在读取源代码时,为了使其以UTF-8编码读取,我们通常将这一行写在文件的开头。#-*-coding:utf-8*-注释是告诉Python解释器按照UTF-8编码读取源码,??否则你在源码中写的中文输出可能会出现乱码。
