python运行原理
Python是一门新兴的编程语言,编程语言有很多,比如C++、java、C#、php、JavaScript等,Python也是其中之一,在学习Python前,我们需要对它有一定的了解。
Python支持多种编程范型,如函数式、指令式、结构化、面向对象和反射式编程。
Python解释器易于扩展,可以使用C或C++或其他可以通过C调用的语言扩展新的功能和数据类型。
Python编写的程序不需要编译成二进制代码,可以直接从源代码运行程序,在计算机内部,Python解释器把源代码转换成字节码的中间形式,然后再把它翻译成计算机使用的机器语言并运行。
语法简洁而清晰,具有丰富和强大的类库,使用Python快速生成程序的原型,然后对其中有特别要求的部分,用更合适的语言改写,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。
只有基础建牢固了,才会更利于我们以后的发展及进步,现如今Python的发展十分迅速,已经将C++语言甩在了后边,在不久的将来,可能会超过C和Java这些主流语言。
2. python是虚拟机吗
python并不是虚拟机,运行python文件的是python解释器。python解释器的工作原理如下:
一、过程概述
1、python先把代码(.py文件)编译成字节码,交给字节码虚拟机,然后虚拟机会从编译得到的PyCodeObject对象中一条一条执行字节码指令,并在当前的上下文环境中执行这条字节码指令,从而完成程序的执行。Python虚拟机实际上是在模拟操作中执行文件的过程。PyCodeObject对象中包含了字节码指令以及程序的所有静态信息,但没有包含程序运行时的动态信息——执行环境(PyFrameObject)
2、字节码在python虚拟机程序里对应的是PyCodeObject对象;
.pyc文件是字节码在磁盘上的表现形式。
3、从整体上看:OS中执行程序离不开两个概念:进程和线程。python中模拟了这两个概念,模拟进程和线程的分别是PyInterpreterState和PyTreadState。即:每个PyThreadState都对应着一个帧栈,python虚拟机在多个线程上切换。当python虚拟机开始执行时,它会先进行一些初始化操作,最后进入PyEval_EvalFramEx函数,它的作用是不断读取编译好的字节码,并一条一条执行,类似CPU执行指令的过程。函数内部主要是一个switch结构,根据字节码的不同执行不同的代码。
推荐学习《python教程》
二、关于.pyc文件
PyCodeObject对象的创建时机是模块加载的时候,即import。
1、执行 python test.py 会对test.py进行编译成字节码并解释执行,但不会生成test.pyc
2、如果test.py中加载了其他模块,如import urllib2,那么python会对urllib2.py进行编译成字节码,生成urllib2.pyc,然后对字节码解释执行。
3、如果想生成test.pyc,我们可以使用python内置模块py_compile来编译。
也可以执行命令 python -m test.py 这样,就生成了test.pyc
4、加载模块时,如果同时存在.py和.pyc,python会使用.pyc运行,如果.pyc的编译时间早于.py的时间,则重新编译.py,并更新.pyc文件。
3. 为什么说Python采用的是基于值的内存管理模式
先从较浅的层面来说,Python的内存管理机制可以从三个方面来讲
(1)垃圾回收
(2)引用计数
(3)内存池机制
一、垃圾回收:
python不像C++,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲,对象的类型和内存都是
在运行时确定的。这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结为对变量内存地址的分配是在运行时自动判断变量
类型并对变量进行赋值)。
二、引用计数:
Python采用了类似Windows内核对象一样的方式来对内存进行管理。每一个对象,都维护这一个对指向该对对象的引用的计数。如图所示(图片来自Python核心编程)
x = 3.14
y = x
我们首先创建了一个对象3.14, 然后将这个浮点数对象的引用赋值给x,因为x是第一个引用,因此,这个浮点数对象的引用计数为1. 语句y =
x创建了一个指向同一个对象的引用别名y,我们发现,并没有为Y创建一个新的对象,而是将Y也指向了x指向的浮点数对象,使其引用计数为2.
我们可以很容易就证明上述的观点:
变量a 和 变量b的id一致(我们可以将id值想象为C中变量的指针).
我们援引另一个网址的图片来说明问题:对于C语言来讲,我们创建一个变量A时就会为为该变量申请一个内存空间,并将变量值
放入该空间中,当将该变量赋给另一变量B时会为B申请一个新的内存空间,并将变量值放入到B的内存空间中,这也是为什么A和B的指针不一致的原因。如图:
而Python的情况却不一样,实际上,Python的处理方式和Javascript有点类似,如图所示,变量更像是附在对象上的标签(和引用的
定义类似)。当变量被绑定在一个对象上的时候,该变量的引用计数就是1,(还有另外一些情况也会导致变量引用计数的增加),系统会自动维护这些标签,并定
时扫描,当某标签的引用计数变为0的时候,该对就会被回收。
三、内存池机制
Python的内存机制以金字塔行,-1,-2层主要有操作系统进行操作,
第0层是C中的malloc,free等内存分配和释放函数进行操作;
第1层和第2层是内存池,有Python的接口函数PyMem_Malloc函数实现,当对象小于256K时有该层直接分配内存;
第3层是最上层,也就是我们对Python对象的直接操作;
在 C 中如果频繁的调用 malloc 与 free 时,是会产生性能问题的.再加上频繁的分配与释放小块的内存会产生内存碎片. Python 在这里主要干的工作有:
如果请求分配的内存在1~256字节之间就使用自己的内存管理系统,否则直接使用 malloc.
这里还是会调用 malloc 分配内存,但每次会分配一块大小为256k的大块内存.
经由内存池登记的内存到最后还是会回收到内存池,并不会调用 C 的 free
释放掉.以便下次使用.对于简单的Python对象,例如数值、字符串,元组(tuple不允许被更改)采用的是复制的方式(深拷贝?),也就是说当将另
一个变量B赋值给变量A时,虽然A和B的内存空间仍然相同,但当A的值发生变化时,会重新给A分配空间,A和B的地址变得不再相同;
而对于像字典(dict),列表(List)等,改变一个就会引起另一个的改变,也称之为浅拷贝:
附录:
引用计数增加
1.对象被创建:x=4
2.另外的别人被创建:y=x
3.被作为参数传递给函数:foo(x)
4.作为容器对象的一个元素:a=[1,x,’33’]
引用计数减少
1.一个本地引用离开了它的作用域。比如上面的foo(x)函数结束时,x指向的对象引用减1。
2.对象的别名被显式的销毁:del x ;或者del y
3.对象的一个别名被赋值给其他对象:x=789
4.对象从一个窗口对象中移除:myList.remove(x)
5.窗口对象本身被销毁:del myList,或者窗口对象本身离开了作用域。
垃圾回收
1、当内存中有不再使用的部分时,垃圾收集器就会把他们清理掉。它会去检查那些引用计数为0的对象,然后清除其在内存的空间。当然除了引用计数为0的会被清除,还有一种情况也会被垃圾收集器清掉:当两个对象相互引用时,他们本身其他的引用已经为0了。
2、垃圾回收机制还有一个循环垃圾回收器, 确保释放循环引用对象(a引用b, b引用a, 导致其引用计数永远不为0)。
4. Python是什么
Python由荷兰数学和计算机科学研究学会的Guido van Rossum 于1990
年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。
Python解释器易于扩展,可以使用C或C++(或者其他可以通过C调用的语言)扩展新的功能和数据类型。Python
也可用于可定制化软件中的扩展程序语言。Python丰富的标准库,提供了适用于各个主要系统平台的源码或机器码。
5. Python是一门怎样的编程语言
编程语言主要分为编译型和解释型,静态语言和动态语言,强类型和弱类型,混合语言等。
编译型语言:通过编译器把源代码编译(compile)成机器语言,在经过链接(linker)将源代码中所使用的库串联起来生成可执行二进制文件,这样运行时 计算机可以直接以机器语言来运行程序。优点:运行效率高。缺点:编译之后如果需要修改代码需要重新编译整个模块。编译的时候根据对应的运行环境生成机器码,不同的操作系统之间移植就会有问题,需要根据运行的操作系统环境编译不同的可执行文件,代表语言:C,C++,object-C等。
解释型语言:不需要编译,只在程序运行时才逐条翻译成机器语言。优点:跨平台支持比较好,缺点:程序运行效率会比较慢。如:python,php,Perl等。
动态语言:动态类型语言,是指数据类型,结构(如对象,函数)的检查是在运行时做的。用动态类型语言编程时,不用给变量指定数据类型,该语言会在你第一次赋值给变量时,在内部记录数据类型,结构。在运行代码时可以根据某些条件改变变量的数据类型,结构。也就是说在运行时代码 可以根据某些条件改变自身结构,数据类型。代表语言:python,PHP,C#等。
静态语言:静态类型语言,是指数据类型,结构的检查是在运行前(如编译阶段)做的,运行时结构不可变。代表语言:C,C++等。
强类型语言:如果某个变量的数据类型不经过强制转换,该变量类型是不会改变的。
弱类型语言:变量可以根据赋值类型调整自身的数据类型。
混合型语言:既然编译型和解释型各有缺点就会有人想到把两种类型整合起来,取其精华去其糟粕。就出现了半编译型语言。比如C#,C#在编译的时候不是直接编译成机器码而是中间码,.NET平台提供了中间语言运行库运行中间码,中间语言运行库类似于Java虚拟机。.net在编译成IL代码后,保存在dll中,首次运行时由JIT在编译成机器码缓存在内存中,下次直接执行。Java先生成字节码再在Java虚拟机中解释执行。严格来说混合型语言属于解释型语言。C#更接近编译型语言。
由此可知python语言是一门解释,动态,弱类型语言。
相关推荐:《Python视频教程》
python语言的优点:
1、python的定位是“优雅”、“明确”、“简单”,所以python程序看上去总是简单易懂,对于初学者容易入门。
2、开发效率高,python有非常强大的第三方库,基本上你想通过计算机实现任何功能,python官方库里都有相应的模块进行支持,直接下载调用后,在基础库的基础上进行开发,大大降低开发周期,避免重复造轮子。
3、高级语言,当使用python语言编写程序时,无需考虑如何管理内存等底层细节。
4、可移植性,由于它开源的本质,python已经被移植在许多平台上,如果你小心的避免使用依赖于系统特性,那么你的所有python程序无需修改就几乎可以在市场上所有的系统平台运行。
5、可扩展性,如果你需要你的一段关键代码运行得更快或者希望某些算法不公开,可以把部份程序用C或C++编写库,然后用python调用。
6、可嵌入式,可以把python嵌入到C/C++程序,从而向你的程序用户提供脚本功能。
python语言的缺点:
1、速度慢,由于是解释型所以运行速度相比编译型语言要慢,跟Java相比也要慢一些。
2、代码不能加密,因为python是解释型语言,它的源码都是以明文形式存放的,所以如果项目要求源代码必须保密或者加密,那一开始就不应该考虑用python来实现。
3、强制缩进,单行语句不用写分号对于习惯了C/C++用户可能不是太习惯。
4、Python2与 Python3不兼容,因为Python没有向后兼容,给所有的Python工程师带来了烦恼。
6. Python的几种实现
Python自身作为一门编程语言,它有多种实现。这里的实现指的是符合Python语言规范的Python解释程序以及标准库等。这些实现虽然实现的是同一种语言,但是彼此之间,特别是与CPython之间还是有些差别的。
下面分别列出几个主要的实现。
1.CPython:这是Python的官方版本,使用C语言实现,使用最为广泛,新的语言特性一般也最先出现在这里。
CPython实现会将源文件(py文件)转换成字节码文件(pyc文件),然后运行在Python虚拟机上。
2.J
ython:这是Python的Java实现,相比于CPython,它与Java语言之间的互操作性要远远高于CPython和C语言之间的互操作性。
在Python中可以直接使用Java代码库,这使得使用Python可以方便地为Java程序写测试代码,更进一步,可以在Python中使用Swing等图形库编写GUI程序。
Jython会将Python代码动态编译成Java字节码,然后在JVM上运行转换后的程序,这意味着此时Python程序与Java程序没有区别,只是源代码不一样。
在Python 中写一个类,像使用Java 类一样使用这个类是很容易的事情。
你甚至可以把Jython 脚本静态地编译为Java 字节码。
示例代码:fromjava.langimportSystemSystem.out.write('Hello World!
')
3.Python for .NET:它实质上是CPython实现的
.NET托管版本,它与.NET库和程序代码有很好的互操作性。4.
IronPython:不同于Python for .NET,它是Python的C#实现,并且它将Python代码编译成C#中间代码(与Jython类似),然后运行,它与.NET语言的互操作性也非常好。5.
PyPy:Python的Python实现版本,原理是这样的,PyPy运行在CPython(或者其它实现)之上,用户程序运行在PyPy之上。它的一个目标是成为Python语言自身的试验场,因为可以很容易地修改PyPy解释器的实现(因为它是使用Python写的)。6.
Stackless:CPython的一个局限就是每个Python函数调用都会产生一个C函数调用。这意味着同时产生的函数调用是有限制的,因此Python难以实现用户级的线程库和复杂递归应用。一旦超越这个限制,程序就会崩溃。Stackless的Python实现突破了这个限制,一个C栈帧可以拥有任意数量的Python栈帧。这样你就能够拥有几乎无穷的函数调用,并能支持巨大数量的线程。Stackless唯一的问题就是它要对现有的CPython解释器做重大修改。所以它几乎是一个独立的分支。另一个名为Greenlets的项目也支持微线程。它是一个标准的C扩展,因此不需要对标准Python解释器做任何修改。
下面的这篇文章对Stackless做了比较多的介绍,但是也比较难以读懂:
可爱的 Python:Python实现内幕
7. python 原理及用法
Python解释执行原理
这里的解释执行是相对于编译执行而言的。我们都知道,使用C/C++之类的编译性语言编写的程序,是需要从源文件转换成计算机使用的机器语言,经过链接器链接之后形成了二进制的可执行文件。运行该程序的时候,就可以把二进制程序从硬盘载入到内存中并运行。
但是对于Python而言,python源码不需要编译成二进制代码,它可以直接从源代码运行程序。当我们运行python文件程序的时候,python解释器将源代码转换为字节码,然后再由python解释器来执行这些字节码。这样,python就不用担心程序的编译,库的链接加载等问题了。
对于python解释语言,有以下3方面的特性:
每次运行都要进行转换成字节码,然后再有虚拟机把字节码转换成机器语言,最后才能在硬件上运行。与编译性语言相比,每次多出了编译和链接的过程,性能肯定会受到影响。
由于不用关心程序的编译和库的链接等问题,开发的工作也就更加轻松啦。
python代码与机器底层更远了,python程序更加易于移植,基本上无需改动就能在多平台上运行。
在具体计算机上实现一种语言,首先要确定的是表示该语言语义解释的虚拟计算机,一个关键的问题是程序执行时的基本表示是实际计算机上的机器语言还是虚拟机的机器语言。这个问题决定了语言的实现。根据这个问题的回答,可以将程序设计语言划分为两大类:编译型语言和解释型语言。
编译实现的语言,如:C、C++、Fortran、Pascal、Ada。由编译型语言编写的源程序需要经过编译,汇编和链接才能输出目标代码,然后由机器执行目标代码。目标代码是有机器指令组成,不能独立运行,因为源程序中可能使用了一些汇编程序不能解释引用的库函数,而库函数又不在源程序中,此时还需要链接程序完成外部引用和目标模板调用的链接任务,最后才能输出可执行代码。
解释型语言,解释器不产生目标机器代码,而是产生中间代码,这种中间代码与机器代码不同,中间代码的解释是由软件支持的,不能直接使用在硬件上。该软件解释器通常会导致执行效率较低,用解释型语言编写的程序是由另一个可以理解中间代码的解释程序执行的。和编译的程序不同的是, 解释程序的任务是逐一将源代码的语句解释成可执行的机器指令,不需要将源程序翻译成目标代码再执行。对于解释型语言,需要一个专门的解释器来执行该程序,每条语句只有在执行是才能被翻译,这种解释型语言每执行一次就翻译一次,因而效率低下。
Java解释器,java很特殊,java是需要编译的,但是没有直接编译成机器语言,而是编译成字节码,然后在Java虚拟机上用解释的方式执行字节码。Python也使用了类似的方式,先将python编译成python字节码,然后由一个专门的python字节码解释器负责解释执行字节码。
python是一门解释语言,但是出于效率的考虑,提供了一种编译的方法。编译之后就得到pyc文件,存储了字节码。python这点和java很类似,但是java与python不同的是,python是一个解释型的语言,所以编译字节码不是一个强制的操作,事实上,编译是一个自动的过程,一般不会在意它的存在。编译成字节码可以节省加载模块的时间,提高效率。
除了效率之外,字节码的形式也增加了反向工程的难度,可以保护源代码。这个只是一定程度上的保护,反编译还是可以的。
8. 零基础能学会Python吗
当然可以了,python也算是一门最简单的开发语言的一种。主要还是全栈语言。
如果你是零基础,注意是零基础,想入门编程的话,我推荐你学Python。虽然国内基本上是以C语言作为入门教学,但在麻省理工等国外大学都是以Python作为编程入门教学的。
那么如何学习Python呢?(文后附录了学习python快速入门上手视频)
第一步:学习python的准备开发工作
俗话说得好,磨刀不误砍柴工,这个你不得不信,反正我信了。那么怎么磨刀呢?首先,网络一下Python,对Python有一个大概的了解,然后去官方网站下载一个Python,你最好先下载Python2.7版本,学到最后在去看Python3版本,这符合Python的发展规律,如果你安装的过程中遇到问题,请自行网络搜索,这个网络一下,我敢肯定你会找到答案的,我相信你。以上说的是在Windows操作系统下安装。
第二步:先写一个Hello World,尝试一把
找到Python的安装目录,看到一个python.exe的文件,请用鼠标双击。是不是看到一个黑窗口,请输入print(“hello world!”),然后按Enter键。如果顺利,你将看到如下图所示的窗口。
第三步:学会Python运行的原理
不要怕,原理我可以用简单的语言告诉你,你不必东北西走的找。我们可以把那个python.exe当成翻译官(解释器),当我们输入print(“hello world”)的时候,翻译官会把我们的输入解释给操作系统,然后操作系统就明白是要向屏幕输出hello world,其实就是这么简单。
第四步:学会python如何运行编写好的脚本文件
紧接着上一步,请把黑窗口关掉,然后再次打开,你会发现你之前输入的东西都没有了,怎么办?我想保存住之前的输入怎么办?别着急,我来帮你。
现在,请用一个记事本,创建一个纯文本文件,保存成hello.py,请把这个hello.py放到c盘根目录中。
然后,请打开cmd窗口(不知道什么是cmd?网络一下你就知道,是吧),在窗口输入python c:\hello.py,如果顺利,你会看到类似下图的样子。
第五步:跟着老男孩python培训入门教程开始一步一步学Python
文章后面附录了最新的alex python入门视频
第六步:请名师手把手传授高级Python技能
能独自走完入门教程的话,恭喜你,你已经进入Python大门。如果你希望用Python技能就业的话,只是入门还是不够的,请找名师手把手传授高级Python技能吧。
9. python是什么东西怎么使用
Python是一种脚本语言。程序设计语言分为编译型和解释型。区别在于是否需要编译后才能运行。python属于后者,不需要编译。类似的还有php,javascript。python文件的后缀名是.py。在命令行模式下使用python <filename>.py 来运行。也可以输入python进去交互模式。例如最简单的Helloworld程序,python2使用print 'Hello,world!' Python3的是print('Hello,world!')。更多内容请参考www.python.org