Openstack需要学习python到什么程度

最好的Python机器学习库
发表于 09:31|
来源StackAbuse|
作者Scott Robinson
摘要:神经网络和机器学习在过去几年一直是高科技领域最热门的话题之一。这一点很容易看出,因为它们解决了很多真正有趣的用例,如语音识别、图像识别、甚至是乐曲谱写。本文总结了一些很好的Python机器学习库的清单。
毫无疑问,神经网络和机器学习在过去几年一直是高科技领域最热门的话题之一。这一点很容易看出,因为它们解决了很多真正有趣的用例,如语音识别、图像识别、甚至是乐曲谱写。因此,在这篇文章,我决定编制一份囊括一些很好的Python机器学习库的清单,并将其张贴在下面。
在我看来,Python是学习(和实现)机器学习技术最好的语言之一,其原因主要有以下几点:
语言简单:如今,Python成为新手程序员首选语言的主要原因是它拥有简单的语法和庞大的社区。功能强大:语法简单并不意味着它功能薄弱。Python同样也是数据科学家和Web程序员最受欢迎的语言之一。Python社区所创建的库可以让你做任何你想做的事,包括机器学习。丰富的ML库:目前有大量面向Python的机器学习库。你可以根据你的使用情况、技术和需求从数百个库中选择最合适的一个。
上面最后一点可以说是最重要的。驱动机器学习的算法相当复杂,包括了很多的数学知识,所以自己动手去实现它们(并保证其正常运行)将会是一件很困难的任务。幸运地是,有很多聪明的、有奉献精神的人为我们做了这个困难的工作,因此我们只需要专注于手边的应用程序即可。
这并不是一个详尽无遗的清单。有很多代码并未在此列出,在这里我只会发布一些非常相关或知名的库。下面,来看看这份清单吧。
最受欢迎的库
我已经对一些比较流行的库和它们擅长的方向做了一个简短的描述,在下一节,我会给出一个更完整的项目列表。
Tensorflow
这是清单中最新的神经网络库。在前几天刚刚发行,Tensorflow是高级神经网络库,可以帮助你设计你的网络架构,避免出现低水平的细节错误。重点是允许你将计算表示成数据流图,它更适合于解决复杂问题。
此库主要使用C++编写,包括Python绑定,所以你不必担心其性能问题。我最喜欢的一个特点是它灵活的体系结构,允许你使用相同的API将其部署到一个或多个CPU或GPU的台式机、服务器或者移动设备。有此功能的库并不多,如果要说有,Tensorflow就是其一。
它是为谷歌大脑项目开发的,目前已被数百名工程师使用,所以无须怀疑它是否能够创造有趣的解决方案。
尽管和其它的库一样,你可能必须花一些时间来学习它的API,但花掉的时间应该是很值得的。我只花了几分钟了解了一下它的核心功能,就已经知道Tensorflow值得我花更多的时间让我来实现我的网络设计,而不仅仅是通过API来使用。
擅长:神经网络网址:http://tensorflow.org/Github:&
scikit-learn
scikit-learn绝对是其中一个,如果不是最流行的,那么也算得上是所有语言中流行的机器学习库之一。它拥有大量的数据挖掘和数据分析功能,使其成为研究人员和开发者的首选库。
其内置了流行的NumPy、SciPy,matplotlib库,因此对许多已经使用这些库的人来说就有一种熟悉的感觉。尽管与下面列出的其他库相比,这个库显得水平层次略低,并倾向于作为许多其他机器学习实现的基础。
擅长:非常多网址:http://scikit-learn.org/Github:&
Theano是一个机器学习库,允许你定义、优化和评估涉及多维数组的数学表达式,这可能是其它库开发商的一个挫折点。与scikit-learn一样,Theano也很好地整合了NumPy库。GPU的透明使用使得Theano可以快速并且无错地设置,这对于那些初学者来说非常重要。然而有些人更多的是把它描述成一个研究工具,而不是当作产品来使用,因此要按需使用。
Theano最好的功能之一是拥有优秀的参考文档和大量的教程。事实上,多亏了此库的流行程度,使你在寻找资源的时候不会遇到太多的麻烦,比如如何得到你的模型以及运行等。
擅长:神经网络和深度学习网址:http://deeplearning.net/software/theano/Github:/Theano/Theano
大多数Pylearn2的功能实际上都是建立在Theano之上,所以它有一个非常坚实的基础。
据Pylearn2网址介绍:
Pylearn2不同于scikit-learn,Pylearn2旨在提供极大的灵活性,使研究者几乎可以做任何想做的事情,而scikit-learn的目的是作为一个“黑盒”来工作,即使用户不了解实现也能产生很好的结果。
记住,Pylearn2在合适的时候会封装其它的库,如scikit-learn,所以在这里你不会得到100%用户编写的代码。然而,这确实很好,因为大多数错误已经被解决了。像Pylearn2这样的封装库在此列表中有很重要的地位。
擅长:神经网络网址:http://deeplearning.net/software/pylearn2/Github:/lisa-lab/pylearn2
神经网络研究更让人兴奋和不同的领域之一是遗传算法。从根本上说,遗传算法只是一个模拟自然选择的启发式搜索过程。本质上它是在一些数据上测试神经网络,并从一个拟合函数中得到网络性能的反馈。然后对网络迭代地做小的、随机的变化,再使用相同的数据进行测试。将具有高度拟合分数的网络作为输出,然后使其作为下一个网络的父节点。
Pyevolve提供了一个用于建立和执行这类算法很棒的框架。作者曾表示,V0.6版本也支持遗传编程,所以在不久的将来,该框架将更倾向于作为一个进化的计算框架,而不只是简单地遗传算法框架。
擅长:遗传算法的神经网络Github:/perone/Pyevolve
Nupic是另一个库,与标准的机器学习算法相比,它提供了一些不同的功能。它基于一个称作层次时间记忆(HTM)的新皮层理论,。HTMs可以看作是一类神经网络,但在一些理论上有所不同。
从根本上说,HTMs是一个分层的、基于时间的记忆系统,可以接受各种数据。这意味着会成为一个新的计算框架,来模仿我们大脑中的记忆和计算是如何密不可分的。对于理论及其应用的详细说明,请参阅
擅长:HTMsGithub:/numenta/nupic
此库更像是一个“全套”库,因为它不仅提供了一些机器学习算法,而且还提供了工具来帮助你收集和分析数据。数据挖掘部分可以帮助你收集来自谷歌、推特和维基百科等网络服务的数据。它也有一个Web爬虫和HTML&DOM解析器。“引入这些工具的优点就是:在同一个程序中收集和训练数据显得更加容易。
在文档中有个很好的例子,使用一堆推文来训练一个分类器,用来区分一个推文是“win”还是“fail”。
from pattern.web import Twitter
from pattern.en import tag
from pattern.vector import KNN, count
twitter, knn = Twitter(), KNN()
for i in range(1, 3):
for tweet in twitter.search('#win OR #fail', start=i, count=100):
s = tweet.text.lower()
p = '#win' in s and 'WIN' or 'FAIL'
v = tag(s)
v = [word for word, pos in v if pos == 'JJ'] # JJ = adjective
v = count(v) # {'sweet': 1}
knn.train(v, type=p)
print knn.classify('sweet potato burger')
print knn.classify('stupid autocorrect')
首先使用twitter.search()通过标签'#win'和'#fail'来收集推文数据。然后利用从推文中提取的形容词来训练一个K-近邻(KNN)模型。经过足够的训练,你会得到一个分类器。仅仅只需15行代码,还不错。
擅长:自然语言处理(NLP)和分类。Github:/clips/pattern
Caffe是面向视觉应用领域的机器学习库。你可能会用它来创建深度神经网络,识别图像中的实体,甚至可以识别一个视觉样式。
Caffe提供GPU训练的无缝集成,当你训练图像时极力推荐使用此库。虽然Caffe似乎主要是面向学术和研究的,但它对用于生产使用的训练模型同样有足够多的用途。
擅长:神经网络/视觉深度学习网址:http://caffe.berkeleyvision.org/Github:/BVLC/caffe
其它知名库
这里还列出了一些其它面向Python的机器学习库。其中一些库与上述库有着相同的功能,而另一些则有更窄小的目标或是更适合当作学习工具来使用。
&基于scikit-learn
Statsmodels
PyBrain&(inactive)
Feature&Forge
Python-ELM
MLPY&(inactive)
MDP&(inactive)
FFnet&(inactive)
基于Theano
原文地址:(译者/刘帝伟 审校/刘翔宇 责编/仲浩)译者简介: 刘帝伟,中南大学软件学院在读研究生,关注机器学习、数据挖掘及生物信息领域。
推荐阅读相关主题:
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章运维朋友们,别再问需不需要学Python了_Linux新闻_Linux公社-Linux系统门户网站
你好,游客
运维朋友们,别再问需不需要学Python了
作者:Li.Yingjie
现阶段,掌握一门开发语言已经成为高级运维工程师的必备计能,不会开发,你就不能充分理解你们系统的业务流程,你就不能帮助调试、优化开发人开发 的程序,开发人员有的时候很少关注性能的问题,这些问题就得运维人员来做,一个业务上线了,导致CPU使用过高,内存占用过大,如果你不会开发,你可能只 能查到进程级别,也就是哪个进程占用这么多,然后呢?然后就交给开发人员处理了,这样怎么体现你的价值?
另外,大一点的公司,服务器都上几百,上千,甚至数万台,这种情况下怎样做自动化运维?用Shell写脚本for循环?呵呵,歇了吧!Shell也就适合简单的系统管理工作。
到复杂的自动化任务还得要用专门的开发语言。你可能说了,自动化管理有专门的开源软件监控也有,直接拿来用下就好了,但是现有的开源软件如 Puppet、Saltstack、OpenStack、Zabbix、Nagios等多为通用的软件,不可能完全适用你公司的所有需求,当你需要做定 制、做二次开发的时候,你怎么办?找开发部门?
开发部门不懂运维的实际业务逻辑,写出来的东西太烂不能用,我自己也做运维系统,6年运维工作经验,开发出来的第一版照样烂的不行,这还是懂的运维业务逻辑的,让开发人员来做,跑偏可能更多了,这就是为什么我见过很多公司自行开发运维平台,最后都扔那了。
其次,不会运维开发,你就不能自己写运维平台复杂的运维工具,一切要借助于找一些开源软件拼拼凑凑,如果是这样,那就请不要抱怨你的工资低,你的 工作不受重视了,话说人家FaceBook一个运维工程师管2万台机器,运维工程师年薪十几万USD,你以为人家是盖的呢?哪个不是身怀绝技,开发运维兼 备?
为什么要学Python?
Python第一是个非常牛B的脚本语言,能满足绝大部分自动化运维的需求,又能做后端C/S架构,又能用WEB框架快速开发出高大上的Web界 面,只有当你自已有能力做出一套运维自动化系统的时候,你的价值才体现出来,你才有资格跟老板谈重视,否则,还是老老实实回去装机器吧!
运维开发为什么要用Python?
Good question,为什么不用PHP,JAVA, C++,Ruby,这里我只能说,见人见智, 如果你碰巧已经掌握了除Python之外的其它语言,那你爱用啥用啥,如果你是一个连Shell都还没写明白的新手,想学个语言的话,请用Python,为什么呢?
首先,PHP是跟Python比的最多的,其实他俩根本就不用比,为什么呢?两个语言适用性不同,PHP主要适用于Web开发,可以迅速的做出中 小型,轻量级的WEB网站,但后端嘛,基本还是要借助其它语言,借助什么语言呢?Shell?Python?呵呵。而Python呢,是个综合语言,前后 端都可以,单拿出来比Web,也一点不比PHP差,但为什么Web方向上PHP比Python要火?
先入为主嘛,PHP 90年代诞生就是做Web的,Python2000年后才出现Web框架,但论优秀程度上,Python的Web框架基本上出其无左,至少是跟PHP比。
那JAVA呢?好吧,一个臃肿、中庸、豪无新意的语言,还是老老实实用它来做ERP吧!搞个运维小平台,用JAVA真心没啥必要,在我看来,JAVA就是稳定的中年男人,稳定、成熟、秃顶,而Python代表的就是青春,简洁、快、干净、帅!
C++/C,这个嘛,我只能说,如果你会了Python,又会C的话,那你会更吃香,但是不会C的话,其实也无大碍,基本上做运维的人,搞搞C就 是为了来装B的,因为多数情况下你都到不了看系统底层源码的程度, 不过如果你学好了Python之后,还是建议你学习下C++,毕竟相比Python这个动态语言来讲,C++的效率还是高很多的,但对新手来讲,不建议做 为第一门语言开始学习,为什么呢?打击自信心&呵呵,你懂的
Ruby,小日本开发的,还不错,风格跟Python有点像,因为Ruby onrails出了名,国外用的比较多,国内,放心吧!没戏,Python已经把它的想象空间都占死了。
当然还有新的语言GO,有些搞运维的看见做开发的人员搞GO,也想凑热闹,觉得是未来,我想说,别瞎没事跟风,GO再成功,也不会变成运维开发语言。
有些人觉得Python效率底,说他不能支持多线程,OH,好吧!这个还有点说对了,但是我想问,看我这篇文章的有几个做过搜索引擎开发?有几个做个上亿PV的并发网站开发?
有几个看过Linux内核源码?如果没有,请别瞎跟着传了,知道Python为什么不支持多线程吗?这句话问错了,其实Python支持多线程, 只是不支持多CPU多线程,也就是一个程序spawn出来的多线程只能占用一个CPU,但是为什么呢?噢,因为GIL,GIL是什么东东,请自行脑 补。。。但是你非得用多线程吗?你可以用多进程呀!再牛B你还可以用协程呀,这些Python支持的都很好呀,如果你的程序逻辑不好,搞个多线程也快不起 来。
我认识一个博士讲过一句话,我觉得不错,他说,程序效率高低,80%都是写程序的人决定了,语言本身就占20%,所以下次有人再说Python效 率低的时候,请让他先回去自己检查下自己的程序多了多少无用的逻辑、循环等等。这个博士自己用Python写的WEB程序,一台服务器每天能处理上亿请 求,一秒并发近两万,什么WEB框架这么牛B? 别问它是谁,它叫tornado。
Python能否自学?
当然可以,什么都可以自学,前提是你得能学得会,见过N多菜鸟踏上自学的不归路,他妈的什么都能自学的话,还用大学干什么?自己在家鳖不就行了?
动不动就说Python是个脚本语言,自己看看就不会了,说这话的只可能有两种人,一种是高手,一种是菜鸟,对于高手来讲,他肯定已经会其它语 言,Python在这种情况下,自学当然就很容易学会,几年前我刚接触Python时,代码遇到问题,找了个开发的哥们帮调试,哥们帮调了十几分钟就搞定 了,结果人家以前一句Python代码也没写过,为什么,因为语言都有相通之处,一门掌握好了,其它门自己学学就会了。
但对于新手来讲,没任何语言基础就开始自学,那么恭喜你,菜鸟们见此文章为证,从今天开始自学,一年后,你要是能自己做出个软件来,来找我要一千块钱。哈哈,真的。
基本上自学是属于专业人员干的事情,就像会一门乐器了,自己学下就可能学会另一门,但我之前没音乐基础,跟着老师都没把吉它学会。
所以奉劝没基础又想学Python的同学,花点钱去报个班学吧!拿钱换时间,时间是生命,钱没了可再挣钱,时间过去了就再也不会回来,如果你不信邪,非要自己学,那我佩服你的勇气,不过自己试试就知道了。
当然天下没有绝对的事情,我大天朝牛X的人多了去了,很多人也能通过自学编程,最后变成高手了,我的Python也是自学的,但是我可以说自学过 程中走过了N多坑好么,好多时候纠结在一个简单的小问题上好几天都卡住,当时如果不是因为工作需求,估计早放弃了,这还是Python,就别说其它复杂的 语言了,我相信除了少数的大牛之外,多数人不比我聪明到哪去,选择自学的同鞋们,一路珍重。
说了这么多,只想告诉那些迷茫不知所措该学什么语言的新手们, 在你还没学好走路的时候,不要老想着,将来我当上老板了,我是开宝马呢?还是开奔驰呢?先学会骑自行车吧!
下面关于Python的文章您也可能喜欢,不妨看看:
Python:在指定目录下查找满足条件的文件&
Python2.7.7源码分析&
无需操作系统直接运行 Python 代码&
上源码安装Python3.4&
《Python核心编程 第二版》.(Wesley J. Chun ).[高清PDF中文版]
《Python开发技术详解》.( 周伟,宗杰).[高清PDF扫描版+随书视频+代码]
Python脚本获取Linux系统信息
在下用Python搭建桌面算法交易研究环境
Python 语言的发展简史
Python 的详细介绍:Python 的下载地址:
本文永久更新链接地址:
相关资讯 & & &
& (12/18/:54)
& (11/10/:33)
& (04月26日)
& (12/18/:28)
& (01/07/:16)
图片资讯 & & &
   同意评论声明
   发表
尊重网上道德,遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款不知觉python总结都有四十页了,虽然可能很多都是基础性的,仍然有成就感。和之前一样,仍然全部贴出来,而不是把新的贴出来,请谅解。这次新增的部分包括c扩展,排序,ftp,源码安全,性能,代码检查等。后面在python上努力的几个方向:1、继续在开发中多使用,积累开发经验。2、针对我们公司完善基础库,在我们公司推广。3、抽时间,系统学习一下python。4、学习一下高手在怎么使用python。毕竟我是自学。5、参与开源。如果你想下载这个文档,请点击这里:
两本不错的书:
《Python参考手册》:对Python各个标准模块,特性介绍的比较详细。
《Python核心编程》:介绍的比较深入,关键是,对Python很多高级特性都有介绍。
一个开源代码:openstack,关于云计算的,用Python写的,可以重点学习一下。
套接字编程:
1、&函数的功能基本和c类似,唯一不同的地方在于当发生错误时,它不是通过返回值来告知的,而是通过触发异常,所以udp中的bind,&recvfrom,&sendto必须要进行捕捉异常。
2、&套接字在垃圾收集的时候也会关闭。
3、&获取网卡的IP:&&&&
s&=&socket.socket(socket.AF_INET,&socket.SOCK_DGRAM)
return&socket.inet_ntoa(fcntl.ioctl(s.fileno(),&0X8915,&struct.pack('256s',&ethname[:15]))[20:24])
字符串的使用:
1、&Python的字符串是不可以改变的。但是你可以操作字符串以形成新的字符串。
2、&字符串中删除一个字串。没有直接提供这个方法,但是replace可以实现:
"abc&def".replace("&",&"")
同样的功能还有一个方法:translate。它的原有作用是将字符串中的某个字符替换为另外一个字符,注意,不是字符串。它的第一个参数是一个转换表。第二个参数是要删除的字符串。我们可以利用第二个参数del,实现这个功能。同时,第一个参数设置为None。
translate可能更高效一点。另外,它的第二个参数可以使一个字符串,含有多个字符,这样就会删除多个。
注意:translate方法不会对这个字符串操作,而是返回一个新的字符串。
3、&strip方法:去除字符串两侧的空格,返回新的字符串。这个功能非常有用。
4、&str中有一个函数,format,非常强大,有时间一定要看一下。
5、&endswitch:检查字符串是否已某字符串结尾。startswith:检查是否已某字符串开头。
6、&partition:它将字符串按指定的字符串分为三个部分,返回一个元组。第一个是指定字符串前面内容,第二个是指定字符串,第三个是指定字符串后面的内容。用于字符串解析非常好用。
7、&split:将字符串按照某指定字符串分割成多个子字符串,返回一个分割后的列表。
8、&join:将一个字符串列表中的各个字符串连接起来,中间插入指定的字符串。
9、&find的返回值不是false和true,所以不可以直接用于if判断。需要判断if&s.find(&&)&&=&0:
10、&基于字典的格式化:
a)&sh&=&'''
b)&python&-m&compileall&-fl&../
c)&python&-m&compileall&-fl&../src/
d)&mkdir&%(packname)s;
e)&mdkir&%(packname)s;
f)&'''&%&{'packname':sys.argv[1],&}
g)&print(sh)
内建函数:
string.capitalize()
&把字符串的第一个字符大写&
string.center(width)
&返回一个原字符串居中,并使用空格填充至长度&width&的新串&
string.count(str,&beg=0,&end=len(string))
&返回&str&在&string&里面出现的次数,如果&beg&或者&end&指返回指定范围内&str&出现的次数&
string.decode(encoding='UTF-8',&errors='strict')
&&&以&encoding&指定的编码格式解码&string,如果出错默认报ValueError&的异常,除非&errors&指定的是'ignore'或'replace'&
string.encode(encoding='UTF-8',&errors='strict')
&&以&encoding&指定的编码格式编码&string,如果出错默认报ValueError的异常,&除非errors指定的是'ignore'或者'repl
string.endswith(obj,&beg=0,&end=len(string))
检查字符串是否以&obj&结束,如果&beg&或者&end&指定则检定的范围内是否以&obj&结束,&如果是,&返回True,否则返回Fa
string.expandtabs(tabsize=8)
把字符串&string&中的&tab&符号转为空格,&默认格数&tabsize&是&8.&
string.find(str,&beg=0,&end=len(string))
&&&检测&str&是否包含在&string&中,如果&beg&和&end&指定范则检查是否包含在指定范围内,如果是返回开始的索引值,返回-1&
string.index(str,&beg=0,&end=len(string))
&&&&跟find()方法一样,&只不过如果str不在string中会报一个异
string.isalnum()
a,&b,&c&&R如果string至少有一个字符并且所有字符都是字母或数字回&True,否则返回&False&
string.isalpha()
a,&b,&c&&如果string至少有一个字符并且所有字符都是字母则返回T否则返回&False&
string.isdecimal()
b,&c,&d&如果&string&只包含十进制数字则返回&True&否则返回&False.
string.isdigit()
b,&c&如果&string&只包含数字则返回&True&否则返回&False.&
string.islower()
b,&c&如果&string&中包含至少一个区分大小写的字符,并且所有这些(大小写的)字符都是小写,则返回&True,否则返回&False&
string.isnumeric()
b,&c,&d&如果&string&中只包含数字字符,则返回&True,否则返回&False&
string.isspace()
b,&c&如果&string&中只包含空格,则返回&True,否则返回&False.&
string.istitle()
b,&c&如果&string&是标题化的(见&title())则返回&True,否则返回&False&
string.isupper()
b,&c&如果&string&中包含至少一个区分大小写的字符,&并且所有这些(区分大小写的)字符都是大写,则返回&True,否则返回&False&
string.join(seq)
&Merges&(concatenates)以&string&作为分隔符,将&seq&中所有的元素(的字符串表示)合并为一个新的字符串&
string.ljust(width)
返回一个原字符串左对齐,并使用空格填充至长度&width&的新字符串&
string.lower()
&转换&string&中所有大写字符为小写.&&&&
string.lstrip()
&&截掉&string&左边的空格&
string.partition(str)
e&有点像&find()和&split()的结合体,从&str&出现的第一个位置起,把&字&符&串&string&分&成&一&个&3&元&素&的&元&组&(string_pre_str,str,string_post_str),如果&string&中不包含str&则&string_pre_str&==&string.&
string.replace(str1,&str2,&&num=string.count(str1))
把&string&中的&str1&替换成&str2,如果&num&指定,&&&&&&&&则替换不超过&num&次.&
string.rfind(str,&beg=0,end=len(string))
类似于&find()函数,不过是从右边开始查找.&
string.rindex(&str,&beg=0,end=len(string))
&&&&类似于&index(),&不过是从右边开始.&
string.rjust(width)
返回一个原字符串右对齐,并使用空格填充至长度&width&的新字符串&
string.rpartition(str)
e&&类似于&partition()函数,不过是从右边开始查找.&
string.rstrip()
&&删除&string&字符串末尾的空格.&
string.split(str="",&num=string.count(str))
&&以&str&为分隔符切片&string,如果&num有指定值,则仅分隔&num&个子字符串&
string.splitlines(num=string.count('\n'))
b,&c按照行分隔,&返回一个包含各行作为元素的列表,&如果&num&指定则仅切片&num&个行.&
string.startswith(obj,&beg=0,end=len(string))
b,&e检查字符串是否是以&obj&开头,是则返回&True,否则返回&False。如果beg&和&end&指定值,则在指定范围内检查.&
string.strip([obj])
&&在&string&上执行&lstrip()和&rstrip()
string.swapcase()
&&翻转&string&中的大小写&
string.title()
b,&c&&&返回"标题化"的&string,就是说所有单词都是以大写开始,其余字母均为小写(见&istitle())
string.translate(str,&del="")
&&根据str给出的表(包含256个字符)转换string的字符,要过滤掉的字符放到&del&参数中&
string.upper()
&转换&string&中的小写字母为大写&
string.zfill(width)
&&返回长度为&width&的字符串,原字符串&string&右对齐,前面填充0&
正则表达式
1、&为什么要学习正则:主要是为了处理字符串更加方便,特别是为后面进行代码生成做储备。
2、&match是匹配字符串的开头是否匹配,而search是查看字符串任意起始位置是否满足。
3、&sub可以对字符串中模式匹配的部分进行替换
4、&split:可以对字符串进行分割,这里是根据模式分割。
函数的使用:
1、&函数的作用域:函数中定义一个变量,如果和全局变量重名,则全局变量名称就会被覆盖,也就是,这里对这个变量的更改,不会更改全局变量。但是,如果直接使用的话,是会使用全局变量的。同时,如果想要修改全局变量,需要制定是全局变量:global&a
2、&xrange用法和range一样,不过更为高效,因为他不会在内存中创建列表。所以,它只能用于循环。
3、&如果函数没有return语句,则他的返回值为None。
4、&关于函数的入参判断:如果如此为空,可能会发生异常。当异常发生后,可能会出现一种情况,一个事情做到了一半,就没有在进行下去,可能会造成内存泄露。这个问题如何解决?按照C的方式,每个入参都做判断是可以解决的,但是这样太麻烦了。而且看很多开源代码页没有这样来做。是不是有更好的方法?换一种思路,在调用之前确保不为空。在看看开源的代码是怎么做的。特别是openstack。
5、&可变入参:*args,&**kwargs表示可变入参。
def&funtest(a,&b,&c):
&&&&print(a,&b,&c)
def&fun2(*args,&**kwargs):
funtest(*args,&**kwargs)
fun2(1,2,3)
也可以这样定义:
fun2(a,&*args,&**kwargs)
如何从可变参数中解析出参数的值?
在fun2中添加打印:可以发现,其实args是一个元组,kwargs是一个字典。
分析:调用fun2(1,2,3),会把a赋值给a,2赋值给元组args,{&c&=3}赋值给kwargs.
args和kwargs的顺序不可颠倒。
args和kwargs可能同时都有值。这样,要获取指定的入参,首先根据看args中有没有,然后根据字符串看kwargs中是否存在。
如何建一个元组或者字典通过参数传递给一个函数?
def&funtest(a,&b,&c):
&&&&print(a,&b,&c)
d&=&{'a':1,&'b':2,'c':3}
l&=&(1,2,3)
funtest(*l)
funtest(**d)
*和**在Python中可以实现这个功能。这样会很灵活的。
*和**也可以单独出现。但是,如果同时出现,*必须在**之前。
6、&默认参数或者可选参数,参数顺序:调用时,可以指定默认参数中填充那个。
def&funtest(a,&b=1,&c=2):
&&&&print(a,&b,&c)
funtest(1,&c=5,&b=6)
其实,即便定义为:def&funtest(a,&b,&c),也可以通过funtest(1,&c=5,&b=6)的形式调用。
7、&参数组:*args,&**kwargs就是参数组,通过元组和字典将产生携带进来。这个特性有助于更为动态的代码生成。
8、&可变长度参数:
9、&函数的参数中如果有一个是元组,可以这样:
def&fun(a,&(b,&c)):
&&&&print(a,&b,&c)
fun(1,&(1,2))
10、&关于回调,可以使用闭包,生成器,以及对象的__call__属性。都可以封装状态。
闭包的使用:
1、&将组成函数的语句和语句的执行环境打包在一起形成的对象,成为闭包。
2、&2.7之前的闭包不支持关键字nonlocal。3.0之后才支持。所以2.7前的闭包不可以使用nonlocal。
3、&这样他就不可以对执行环境中的变量进行更改。
字典的使用:
1、&字典的删除:直接使用del&dict[k]可能会引发异常;首先判断k是否存在则效率有些低;使用异常使程序结构看起来不好。一个好的方法是pop(k,&default&v)。这个删除一个k项,并且返回。如果不存在返回默认的v。如果不加默认值,则会引发异常。
2、&直接使用字典下标获取字典的值可能会引发一场。使用get方法则不会,如果不存在会返回none。另外,还可以设置不存在的默认值。
3、&通过字典格式化字符串:print&&value&is&%(key)s&&%&kvdict
4、&items方法返回一个列表,列表中的元素是一个元组,第一个是key,第二个是value。比较好用的方法。
5、&iteritems:返回的是一个迭代器。如果想要迭代这个字典,iteritems会比items更高效一点。
6、&iterkeys则返回的是key的迭代器。keys返回的是key的list。
7、&values返回值的列表,itervalues返回的是vlaue的迭代器
8、&popitem会随机弹出(同时删除)一个项,则对于想要处理所有的元素,并且删除所有的元素是有帮助的。但是,如果没用元素的话,会抛出异常。
9、&viewitems,viewkeys,viewvalues:这三个函数返回的是一个view对象。这个类似于视图。分别表示(key,&value)pair的列表,key的列表,value的列表。一个优点是,如果字典发生变化,view会同步发生变化。在迭代过程中,字典不允许改变,否则会报异常。
10、&字典的键值比较规则:如果是内置类型(int,str,tuple),则是以他们的值作为键值;如果是自定义对象,则是以对象的地址作为键值。&&这一点没有完全证实。&&最新的发现:对象的比较,内置类型,是因为他们都重写了默认的object的__eq__等方法,所以可以比较内容。自定义对象,没有重写,所以,他们的比较可能会不一样。object默认的比较是什么?目前还不明确,后面再补充吧。可能就是地址(或者对象的唯一标识),而不是对象的内容。涉及到字典,它不是使用的单纯的比较,而是使用的__hash__,它返回的是一个hash值,字典就是根据这个hash只来散布对象的。
列表的使用:
1、&列表的删除:不可以在遍历的过程中删除链表,这样会得到不可预知的后果。可以使用列表的过滤,来获得新的列表。
2、&列表的过滤:
&&&&&&&&def&filterFun(node):#这个函数做了两个事情哎。
&&&&&&&&&&&&node.cycleCount&=&node.cycleCount&-&1
&&&&&&&&&&&&return&node.cycleCount&&&0
&&&&&&&&timeoutList&=&filter(filterFun,&timerList)
对timerList中的每个节点执行函数filterFun,根据filterFun返回的结果,为真的项组成一个新的列表。
3、&map:&kvlist&=&map(lambda&x:x.strip(),&kvlist)。同时,map可以接受多个列表,这个时候,函数也会接受多个参数,分别表示列表的每一个元素:kvlist&=&map(lambda&x,y:x+y,&[1,2,3],&[4,5,6])
如果函数为None,则相当于函数zip:
zip([1,2,3],&[4,5,6])
[(1,4),(2,5),(3,6)]
4、&生成器表达式:l&=&[node&for&node&in&xrange(5)&if&node&-&3&&&0]:这个的这个方法一定程度上可以替代过滤器和map。
生成器表达式定义:
[expr&for&iter_var&in&iterable&if&cond_expr]
l&=&[2&for&x&in&xrange(5)]#结果是生成一个含有5个2的列表
5、&print(reduce(lambda&x,y:&x*y,&[2&for&x&in&xrange(38)]))
上面的这个语句是计算2的38次方的值。它用到的是二元函数reduce。它第一次调用是将第一个和第二个元素做入参,后面用他们的结果做x,新的元素做y,最后返回值。
另外,在获取一个38个2的列表也可以使用:[2]&*&38。这可能更可读一点。
6、&enumerate:对列表处理,返回的是列表的索引以及节点。
&&&&&&&&for&index,&node&in&enumerate(timerList):
&&&&&&&&&&&&if&timerId&==&node.timerId&and&timerEvent&==&node.timerEvent:
&&&&&&&&&&&&&&&&del&timerList[index]
7、&列表的分片:[1,2,3,4],l[1:-1]表示从索引从1到倒数第一个,不包含倒数第一个。如果要从某位置到最后,则应该:[1:]
8、&l[i:j:k]:表示切片,从i到j,步长为k。
9、&l[i:j]:表示从i到j,不包括索引j。
1、&list自己提供了排序的函数:sort。
2、&sort的参数:
a)&cmp是一个比较函数,输入两个元素,比较大小,返回值为-1,0,1.
b)&key也是一个函数,入参为一个元素,返回这个元素的关键字。
c)&reverse是一个标志位,表示升序还是降序。默认False是升序,True表示降序。
3、使用key和reverse的性能,优于cmp函数。时间是cmp函数的一半。
迭代的使用:
1、&迭代比直接使用列表遍历效率根据高。比如字典的keys函数返回的列表,以及iterkeys返回的迭代器。
2、&reversed()&内建函数将返回一个反序访问的迭代器.参数必须为序列。
3、&enumerate:返回一个迭代器:有索引值。
4、&for&&eachLine&&in&&myFile&&替&换&&&for&&eachLine&&in&myFile.readlines()&:
5、&注意:在迭代的过程中不可以更改序列,否则会引发问题,导致迭代出错。
6、&可以自己定义一个类,可以迭代使用。不过需要定义方法:__iter__,next。
7、&filter(function,&iterable):可以对迭代使用过滤器。
生成器的使用:
1、&yield关键字可以阻塞住函数的执行,并且保存当前的执行环境,整个包被称为生成器。
2、&生成器可以通过调用生成器函数来创建。生成器函数是指包含关键字yield的函数。
3、&生成器可以通过.next()来执行。每调用一次,就执行代码,直到遇到yield关键字停止,并且返回yield关键字后面的表达式的值。
4、&可以通过调用send()函数来发送消息到生成器中。a&=&yield&l:表示将send的入参赋值给a。
5、&throw:允许客户端传入要抛出的任何异常。
6、&和throw相同,只不过是要抛出一个特定的异常:GeneratorExit。
7、&send只接受一个参数,但是可以通过传递元组的方式传递多个参数。
8、&类的方法也可以返回生成器,因为他本质上就是一个函数。
9、&在生成器使用的时候,如何获取它自身的send和nex函数?通过send二次传入是有些风险的,非常可能造成交叉引用,无法垃圾回收造成内存泄露。
10、&第一次,必须调用next来启动生成器。
装饰器的使用:
1、&装饰器本质上来说就是函数(或者是可调用对象),他们接受函数对象。装饰器仅仅用来装饰或者修饰函数的包装,返回一个修改后的函数对象,并将其赋值原来的标示符,并永久失去对原有函数的访问。
2、&什么是带参数的装饰器?其实就是一个函数,这个函数可以返回一个装饰器,同时这个函数可以接受参数。
3、&不带参数的装饰器要返回一个函数,这个函数就是用来替换原有的标示符的。
def&decofun(fun):
&&&&def&_mydeco(*args,&**kwargs):
&&&&&&&&print('before&fun!')
&&&&&&&&ret&=&fun(*args,&**kwargs)
&&&&&&&&print('after&fun',&ret)
&&&&&&&&return&ret
&&&&return&_mydeco#新的函数,用于替换原有标示符
def&funtest():#funtest被替换为decofun
&&&&print('now&in&funtest!')
&&&&return&1
4、&装饰器是可以重叠的,那么他们的顺序怎么样:
a)&@decofun2
b)&@decofun
c)&def&funtest():
d)&&&&&print('now&in&funtest!')
e)&&&&&return&1
f)&原理是,funtest首先被decofun包装,然后再被decofun2包装。也就是,调用的时候,首先调用的是最上面的装饰器(也就是decofun2)的函数前面部分,然后再调用decofun的函数前面部分,之后再调用funtest。funtest返回后,首先调用的是decofun的函数后面部分,再调用decofun2后面部分。类似于一个栈的结构。
5、&装饰器不要滥用。如果一个装饰器只用了一次,要考虑他存在的必要了。
6、&携带参数的装饰器:
7、&def&decoarg(arg):
a)&&&&&def&decofun3(fun):
b)&&&&&&&&&def&_mydeco(*args,&**kwargs):
c)&&&&&&&&&&&&&print('decoarg&before&fun!',&arg)
d)&&&&&&&&&&&&&ret&=&fun(*args,&**kwargs)
e)&&&&&&&&&&&&&print('decoarg&after&fun',&ret)
f)&&&&&&&&&&&&&return&ret
g)&&&&&&&&&return&_mydeco
h)&&&&&return&decofun3
8、&装饰器用到的一个最重要的技术,就是闭包。装饰器函数返回的其实就是一个闭包。
9、&装饰器也可以修饰类的__方法:
class&testc:
&&&&def&__init__(self):
&&&&&&&&self.i&=&1
&&&&@decoarg(1)
&&&&@decofun2
&&&&@decofun
&&&&def&__call__(self):
&&&&&&&&print('i&is&%d'&%&self.i)
注意:装饰器修饰类方法是无法被子类继承的(或者说子类的方法是没有被修饰的)。因为他本质上就是一个函数。
10、&装饰器也可以使对象,比如:
a)&class&obj:
b)&&&&&def&__init__(self,&fun):
c)&&&&&&&&&self.fun&=&fun
d)&&&&&&&&&
e)&&&&&def&__call__(self,&*args,&**kwargs):
f)&&&&&&&&&print('decofun&before&fun!',&args,&kwargs)
g)&&&&&&&&&ret&=&self.fun(*args,&**kwargs)
h)&&&&&&&&&print('decofun&after&fun',&ret)
i)&&&&&&&&&return&ret
j)&@objdeco
k)&def&funtest(a,&b=2):
l)&&&&&print('funtest1&a&,&b&=',&a,&b)
a)&这种方法看起来复杂了,但是可能会在有时候会比较有用。
11、&装饰器可以修饰类。这个时候装饰器接收的是一个类名,而返回的也是这个类名。它可以为这个类添加一些属性或者进行一些操作。
协程的使用:
1、&协程(coroutine)是一个可以挂起,回复,并且有多个进入点的函数。
XML的使用:
1、&处理xml消息包比较好用的模块是xml.etree.ElementTree。
2、&Element执行xml的根节点。
3、&elem.find(path):查找根节点下面路径为path的子节点。
4、&elem.findall(path):同样的子节点可能有多个,这里会返回一个列表。
5、&elem.findtext(path):获取指定路径子节点的内容,这个我们会经常使用。
6、&elem.get(key);获取属性的值。
7、&上面如果没用,则返回none
8、&elem.append:添加自节点。
9、&elem.tag:返回tag值,也就是name。
10、&elem.text:返回内容。
11、&elem.attrib:返回属性的字典。
12、&SubElement:生成一个节点,自动添加为父节点的子节点。
13、&tostring:转化为xml文本字符串。但是不包括xml头。如果编码方式为UTF-8或者GB2312,gb2312都会产生xml头;如果是utf-8,则不会产生xml头
14、&fromstring:从字符串转化为ElementTree对象。和XML同样的功能。
15、&elem.set();设置属性值
time的使用:
1、&time.sleep()函数函数具有c下sleep函数功能,单位为秒,但是可以接受浮点数。这样可以表示毫秒。
2、&ti&=&datetime.datetime.now()可以显示当前的时间,包括当前的微秒也可以显示出来。两个的差值可以表示时间&的间隔:microsecondLong&=&timeLong.seconds&*&1000000&+&timeLong.microseconds。差值的成员是seconds和microseconds
OO的使用:
1、&如果不想让成员变量或者方法被外部使用(也就是private特性),可以以__双下划线开通。
2、&属性不但可以定义在init中,也可以定义在任意的方法中通过self定义。不过最好在init中定义。
3、&Python也可以实现抽象基类,也就是接口
5、&__call__(魔法方法)可以将对象作为函数来调用。给它一个入参就可以。:4、&__str__属性可以将对象转换为字符串,也就是调用print(object)是会打印的字符串。
&&&&def&__call__(self,&protoVer):
&&&&&&&&return&api.protoModules[protoVer].TimeTicks(
&&&&&&&&&&&&(time.time()-self.birthday)*100
&&&&&&&&&&&&)
它的作用:比较常用的是作为回调,因为他可以保存状态信息。它和闭包类似,可能比闭包的可读性要好一点。
6、&对象实例是否可以删除?
7、&Python参考手册要好好看一下。
8、&python的static方法使用的是装饰器语法:@staticmethod.
9、&对类的调用还有一个方法:CALSS.method(object)。
10、&子类中,如果想调用父类的方法,可以通过:
parent.method(self).
不过还有更好的方法:
super(child,&self).foo()//注意:这里是根据子类的类型获取父类的方法。它的好处是不用明显给出基类的类型。
11、&cls:类方法的第一个参数。通常表示类的类型,可以通过cls()来生成实例。
a)&&&&@classmethod
b)&&&&&def&spawn(cls,&*args,&**kwargs):
c)&&&&&&&&&"""Return&a&new&:class:`Greenlet`&object,&scheduled&to&start.
e)&&&&&&&&&The&arguments&are&passed&to&:meth:`Greenlet.__init__`.
f)&&&&&&&&&"""
g)&&&&&&&&&g&=&cls(*args,&**kwargs)
h)&&&&&&&&&g.start()
i)&&&&&&&&&return&g
12、&继承,如果子类定义了__init__函数,子类的init函数不会默认调用父类的init函数,需要手动调用:parent.__init__。这一点是和c++有区别的。如果子类没有定义__init__,则子类会调用父类的__init__。这里可以发现,其实,子类如果定义了init函数,是对父类的init的一个覆盖。
13、&super注意:!!!它只能用在新式的类定义中。什么是新式的?原来只是基类定义时继承object!!!。
14、&继承如何继承方法:只要继承一个类,就会继承这个类所有的方法,包括__init__,__del__。但是如果子类重写某方法,就会覆盖父类的方法,不会再调用父类的方法了。如果想调用父类的方法,可以通过super的方式调用。
15、&继承如何继承属性:只要不覆盖父类__init__方法,或者调用了父类的__init__方法,就会继承父类__init__属性的方法。继承后也可以更改这些属性。
16、&父类如何防止被继承:方法或者属性以__开头,则可以防止被继承。
17、&根据我的经验,其实可以以一种本质的方式理解Python的继承:Python的类就是一些方法的集合,继承一个类就是继承这个类的所有的方法。如果在子类中定义一个方法,其实是更改了这个类的符号。而属性,则可以在所有的方法中定义,只要调用了定义属性的方法,调用父类,则是继承父类的属性,调用子类定义属性的方法,则是定义子类的方法。
18、&property:
a)&class&c(object):
b)&&&&&def&__init__(self):
c)&&&&&&&&&self._num&=&1
d)&&&&&@property
e)&&&&&def&num(self):
f)&&&&&&&&&return&self._num&*&10
g)&&&&&@num.setter
h)&&&&&def&num(self,&v):
i)&&&&&&&&&self._num&=&v
j)&&&&&@num.deleter
k)&&&&&def&num(self):
l)&&&&&&&&&pass
m)&o&=&c()
n)&print(o.num)
o)&o.num&=&20
p)&print(o.num)
q)&这样的好处是,可以在操作属性时,不用显示为方法调用,更加可读。同时又可以统一入口。:注意,它也必须继承object才可以。
19、&OO中的垃圾回收:Python的垃圾回收使用的是符号引用计数。那么,如果在一个函数中申请一个对象,然后返回它的一个属性或者方法,这个时候对象的符号引用已经去掉,对象是否会释放?
a)&class&child(parent):
b)&&&&&def&__init__(self):
c)&&&&&&&&&self.i&=&8888
d)&&&&&&&&&
e)&&&&&def&foo(self):
f)&&&&&&&&&print('-----------------------')
g)&&&&&&&&&
h)&&&&&def&__del__(self):
i)&&&&&&&&&print('now&in&del&child')
j)&&&&&&&&&super(child,&self).__del__()
第一种情况,返回的是属性
k)&def&refun():
l)&&&&&o&=&child()
m)&&&&&return&o.i
n)&I&=&refun()
o)&这个时候,对象o会马上释放。因为o.i其实就是一个对象的引用,和o没有关系
第二种情况,返回的是方法
a)&def&refun():
b)&&&&&o&=&child()
c)&&&&&return&o.foo
d)&foo&=&refun()
e)&这个时候,对象o要等到foo释放的时候再释放,因为foo中包含了o的引用(foo的入参self)
20、&对于对象的属性,如果属性是可读写的,则第一步没有必要用@property修饰。可以直接使用。后面如果有需要,在进行修饰。这样既减少了工作,修改时,也不会对原有代码进行改动。
模块的使用:
1、&如果不想将模块的某些函数和变量被别的模块使用,可以以单下划线开头。这样import&*是没有的,但是使用import&mode,然后mode._fun仍然可以调用。在class中是以双下划线开头的。
2、&使用from。。。import导入的符号,应该是本地符号,更改的话,无法更改模块中的值。可以通过mode.name=来修改。
3、&__init__.py的作用:可以这样理解:包也是一个对象,这个py就是这个包的构造函数。导入这个包,就会自动的执行__init__.py。如果在这个py中导入其他符号,import&这个包并且加*也会导入这个符号。
4、&import&*无法导入模块中以_开头的符号。但是,不用*是可以的。
5、&import的本质也是创建一个符号,指向一个对象的引用。这个符号和被import的模块的符号是没有关系的。和c的extern不一样。extern可以更改变量的值,但是,这在Python中是不可以的。
from&srctest&import&itest,&outitest,&setitest
import&srctest
#&itest&=&9#这个地方其实改变的是本模块中符号的引用,无法更改srctest中对应符号。
#srctest.itest&=&9#这个可以更改srctest中的itest
setitest(9)#这个可以更改srctest中的itest,但是改变不了当前模块的itest,也就是,这种设置是无法同步的。
print(itest)#打印当前模块的itest
printitest()#打印srctest中的itest
Python的设计哲学:看似不方便的背后,其实有Python的设计哲学。便捷性很多时候都是模块性的大敌。在软件开发中,模块间的最短路径未必是最合理路径,而且往往是最不合理路径。它会破坏软件原有的交互原则。
Python这样设计的理由应该是,尽量将数据和对数据的操作放在一起。如果数据会扩散,那么,就将数据设计为只读的。这样有助于提高程序模块的内聚性(全局变量是内聚性的大敌),降低耦合性。降低程序的复杂性(数据只读,调试根据方便)。
srctest.itest是可以改变itest的值的,说明我们可以通过改变这个对象的属性来改变对象(模块也是对象)。
可能有一点小题大做。
6、&两个模块不可以双向import。那万一两个模块都要互相调用对方怎么办?Python的设计哲学告诉你,这不是一个好的实践,所以这样不行。应该怎么弄?一个模块调用另外一个模块,如果被调用模块想调用调用模块的方法,通过回调的形式。这样可以保证,模块间的连接都是单向的。
日志的使用:
1、&日志的标准模块logging基本可以满足我的工作。
2、&设置log的初始化工作:
logging.basicConfig(
&&&&filename&=&"test.log",
&&&&format&=&"[%(asctime)s-%(levelname)s]&%(message)s&[%(filename)s,%(lineno)d]",
&&&&level&=&logging.INFO,
&&&&datefmt&=&"%F&%T")
3、&除此之外,一个比较强大的功能就是过滤功能:可以针对级别,文件,行号等等很多的东西进行过滤。
自省的使用:
1、&type()可以查看对象的类型。这就是自省。也就是可以看看自己是什么类型。这个功能在动态语言中非常有用。
2、&getattr函数:这是个非常有用的函数,它可以根据字符串,从模块,类,对象实例中获取属性和方法的应用并且调用。这个功能非常类似于c语言的函数指针,以及c++中的成员函数的指针。
1)从模块中获取函数和成员
import&testfun
tf&=&getattr(testfun,&'test')
tstr&=&getattr(testfun,&'str')
2)从类中获取属性和方法
class&test():
&&&&&&&&def&__init__(self):
&&&&&&&&self.abc&=&1
&&&&&&def&method(self):
&&&&&&&&print('in&test.method',&self)
&&&&&&def&__test(self):
&&&&&&&&print('in&test')
tm&=&getattr(test,&'method&)#获取类方法method函数指针。因为没有实例,所以调用必须用下面的方法:
t&=&test()
tm(t)#申请一个实例,并且作为第一个参数传进去。
tm&=&getattr(test,&'__test&)#这里会报错,也就是无法获取私有方法。
tabc&=&getattr(test,&'abc&)#这是错误的。无法获取。
ttst&=&getattr(test,&'tst&)#这是可以的。。
3)从对象实例中获取属性和方法
t&=&test()
tm&=&getattr(t,&'method')
&tm()#可以这样调用,而不用传入t实例。
tabc&=&getattr(test,&'abc&)#可以获取实例的属性。
3、&callable:函数表示某个对象是否可以调用。它和getattr结合起来,可以获取一个对象中的所有的method列表:
methods&=&[method&for&method&in&dir[object]&if&callable(getattr(object,&method))]
4、&自省也叫放射。
5、&exec(&print&&test&&):可以执行字符串代码。这个特性有助于动态执行代码,可以用于机器学习,自动生成代码。
exec的参数可以使一个打开的文件对象,string,code&object。
code&object可以通过函数
类似的方法:execfile(filename[,&globals[,&locals]])。
6、&可以更改类的方法,将它指向一个新的方法。如下:
a)&class&ctest():
b)&&&&&def&test(self):
c)&&&&&&&&&print('c&test&test')
d)&def&testfun():
e)&&&&&print('test&fun&!')
f)&c&=&ctest()
g)&c.test&=&testfun
h)&c.test()
对象c的方法test被替换为新的方法:testfun。这个特性有助于根据动态的代码实现,但是往往会增加代码的透明性。
类似的,setattr也可以实现这样的功能。delattr可以删除属性。
setattr(c,&'test',&testfun)
delattr(c,&'test')
c.test()#这里调用的其实就是ctest的test方法。也就是说,delattr会首先删除setattr设置的属性,如果在调用一次delattr,才会删除c的test方法。但是如果多调用几次setattr,也只要调用一次delattr即可删除。所以,要删除一个方法,最多调用两次delattr。
这个特性可以用于动态更改代码。也可用于补丁。
setattr无法对Python的c扩展模块进行操作。
7、&如何判断一个变量是否存在:
&v&&in&dir()
&v&&in&locals.key()
配置文件读取的使用:
1、&使用模块ConfigParser。实例如下:
conf&=&ConfigParser()
conf.read("snmp_agent.ini")
print(conf.get("main",&"log_level"))
print(conf.getint("main",&"ne_agent_port"))
print(conf.get("main",&"ne_agent_qip"))
异常的使用:
1、&尽量少用。它会使程序难以理解,而且还会发生不可预知的情况,比如异常的发生使程序的状态变为一个未知状态。
2、&可以寻找替代方案。
3、&程序非常重要,不可以停止,可以在主循环包装在异常处理中运行。
4、&打印出异常的信息,供后面的定位:log.error(traceback.format_exc())
5、&raise在引发异常的时候,可以传递引发一场的额外数据。形式如下:
raise&Exception,&1
捕获方法:
except&CallExit,&e:
e就是那个额外数据1。(但是奇怪的是它的类型不是1)
6、&如何捕获一个异常,进行处理,然后在把它抛出:
&&&&except&:
&&&&&&&&for&flet&in&fletList:
&&&&&&&&&&&&flet.throw()
&&&&&&&&info&=&sys.exc_info()
&&&&&&&&raise&info[0],&info[1],&info[2]
7、&如何使用异常才是Pythonic的做法?这个要看一下。
1、&类型也是对象。比如:inttype&=&int,然后,n&=&inttype(&256&),这样可以把字符串转化为int值。
2、&另外,是否可以把字符串转化为关键字,或者对象?比如,一个变量,abc,是否可以通过&abc&来引用?
os中有很多可以直接利用的东西,比如,判断文件是否存在,删除文件等。这样可以不用再执行shell命令。
os.rremove(path):删除文件
os.system(&ls&);执行shell命令
文件的使用
1、&打开使用函数open,模式和linux&c类似。有一个不同的地方时,可以选择,直接操作磁盘还是操作内存。
2、&readline可以读取一个文件的一行。
3、&readlines:返回每一个列的列表。对应writelines。
4、&文件迭代器:
f&=&open(&fliename&)
for&line&in&f:
&&&&process(line)
或者更简洁的:
for&line&in&open(filename):
process(line)
5、&文件迭代器的使用:
如果文件很大,readlines可能会占用过多的内存。所以,Python提出一种类似于惰性求值的惰性迭代。
有两种方案:fileinput和文件迭代器:
import&fileinput
for&line&in&fileinput.input(filename)
process(line)
文件迭代器:
f&=&open(filename)
for&line&in&f:
process(line)
6、&如何判断文件是否存在:
os.path.isfile('/home/keepshell')
os.path.exists('/home/keepshell')
7、&如何判断目录是否存在:
os.path.isdir('/home')
os.path.exists('/home')
数据库的使用
1、&数据库中的字段使用的utf8格式编码,但是读取出来却是问号。这个问题的解决可以通过在查询的时候指定编码方式来解决,只要执行sql语句:Query_Execsql(pdb,&"SET&NAMES&'utf8'");
注意,这个需要在连接后马上进行。并且,在其他的操作中,会一直使用这种编码。除非再次更改。
2、&fetchone():返回一条记录。fetchall():返回所有的记录。
3、&可以使用一个简单的方法获取所有的记录:
cur.execute(sql)
for&tel,&name,&pwd&in&cur:
&&&&print&tel,&name,&pwd
Python的标准模块ftplib就可以支持FTP。
几个函数:
FTP(host='',&user='',&passwd='',&acct='',&&&&&&&&&&&&&&&timeout=_GLOBAL_DEFAULT_TIMEOUT):如果参数中有user,则Connect();如果同时也有user,则login()。如果没用这些参数,后要自己调用connect和login。
connect(self,&host='',&port=0,&timeout=-999):如果端口不是标准端口,则要手动调用connect。
login(user&=&'',&passwd&=&'',&acct&=&''):登陆。
pwd():获得当前的工作路径。
cwd(path):更改当前的工作路径。
dir(path,cb):显示目录中的内容。cb为文件的处理函数。会传递给retrlines。这个函数可以获取一个目录下的所有的内容。
retrlines(self,&cmd,&callback&=&None):下载文本文件。cmd的形式为&RETR&FILENAME&,callback是一个函数,要处理文本文件的每一个行。这里一个问题,如果直接用file的write方法,则会丢失换行符。而又没有writeline函数。
retrbinary(self,&cmd,&callback,&blocksize=8192,&rest=None):下载二进制文件,cmd的形式为&RETR&FILENAME&,callback是一个函数,要处理文本文件的每一个块。默认大小事8k,但是可以更改。
storlines(self,&cmd,&fp,&callback=None):上传文本文件。cmd的形式为&STOR&FILENAME&。fp是一个文件对象,必须有readline方法。callback:每传送一行,就会调用这个函数。
storbinary(self,&cmd,&fp,&blocksize=8192,&callback=None,&rest=None):&上传二进制文件。cmd的形式为&STOR&FILENAME&。fp是一个文件对象,必须有read(num_bytes)方法。默认大小事8k,但是可以更改。
quit():退出。
字节的使用
1、&ord:可以见字符转化为int类型的值。
2、&chr:ord的方向操作。可以见int类型值转换为字符。
字符编码的使用
1、&encode是将Unicode转化为str,decode是将字符串转化为Unicode。所以,一个字符串要转化为另一种格式可以:
s&=&&中文&
s.decode(fromcodec).encode(tocodec)
也可以直接使用:s.encode(tocodec)。这个时候,相当于默认调用了decode,并且使用的是默认的编码方式。
1、&Python代码如果直接发布,可能会暴露源码。
2、&一个方法是利用c扩展Python,来代替核心模块。
3、&另一个折中的方法就是对源码进行编译,生成pyc或者pyo文件。这些事字节码文件。可能会被反编译。所以,可能需要研究一下Python的pyo生成和加载方式,来生成更安全的Python字节码。网上说可以修改Python源码的opcode。没有研究过。
4、&命令:python&-m&compileall。
5、&也可以在Python中使用:
a)&import&compileall
c)&compileall._dir('Lib/',&force=True)
e)&#&Perform&same&compilation,&excluding&files&in&.svn&directories.
f)&import&re
g)&compileall._dir('Lib/',&rx=re.compile('/[.]svn'),&force=True)
1、&OO中的垃圾回收:Python的垃圾回收使用的是符号引用计数。那么,如果在一个函数中申请一个对象,然后返回它的一个属性或者方法,这个时候对象的符号引用已经去掉,对象是否会释放?
a)&class&child(parent):
b)&&&&&def&__init__(self):
c)&&&&&&&&&self.i&=&8888
d)&&&&&&&&&
e)&&&&&def&foo(self):
f)&&&&&&&&&print('-----------------------')
g)&&&&&&&&&
h)&&&&&def&__del__(self):
i)&&&&&&&&&print('now&in&del&child')
j)&&&&&&&&&super(child,&self).__del__()
第一种情况,返回的是属性
k)&def&refun():
l)&&&&&o&=&child()
m)&&&&&return&o.i
n)&I&=&refun()
o)&这个时候,对象o会马上释放。因为o.i其实就是一个对象的引用,和o没有关系
第二种情况,返回的是方法
f)&def&refun():
g)&&&&&o&=&child()
h)&&&&&return&o.foo
i)&foo&=&refun()
j)&这个时候,对象o要等到foo释放的时候再释放,因为foo中包含了o的引用(foo的入参self)
2、&如果两个对象交叉引用,是否会自动回收?不会。同样,如果一个对象把生成的对象赋值给它自身的一个属性,那么它也不会自动回收。
1、&可以使用swig来创建c&的扩展程序,非常方便。目前没有时间研究内部机制,先暂时使用,后面在研究吧。
2、&swig使用步骤:为库的头文件建立.i文件:
/*&Includes&the&header&in&the&wrapper&code&*/
#include&"code.h"
#include&"sip.h"
/*&Parse&the&header&file&to&generate&wrappers&*/
%include&"code.h"
%include&"sip.h"
3、&使用swig命令生成py脚本及对应的C文件:swig&&python&sip.i。
4、&将生成的c源文件放到c扩展库中进行编译。
5、&这里有一个要注意:生成的动态链接库,必须是_sip.so,否则无法调用。swig是写死的。_sip.so需要拷贝到:&/usr/local/lib/python2.7/site-packages/路径下。
6、&Makefile文件中,对于库引用的其他的库,必须显示的指出,否则Python无法找到对应的库。
7、&如何在c的扩展库中调用Python的函数:
swig是不支持直接在c的扩展库中调用Python函数的。它只支持将C的接口作为回调函数设置给c的库。
实现这个功能需要利用Python的c&API和ctypes来实现。
Python&c&的api包含一系列的函数:
PyCallable_Check:检查对象是否可调用;
PyArg_ParseTuple:解析参数列表,将Python参数解析为c;
PyEval_CallObject:调用对象;
Py_BuildValue:将c变量打包为Python的参数对象。
好了,有这些就足够了。
假设c库中有一个设置回调函数接口:
void&set_callback_fun(void&(*fun)(int,&int&,&int))
下面是c扩展库中要添加的代码:
//全局变量,保存Python中要回调的可调用对象。
static&PyObject&*gCallbackFun&=&NULL;
//调用上面函数设置的python脚本函数
//Python可调用对象的转换函数,转化为C的调用方式
static&void&callbacfun(int&type,int&chn,int&dataType)
&&&&PyObject*&pArgs&=&NULL;
&&&&PyObject*&pRetVal&=&NULL;
&&&&int&&&&nRetVal&=&0;
&&&&pArgs&=&Py_BuildValue("(i,&i,&i)",&type,&chn,&dataType);//将c的参数转化为Python的参数对象
&&&&pRetVal&=&PyEval_CallObject(gCallbackFun,&pArgs);//调用Python的可调用对象。
&&&&Py_DECREF(pArgs);
&&&&Py_DECREF(pRetVal);
///&set_callback_fun函数的包装函数
static&PyObject&*wrap_set_callback_fun(PyObject&*dummy,&PyObject&*args)
&&&&PyObject&*temp&=&NULL;
&&&&if&(PyArg_ParseTuple(args,&"O:set_callback_fun",&&temp))&{//获取Python对象
&&&&&&&&if&(!PyCallable_Check(temp))&{//检查对象是否可以调用
&&&&&&&&&&&&PyErr_SetString(PyExc_TypeError,&"parameter&must&be&callable");
&&&&Py_XINCREF(temp);&&&&&&&&&/*&Add&a&reference&to&new&callback&*/
&&&&Py_XDECREF(gCallbackFun);&/*&Dispose&of&previous&callback&*/
&&&&gCallbackFun&=&&&&&&&&/*&保存回调对象&*/
&&&&set_callback_fun(callbacfun);//注意,这里掉一下包,用一个C的函数注册到c库中。
&&&&return&Py_BuildValue("i",&(gCallbackFun&==&NULL)&?&0&:&1);
注意:如果对象不可调用,会段错误。后面要解决一下。
Python代码:
CBFUNC&&=&CFUNCTYPE(c_int,&c_int,&c_int,&c_int)//创建一个c函数类型的对象工厂,该函数返回值为int,有三个入参,都为int。
callbakFunc&=&CBFUNC(pyFun)//根据Python可调用对象生成函数。
set_callback_fun(callbakFunc)//设置回调函数
注意:pyFun必须要有返回值。否则会报异常。
另外,我发现,不用CFUNCTYPE来生产c回调函数,直接用pyFun,也是可以的。至于区别,后面在研究一下吧,要写代码了。
&& 几个异常问题:1、一个可以使用CFUNCTYPE,但是一个一使用它就段错误。2、回调函数可以不返回值,也是可以的。但是一个不返回就不可以。
在Python中使用c扩展时向C传递数组:
8、&如果一个函数的参数是一个数组(指针),Python如何传递?下面的方法是可以直接传递列表。把这个加到.i文件中。
static&int&convert_darray(PyObject&*input,&int&*ptr,&int&size)&{
&&if&(!PySequence_Check(input))&{
&&&&&&PyErr_SetString(PyExc_TypeError,"Expecting&a&sequence");
&&&&&&return&0;
&&if&(PyObject_Length(input)&!=&size)&{
&&&&&&PyErr_SetString(PyExc_ValueError,"Sequence&size&mismatch");
&&&&&&return&0;
&&for&(i&=0;&i&&&&i++)&{
&&&&&&PyObject&*o&=&PySequence_GetItem(input,i);
&&&&&&if&(!PyFloat_Check(o))&{
&&&&&&&&&Py_XDECREF(o);
&&&&&&&&&PyErr_SetString(PyExc_ValueError,"Expecting&a&sequence&of&floats");
&&&&&&&&&return&0;
&&&&&&ptr[i]&=&PyFloat_AsDouble(o);
&&&&&&Py_DECREF(o);
&&return&1;
%typemap(in)&int&[ANY](int&temp[$1_dim0])&{
&&&if&(!convert_darray($input,temp,$1_dim0))&{
&&&&&&return&NULL;
&&&$1&=&&temp[0];
9、&如果一个结构体中有一个int类型数组,应该如何赋值?
在.i中增加下面代码:
%include&"carrays.i"
%array_class(int,&intArray);
在Python中申请数组:
a&=&intArray(10),将A复制给数组成员即可。
代码错误检查
1、&今天遇到两个问题:
a)&类中方法:class&_registerEvent(notifyEvent):&def&_sendRegRsp(self,&voiceres,&reqId,&result,&reason,status):,调用时参数个数少一个:self._sendRegRsp(voiceres,&reqId,&'success',&'normal')&&&。结果是没有任何提示,并且,不知道调用了什么函数。这个问题有点匪夷所思。后面好好查看一下。
b)&抽取函数后,有时忘了返回值,当时却用到了返回值:
i.&def&createWirelessSdp(voiceRtpPort,&voiceTbcpPort):
ii.&&&&&voicesdp&=&SIP_SDP()
iii.&&&&&voicesdp.a_use&=&1
iv.&sdp&=&createWirelessSdp()
v.&结果也是没有任何提示,sdp为None。
2、&总结:写Python代码,需要使用代码检查工具,比如,pylint等。后面引进一下。
1、&如何获取命令行参数:
a)&import&sys&
c)&print(sys.argv[1])
d)&sys.argv[1]就是第一个参数。0是脚本的名称。
1、&timeit:可以统计程序的运行时间。目前没有时间,抽时间好好看看。
timeit(cut1,&number=10000):cut1是函数名,number是执行次数。
2、&pypy可以将Python代码翻译为可执行程序,它的效率可以提高4倍左右。但是,内存的占用可能会很大。(没有试过。)
1、&脚本语言的进程名称显示为:python&,如果一个服务器上有多个进程,那么将不易发现那个进程是哪个程序。可以使用第三方开源的库来解决这个问题:setproctitle.
from&setproctitle&import&setproctitle,getproctitle
print('当前的进程名:%s'&%&getproctitle())
setproctitle('proctitle')
print('设置后的的进程名:%s'&%&getproctitle())
2、&with语法:with&open(&file&,&&r&)&as&f:
可以是try的另一种形式。
可以执行with操作的类型:
decimal.Context&
thread.LockType&
threading.Lock&
threading.RLock&
threading.Condition&
threading.Semaphore&
threading.BoundedSemaphore
3、&产生随机数:random.randint(9999)
4、&回调函数的使用:设置回调函数的时候,很多时候要使用闭包。避免闭包的一个方法是:
a)&def&setCancelFun(cancelFun,&*args,&**kwargs):
b)&&&&&'''如果为None表示删除取消函数,&后面跟的是cancel函数的参数。这样可以避免上面创建闭包。'''
c)&&&&&global&_cancelFun,_cancelArgs,_cancelKwargs
d)&&&&&_cancelFun&=&cancelFun
e)&&&&&_cancelArgs&=&args&
f)&&&&&_cancelKwargs&=&kwargs&
h)&def&__execCancelFun():
i)&&&&&'执行取消操作。因为在throw和kill的时候会执行此函数,所以,暂时没有看到会在外面调用此函数。屏蔽后,接口的简单性会提高'
j)&&&&&global&_cancelFun,_cancelArgs,_cancelKwargs
k)&&&&&if&callable(_cancelFun):
l)&&&&&&&&&_cancelFun(*_cancelArgs,&**_cancelKwargs)
m)&&&&&&&&&_cancelFun&=&None#防止重复调用
o)&def&test(a,&b,&c):
p)&&&&&print('--------test:',&a,b,c)
r)&setCancelFun(test,&1,&2,&3)
s)&__execCancelFun()
也就是增加可变参数。
Python:一切皆符号?
阅读(...) 评论()}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信