python知识补全
一些易忘知识点
list.extend()
描述
extend() 函数用于在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)。
语法
extend()方法语法:
list.extend(seq)
参数
- seq – 元素列表。
返回值
该方法没有返回值,但会在已存在的列表中添加新的列表内容。
实例
以下实例展示了 extend()函数的使用方法:
#!/usr/bin/python aList = [123, ‘xyz’, ‘zara’, ‘abc’, 123]; bList = [2009, ‘manni’]; aList.extend(bList) print “Extended List : “, aList ;
以上实例输出结果如下:
Extended List : [123, ‘xyz’, ‘zara’, ‘abc’, 123, 2009, ‘manni’]
numpy.tile()
numpy.tile()是个什么函数呢,说白了,就是把数组沿各个方向复制
比如 a = np.array([0,1,2]), np.tile(a,(2,1))就是把a先沿x轴(就这样称呼吧)复制1倍,即没有复制,仍然是 [0,1,2]。 再把结果沿y方向复制2倍,即最终得到
array([[0,1,2],
[0,1,2]])
列表去重
list(set([a,a,a,b,b,c]))
collections.Counter()
可以快速统计词频。
1 | #统计词频 |
1 | from collections import Counter |
1. Python基础
字符串与编码
编码
在最新的Python 3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言,例如:
print(‘包含中文的str’)
包含中文的str
对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:
>>> ord(‘A’)
65
>>> ord(‘中’)
20013
>>> chr(66)
‘B’
>>> chr(25991)
‘文’
格式化
在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下:
‘Hello, %s’ % ‘world’’Hello, world’
‘Hi, %s, you have $%d.’ % (‘Michael’, 1000000)’Hi, Michael, you have $1000000.’
你如果只有一个%?,括号可以省略。
常见的占位符有:
占位符 | 替换内容 |
---|---|
%d | 整数 |
%f | 浮点数 |
%s | 字符串 |
%x | 十六进制整数 |
如果你不太确定应该用什么,%s永远起作用,它会把任何数据类型转换为字符串:
‘Age: %s. Gender: %s’ % (25, True)
‘Age: 25. Gender: True’
有些时候,字符串里面的%是一个普通字符怎么办?这个时候就需要转义,用%%来表示一个%:
‘growth rate: %d %%’ % 7
‘growth rate: 7 %’
format()
另一种格式化字符串的方法是使用字符串的format()方法,它会用传入的参数依次替换字符串内的占位符{0}、{1}……,不过这种方式写起来比%要麻烦得多:
‘Hello, {0}, 成绩提升了 {1:.1f}%’.format(‘小明’, 17.125)
‘Hello, 小明, 成绩提升了 17.1%’
f-string
最后一种格式化字符串的方法是使用以f开头的字符串,称之为f-string,它和普通字符串不同之处在于,字符串如果包含{xxx},就会以对应的变量替换:
r = 2.5>>> s = 3.14 * r ** 2
print(f’The area of a circle with radius {r} is {s:.2f}’)
The area of a circle with radius 2.5 is 19.62
上述代码中,{r}被变量r的值替换,{s:.2f}被变量s的值替换,并且:后面的.2f指定了格式化参数(即保留两位小数),因此,{s:.2f}的替换结果是19.62。
List and tuple
list
如果要取最后一个元素,除了计算索引位置外,还可以用-1做索引,直接获取最后一个元素:
classmates[-1]’Tracy’
list是一个可变的有序表,所以,可以往list中追加元素到末尾:
classmates.append(‘Adam’)
classmates
[‘Michael’, ‘Bob’, ‘Tracy’, ‘Adam’]
也可以把元素插入到指定的位置,比如索引号为1的位置:
classmates.insert(1, ‘Jack’)
classmates
[‘Michael’, ‘Jack’, ‘Bob’, ‘Tracy’, ‘Adam’]
要删除list末尾的元素,用pop()方法:
classmates.pop()
‘Adam’
classmates
[‘Michael’, ‘Jack’, ‘Bob’, ‘Tracy’]
要删除指定位置的元素,用pop(i)方法,其中i是索引位置:
classmates.pop(1)
‘Jack’
classmates
[‘Michael’, ‘Bob’, ‘Tracy’]
要把某个元素替换成别的元素,可以直接赋值给对应的索引位置:
classmates[1] = ‘Sarah’
classmates
[‘Michael’, ‘Sarah’, ‘Tracy’]
list里面的元素的数据类型也可以不同,比如:
L = [‘Apple’, 123, True]
list元素也可以是另一个list,比如:
s = [‘python’, ‘java’, [‘asp’, ‘php’], ‘scheme’]
len(s)4
要注意s只有4个元素,其中s[2]又是一个list,如果拆开写就更容易理解了:
p = [‘asp’, ‘php’]
s = [‘python’, ‘java’, p, ‘scheme’]
要拿到’php’可以写p[1]或者s[2][1],因此s可以看成是一个二维数组
Tuple
tuple一旦初始化就不能修改,也没有append(),insert()这样的方法。其他获取元素的方法和list是一样的
只有1个元素的tuple定义时必须加一个逗号,,来消除歧义:
t = (1,)
t
(1,)
条件判断
if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
else:
<执行3>
循环
range能生成0到n的数列
break语句可以在循环过程中直接退出循环,而continue语句可以提前结束本轮循环,并直接开始下一轮循环。这两个语句通常都必须配合if语句使用。
要特别注意,不要滥用break和continue语句。break和continue会造成代码执行逻辑分叉过多,容易出错。大多数循环并不需要用到break和continue语句,上面的两个例子,都可以通过改写循环条件或者修改循环逻辑,去掉break和continue语句。
dict和set
**dict **
如果key不存在,dict就会报错:
d[‘Thomas’]
Traceback (most recent call last):
File ““, line 1, in
KeyError: ‘Thomas’
要避免key不存在的错误,有两种办法,一是通过in判断key是否存在:
‘Thomas’ in d
False
二是通过dict提供的get()方法,如果key不存在,可以返回None,或者自己指定的value:
d.get(‘Thomas’)
d.get(‘Thomas’, -1)
-1
注意:返回None的时候Python的交互环境不显示结果。
要删除一个key,用pop(key)方法,对应的value也会从dict中删除:
d.pop(‘Bob’)75
d
{‘Michael’: 95, ‘Tracy’: 85}
set
重复元素在set中自动被过滤:
s = set([1, 1, 2, 2, 3, 3])
s
{1, 2, 3}
通过add(key)方法可以添加元素到set中,可以重复添加,但不会有效果:
s.add(4)
s
{1, 2, 3, 4}
通过remove(key)方法可以删除元素:
s.remove(4)
s
{1, 2, 3}
set可以看成数学意义上的无序和无重复元素的集合,因此,两个set可以做数学意义上的交集、并集等操作:
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
s1 & s2
{2, 3}
s1 | s2
{1, 2, 3, 4}
2. 函数
if not isinstance(x, (int, float)):
isinstance可以判断A和B是否一致,或者A是否在B元组中
返回多个值
函数可以返回多个值吗?答案是肯定的。
比如在游戏中经常需要从一个点移动到另一个点,给出坐标、位移和角度,就可以计算出新的坐标:
import math
def move(x, y, step, angle=0):
nx = x + step * math.cos(angle)
ny = y - step * math.sin(angle)
return nx, ny
import math语句表示导入math包,并允许后续代码引用math包里的sin、cos等函数。
然后,我们就可以同时获得返回值:
x, y = move(100, 100, 60, math.pi / 6)
print(x, y)
151.96152422706632 70.0
但其实这只是一种假象,Python函数返回的仍然是单一值:
r = move(100, 100, 60, math.pi / 6)
print(r)
(151.96152422706632, 70.0)
原来返回值是一个tuple!但是,在语法上,返回一个tuple可以省略括号,而多个变量可以同时接收一个tuple,按位置赋给对应的值,所以,Python的函数返回多值其实就是返回一个tuple,但写起来更方便。
函数的参数
内容太多,参见
默认参数
1 | def power(x, n=2): |
默认参数可以简化函数的调用。设置默认参数时,有几点要注意:
一是必选参数在前,默认参数在后,否则Python的解释器会报错(思考一下为什么默认参数不能放在必选参数前面);
二是如何设置默认参数。
当函数有多个参数时,把变化大的参数放前面,变化小的参数放后面。变化小的参数就可以作为默认参数。
使用默认参数有什么好处?最大的好处是能降低调用函数的难度。
默认参数很有用,但使用不当,也会掉坑里。默认参数有个最大的坑,演示如下:
先定义一个函数,传入一个list,添加一个END再返回:
def add_end(L=[]):
L.append(‘END’)
return L
当你正常调用时,结果似乎不错:
add_end([1, 2, 3])
[1, 2, 3, ‘END’]
add_end([‘x’, ‘y’, ‘z’])
[‘x’, ‘y’, ‘z’, ‘END’]
当你使用默认参数调用时,一开始结果也是对的:
add_end()
[‘END’]
但是,再次调用add_end()时,结果就不对了:
add_end()
[‘END’, ‘END’]
add_end()
[‘END’, ‘END’, ‘END’]
很多初学者很疑惑,默认参数是[],但是函数似乎每次都“记住了”上次添加了’END’后的list。
原因解释如下:
Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。
定义默认参数要牢记一点:默认参数必须指向不变对象!
要修改上面的例子,我们可以用None这个不变对象来实现:
1 | def add_end(L=None): |
可变参数
*参数为可变参数 用来传入N个参数
我们把函数的参数改为可变参数:
def calc(numbers):
sum = 0
for n in numbers:
sum = sum + n * n return sum
定义可变参数和定义一个list或tuple参数相比,仅仅在参数前面加了一个号。在函数内部,参数numbers接收到的是一个tuple,因此,函数代码完全不变。但是,调用该函数时,可以传入任意个参数,包括0个参数:
calc(1, 2)
5
calc()
0
如果已经有一个list或者tuple,要调用一个可变参数怎么办?可以这样做:
nums = [1, 2, 3]
calc(nums[0], nums[1], nums[2]) 14
这种写法当然是可行的,问题是太繁琐,所以Python允许你在list或tuple前面加一个*号,把list或tuple的元素变成可变参数传进去:
nums = [1, 2, 3]
calc(*nums)
14
*nums表示把nums这个list的所有元素作为可变参数传进去。这种写法相当有用,而且很常见。
关键字参数
**参数为关键字参数,用来传入字典
1 | 可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。请看示例: |
命名关键字参数
对于关键字参数,函数的调用者可以传入任意不受限制的关键字参数。至于到底传入了哪些,就需要在函数内部通过kw检查。
仍以person()函数为例,我们希望检查是否有city和job参数:
1 | def person(name, age, **kw): |
参数组合
1 | 参数组合 |
高级语言特性
切片
https://www.liaoxuefeng.com/wiki/1016959663602400/1017269965565856