首席执行官在本文中注明将介绍多少列Python列,并且数据集与相关数据集有关。我希望这对每个人都会有所帮助。让我们来看看。
本文目录清单:
1.计数Python中的问题2. Python基本数据结构:序列,映射,集合,集合3. Python Panda统计数据中有多少个数据类型。有几个数量的Python数据,weeke open('datafile')作为f:
线= f.Readlines()
lines = [str(l.split())-l.split()。count('nan'))+''+l in Lines中的l]
以F1的方式开放('newfile','w'):
F1.Writelines(线)
它可以在Linux下使用:
awk'{k = 0;对于(i = 0; i = nf; i ++)if($ i ==“ nan”)k ++;Proprint NF-K,$ 0}'DataFile Newfile
参考资料:
Python中的常见数据结构可以集体称为容器。序列(例如列表和金属组),映射(例如字典)和收集(集合)是三个主要容器。
1.序列(列表,元组和字符串)
序列中的每个元素都有其自己的数字。在Python中有6个构建 - 中的序列。列表和元组是最常见的类型。其他人包括字符串,Unicode String,Buffer Object和Xrange对象。以下内容集中在列表上,元组和字符串。
1.列表
列表是可变的。这是区分弦和乌龟群的最重要功能。总而言之,可以修改列表,字符串和元组不能。
(1)创建
可以通过以下方式创建列表:
输出:
['你好世界']
[1,2,3]
可以看出,创建方法与JavaScript中的数组非常相似。
(2)列表功能
通过列表函数(实际列表函数而不是函数)创建字符串创建列表非常有效:
输出:
['你好']
2,结构组
第一组与列表相同,也是一个序列。唯一的区别是元组无法修改(字符串实际上具有此特征)。
(1)创建
输出:
(1,2,3)('jeffreyzhao','cnblogs')(1,2,3,4)(1,)
从上面我们可以分析:
a,逗号与某些值分开,并且会自动创建元组;
B.小组中的大多数时间都是通过括号来包括的;
C.空元组可以由无需内容的括号表示;
D.必须添加一个值的值的一个值(,);
(2)元组功能
元组函数和序列的列表函数几乎相同:序列(注意序列)用作参数并将其转换为元组。如果参数甚至在元组中,则参数将返回到一样的方法:
输出:
(1,2,3)
('j','e','f','f')
(1,2,3)
Trackback(最近的最新电话):
文件“ f:python est.py”,第7行,in,in
T4 =元组(123)
TypeError:'int
3.字符串
(1)创造
输出:
你好世界德
H
H
e
l
l
o
w
o
r
l
d
(2)格式化
格式 ():
打印
print(‘{}写这本书时{}年龄{}年龄’。格式(名称,年龄))
打印
#由于浮点“ 0.333”保留了小数点之后的三个位置
打印('{0:.3f}’。格式(1.0/3))
结果:0.333
#使用下一行以填充文本并将文本保持在中间位置
#使用^定义‘_____hello ______’'长度为11
打印(‘{0: ^_11}’。格式('Hello’))
结果:_____你好______
%::
格式运算符的正确操作号码可能是什么。如果是金属组或映射类型(例如字典),则字符串的格式将不同。
输出:
你好,世界德
你好,世界德
注意:如果需要转换的元组是转换表达式的一部分,则必须将其包括在括号中:
输出:
Trackback(最近的最新电话):
文件“ f:python est.py”,第2行,in,in
str1 ='%s,%s'%'你好','world'
Typerror:不为格式字符串的Enogh参数
如果您需要输出特殊角色,毫无疑问,我们会想到公义,但是Python中的正确处理方法如下:
输出:100%
格式化数字,输出的宽度和准确性通常需要控制输出:
输出:
3.14
3.141593
3.14
字符串的格式还包含许多其他丰富的转换类型,可以参考官方文档。
4.一般序列操作(方法)
从列表中,元组和字符串可以在序列中“抽象”一些公共通用方法(不是您想象中的crud),这些操作包括:索引,切片,添加(添加),乘以乘以乘以乘法),并检查某个元素是否元素属于序列。此外,有内部设置,例如计算序列长度,最大和最小元素。
(1)索引
输出
H
2
345
从0(从左到右)开始,所有序列都可以以这种方式索引。什么是神奇的,索引可以从最后一个位置开始(从右向左),数字为-1:1:
输出:
o
3
123
(2)大小
碎片操作用于访问特定范围内的元素。两个通过结肠碎片隔开的索引:
输出:
[0、1、2、3、4、5、5、6、7、8、8、9]
[1,2,3,4]
[6、7、8、9]
[1、2、3、4、5、6、7、7、8、8、9]
[7,8]
[7,8,9]
不同的步骤具有不同的输出:
输出:
[0、1、2、3、4、5、5、6、7、8、8、9]
[0、1、2、3、4、5、5、6、7、8、8、9]
[0,2,4,6,8]
[0,3,6,9]
[]
(3)序列添加
输出:
你好世界德
[1,2,3,2,3,4]
Trackback(最近的最新电话):
文件“ f:python est.py”,第7行,in,in
打印str1+num1
Typerror:无法许着“ str”和“列表”对象
(4)乘法
输出:
[无,无,无,无,无,无,无,无,无]
你好你好
[1,2,1,2]
Trackback(最近的最新电话):
文件“ f:python est.py”,第5行,in
打印str1*num1
TypeError:不能将序列乘以“列表”类型
(5)成员资格
在计算符号中,以检查对象是序列(或其他类型)的成员(或其他类型):
输出:
错误的
真的
真的
(6)长度,最大最小值
序列中包含的元素,最大和最小元素的数量可以通过构建的函数LEN,MAX和MIN返回。
输出:
5
o
H
5
123
1
2.地图(字典)
映射中的每个元素都有一个名称。如您所知,此名称的名称称为key.dictionary(也称为散点列表)是Python中唯一的内部映射类型。
1.类型
字典的键可以是数字,字符串或元组,并且键必须是唯一的。在Python,数字,字符串和乌龟组中被设计为不变类型,常见列表和集合是可变的,因此列表和集合不能为用作字典键。键可以适用于任何不变类型,这是Python中最强大的地方。
输出:
{1:1}
Trackback(最近的最新电话):
文件“ f:python est.py”,第6行,in,in
D [List1] =“ Hello World”。
typeError:不可破坏类型:“列表”
2.自动添加
即使字典中的密钥不存在,您也可以为其分配一个值,以便词典将创建新项目。
3.会员资格
在d(d是字典)中表达项目查找键(containskey),而不是值。
3.收集
该集合(集合)在Python 2.3中引入。通常可以直接创建新版本的Python,如下所示:
strs = set(['jeff','wong','cnblogs'])
nums = set(范围(10))
该集合似乎是由序列(或其他迭代对象)构建的。藏品的重要特征和收集方法如下:
1.副本被忽略
该集合主要用于检查成员的资格,因此该副本被忽略。如示例所示,输出收集内容是相同的。
输出如下:
集([0,1,2,3,4,4,5])
集([0,1,2,3,4,4,5])
2.收集元件的顺序是休闲的
这与词典非常相似。您可以简单地理解一组字典而没有价值。
输出如下:
set(['wong','cnblogs','jeff'])
3.常用方法
A,结合工会
输出:
集([1,2,3])
集([2,3,4])
集([1,2,3,4])
联合操作返回两组收集,这些集合不会更改原始集合。将位置作为(OR)操作员“ |”使用获得相同的结果:
输出与上面的联合操作完全相同。
其他常见的操作包括(交集),=,=, - ,copy()等,此处不再列出。
输出如下:
集([1,2,3])
集([2,3,4])
集([2,3])
真的
集([1,2,3])
错误的
B,添加并删除
添加和去除的方法与序列非常相似。您可以参考官方文件:
输出:
设置([1])
集([1,2])
设置([1])
设置([1])
错误的
Trackback(最近的最新电话):
文件“ f:python est.py”,第9行,in,in
set1.remove(29)#emove不存在的项目
KeyError:29
4.冷冻
该集合是可变的,因此您不能使用字典的密钥。集合本身只能包含无法变量值,因此它不能包括其他集合:
输出如下:
Trackback(最近的最新电话):
文件“ f:python est.py”,第3行,in,in
set1.add(set2)
typeError:不可破坏的类型:“ set'
您可以使用冷冻类型来表示不变(扩展)的集合:
输出:
集([1,frozenset([[[2])]))))))))
创建数据
由Python的ZIP作为数据框架的输入数据REC构建了由一个犯罪组组成的列表。
在[3]中:将大熊猫作为pd导入
在[4]中:导入随机
在[5]中:num = andural.sample(Xrange(10000,1000000),5)
在[6]中:num
OUT [6]:[244937,132008,278446,613409,799201]
在[8]中:名称=“ Hello the Surbuel World En” .split()
在[9]中:名称
out [9]:['Hello','The',“残酷”,“世界”,'en']
在[10]中:rec = zip(名称,num)
在[15]中:data = pd.dataframe(r,columns = [u“ name”,u“ performance”])
在[16]中:数据
出去[16]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
数据帧方法函数的第一个参数是数据源,第二个参数列是输出数据表的标题或表的字段名称。
导出数据CSV
Windows平台上的编码问题,我们可以首先执行一个简单的过程,它是Ipython-Notebook支持UTF8。
导入系统
重新加载(系统)
sys.setdefaultencoding(“ utf8”)
数据可以接下来导出。
在[31]中:数据
出去[31]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
#
在[32]中:data.to_csv?
在[33]中:data.to_csv(“ c:\ out.csv”,index = true,header = [u“雇员”,u“ sales绩效”])
将数据导出到out.csv文件,索引参数表示是否有主要索引。如果未指定标题,则将是数据中的列。如果指定规范,则标题背后的字符串列表数与数据中的列字段数相同。
您可以打开out.csv以使用记事本++打开out.csv。
简单的数据分析
在[43]中:数据
出去[43]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
第一个:整数
Python可以处理任意整数。当然,它包含负整数。在Python程序中,整数的表示方法与数学写作完全相同,例如:1,100,-8080,0,等。
由于计算机使用二进制,有时十六进制表明整数更方便。十六进制前缀和0-9,a-f表示:0xff00。
第二类:浮点号
浮点的数量也是小数。之所以被称为浮点数 - 点数是因为当表达科学计数方法时,浮点数的小数点位置是可变的。浮动点可以用数学编写,例如1.23,3.15,-9.01等。。无论如何,对于一个大或小的浮点数,必须使用科学计数方法用E代替10,1.23x10^9为1.23e9。
计算机中整数和浮点的方法不同。整数操作始终是准确的,并且浮动点号操作可能有四座房屋和五个收入。
第三类:字符串
该字符串是“或”中包含的任意文本,例如'abc','xyz',等等。请注意,“或”本身只是一种表示的方式,而不是字符串的一部分。因此,字符串“ ABC”仅是a,b,c,三个字符。
第四:布尔值
布尔值和布尔代数完全相同。布尔值只有两种类型:真和错误,是对还是错。在python中,可以使用真假来表示布尔值。
BUR值可以通过和或不可计算。
和操作和操作,只有所有操作都是真实的,并且操作的结果是真实的。
或计算是或操作,只要一个是正确的,或操作结果为真。
不计算是非计算的。这是一个单眼操作员,将真实变成false,错误变为真实。
第五:空价值
空值是Python中的特殊值,该值由None表示。没有一个人不能理解为0,因为0是有意义的,没有一个特殊的空值。
此外,Python还提供了多种数据类型,例如列表,词典,并允许创建自定义数据类型。
如果是列表,则有最大值(列表),您也可以自己编写分类算法,例如IN范围内的I = [3,4,2,6,3]的冒泡排序a = [3,4,2,6,3](0,len(a),):对于J中的J(i+1,len(a)):first = int(a [i])second = int(a [j])如果第一次
结论:以上是首席CTO注释为每个人编译的Python列的全部内容。感谢您阅读本网站的内容。我希望这对您有帮助。有关数据浓度的数列的更多信息。python的许多列可用于数据集。不要忘记在此网站上找到它。
