当前位置: 首页 > 网络应用技术

数据集中有多少列Python(数据集中有多少列)

时间:2023-03-08 22:41:47 网络应用技术

  首席执行官在本文中注明将介绍多少列Python列,并且数据集与相关数据集有关。我希望这对每个人都会有所帮助。让我们来看看。

  本文目录清单:

  1.计数Python中的问题2. Python基本数据结构:序列,映射,集合,集合3. Python Panda统计数据中有多少个数据类型。有几个数量的Python数据,weeke open('datafile')作为f:

  线= f.Readlines()

  lines = [str(l.split())-l.split()。count('nan'))+''+l in Lines中的l]

  以F1的方式开放('newfile','w'):

  F1.Writelines(线)

  它可以在Linux下使用:

  awk'{k = 0;对于(i = 0; i = nf; i ++)if($ i ==“ nan”)k ++;Proprint NF-K,$ 0}'DataFile Newfile

  参考资料:

  Python中的常见数据结构可以集体称为容器。序列(例如列表和金属组),映射(例如字典)和收集(集合)是三个主要容器。

  1.序列(列表,元组和字符串)

  序列中的每个元素都有其自己的数字。在Python中有6个构建 - 中的序列。列表和元组是最常见的类型。其他人包括字符串,Unicode String,Buffer Object和Xrange对象。以下内容集中在列表上,元组和字符串。

  1.列表

  列表是可变的。这是区分弦和乌龟群的最重要功能。总而言之,可以修改列表,字符串和元组不能。

  (1)创建

  可以通过以下方式创建列表:

  输出:

  ['你好世界']

  [1,2,3]

  可以看出,创建方法与JavaScript中的数组非常相似。

  (2)列表功能

  通过列表函数(实际列表函数而不是函数)创建字符串创建列表非常有效:

  输出:

  ['你好']

  2,结构组

  第一组与列表相同,也是一个序列。唯一的区别是元组无法修改(字符串实际上具有此特征)。

  (1)创建

  输出:

  (1,2,3)('jeffreyzhao','cnblogs')(1,2,3,4)(1,)

  从上面我们可以分析:

  a,逗号与某些值分开,并且会自动创建元组;

  B.小组中的大多数时间都是通过括号来包括的;

  C.空元组可以由无需内容的括号表示;

  D.必须添加一个值的值的一个值(,);

  (2)元组功能

  元组函数和序列的列表函数几乎相同:序列(注意序列)用作参数并将其转换为元组。如果参数甚至在元组中,则参数将返回到一样的方法:

  输出:

  (1,2,3)

  ('j','e','f','f')

  (1,2,3)

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第7行,in,in

  T4 =元组(123)

  TypeError:'int

  3.字符串

  (1)创造

  输出:

  你好世界德

  H

  H

  e

  l

  l

  o

  w

  o

  r

  l

  d

  (2)格式化

  格式 ():

  打印

  print(‘{}写这本书时{}年龄{}年龄’。格式(名称,年龄))

  打印

  #由于浮点“ 0.333”保留了小数点之后的三个位置

  打印('{0:.3f}’。格式(1.0/3))

  结果:0.333

  #使用下一行以填充文本并将文本保持在中间位置

  #使用^定义‘_____hello ______’'长度为11

  打印(‘{0: ^_11}’。格式('Hello’))

  结果:_____你好______

  %::

  格式运算符的正确操作号码可能是什么。如果是金属组或映射类型(例如字典),则字符串的格式将不同。

  输出:

  你好,世界德

  你好,世界德

  注意:如果需要转换的元组是转换表达式的一部分,则必须将其包括在括号中:

  输出:

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第2行,in,in

  str1 ='%s,%s'%'你好','world'

  Typerror:不为格式字符串的Enogh参数

  如果您需要输出特殊角色,毫无疑问,我们会想到公义,但是Python中的正确处理方法如下:

  输出:100%

  格式化数字,输出的宽度和准确性通常需要控制输出:

  输出:

  3.14

  3.141593

  3.14

  字符串的格式还包含许多其他丰富的转换类型,可以参考官方文档。

  4.一般序列操作(方法)

  从列表中,元组和字符串可以在序列中“抽象”一些公共通用方法(不是您想象中的crud),这些操作包括:索引,切片,添加(添加),乘以乘以乘以乘法),并检查某个元素是否元素属于序列。此外,有内部设置,例如计算序列长度,最大和最小元素。

  (1)索引

  输出

  H

  2

  345

  从0(从左到右)开始,所有序列都可以以这种方式索引。什么是神奇的,索引可以从最后一个位置开始(从右向左),数字为-1:1:

  输出:

  o

  3

  123

  (2)大小

  碎片操作用于访问特定范围内的元素。两个通过结肠碎片隔开的索引:

  输出:

  [0、1、2、3、4、5、5、6、7、8、8、9]

  [1,2,3,4]

  [6、7、8、9]

  [1、2、3、4、5、6、7、7、8、8、9]

  [7,8]

  [7,8,9]

  不同的步骤具有不同的输出:

  输出:

  [0、1、2、3、4、5、5、6、7、8、8、9]

  [0、1、2、3、4、5、5、6、7、8、8、9]

  [0,2,4,6,8]

  [0,3,6,9]

  []

  (3)序列添加

  输出:

  你好世界德

  [1,2,3,2,3,4]

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第7行,in,in

  打印str1+num1

  Typerror:无法许着“ str”和“列表”对象

  (4)乘法

  输出:

  [无,无,无,无,无,无,无,无,无]

  你好你好

  [1,2,1,2]

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第5行,in

  打印str1*num1

  TypeError:不能将序列乘以“列表”类型

  (5)成员资格

  在计算符号中,以检查对象是序列(或其他类型)的成员(或其他类型):

  输出:

  错误的

  真的

  真的

  (6)长度,最大最小值

  序列中包含的元素,最大和最小元素的数量可以通过构建的函数LEN,MAX和MIN返回。

  输出:

  5

  o

  H

  5

  123

  1

  2.地图(字典)

  映射中的每个元素都有一个名称。如您所知,此名称的名称称为key.dictionary(也称为散点列表)是Python中唯一的内部映射类型。

  1.类型

  字典的键可以是数字,字符串或元组,并且键必须是唯一的。在Python,数字,字符串和乌龟组中被设计为不变类型,常见列表和集合是可变的,因此列表和集合不能为用作字典键。键可以适用于任何不变类型,这是Python中最强大的地方。

  输出:

  {1:1}

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第6行,in,in

  D [List1] =“ Hello World”。

  typeError:不可破坏类型:“列表”

  2.自动添加

  即使字典中的密钥不存在,您也可以为其分配一个值,以便词典将创建新项目。

  3.会员资格

  在d(d是字典)中表达项目查找键(containskey),而不是值。

  3.收集

  该集合(集合)在Python 2.3中引入。通常可以直接创建新版本的Python,如下所示:

  strs = set(['jeff','wong','cnblogs'])

  nums = set(范围(10))

  该集合似乎是由序列(或其他迭代对象)构建的。藏品的重要特征和收集方法如下:

  1.副本被忽略

  该集合主要用于检查成员的资格,因此该副本被忽略。如示例所示,输出收集内容是相同的。

  输出如下:

  集([0,1,2,3,4,4,5])

  集([0,1,2,3,4,4,5])

  2.收集元件的顺序是休闲的

  这与词典非常相似。您可以简单地理解一组字典而没有价值。

  输出如下:

  set(['wong','cnblogs','jeff'])

  3.常用方法

  A,结合工会

  输出:

  集([1,2,3])

  集([2,3,4])

  集([1,2,3,4])

  联合操作返回两组收集,这些集合不会更改原始集合。将位置作为(OR)操作员“ |”使用获得相同的结果:

  输出与上面的联合操作完全相同。

  其他常见的操作包括(交集),=,=, - ,copy()等,此处不再列出。

  输出如下:

  集([1,2,3])

  集([2,3,4])

  集([2,3])

  真的

  集([1,2,3])

  错误的

  B,添加并删除

  添加和去除的方法与序列非常相似。您可以参考官方文件:

  输出:

  设置([1])

  集([1,2])

  设置([1])

  设置([1])

  错误的

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第9行,in,in

  set1.remove(29)#emove不存在的项目

  KeyError:29

  4.冷冻

  该集合是可变的,因此您不能使用字典的密钥。集合本身只能包含无法变量值,因此它不能包括其他集合:

  输出如下:

  Trackback(最近的最新电话):

  文件“ f:python est.py”,第3行,in,in

  set1.add(set2)

  typeError:不可破坏的类型:“ set'

  您可以使用冷冻类型来表示不变(扩展)的集合:

  输出:

  集([1,frozenset([[[2])]))))))))

  创建数据

  由Python的ZIP作为数据框架的输入数据REC构建了由一个犯罪组组成的列表。

  在[3]中:将大熊猫作为pd导入

  在[4]中:导入随机

  在[5]中:num = andural.sample(Xrange(10000,1000000),5)

  在[6]中:num

  OUT [6]:[244937,132008,278446,613409,799201]

  在[8]中:名称=“ Hello the Surbuel World En” .split()

  在[9]中:名称

  out [9]:['Hello','The',“残酷”,“世界”,'en']

  在[10]中:rec = zip(名称,num)

  在[15]中:data = pd.dataframe(r,columns = [u“ name”,u“ performance”])

  在[16]中:数据

  出去[16]:

  名称性能

  0 Hello 244937

  1 132008

  2残酷278446

  3 World 613409

  4 EN 799201

  数据帧方法函数的第一个参数是数据源,第二个参数列是输出数据表的标题或表的字段名称。

  导出数据CSV

  Windows平台上的编码问题,我们可以首先执行一个简单的过程,它是Ipython-Notebook支持UTF8。

  导入系统

  重新加载(系统)

  sys.setdefaultencoding(“ utf8”)

  数据可以接下来导出。

  在[31]中:数据

  出去[31]:

  名称性能

  0 Hello 244937

  1 132008

  2残酷278446

  3 World 613409

  4 EN 799201

  #

  在[32]中:data.to_csv?

  在[33]中:data.to_csv(“ c:\ out.csv”,index = true,header = [u“雇员”,u“ sales绩效”])

  将数据导出到out.csv文件,索引参数表示是否有主要索引。如果未指定标题,则将是数据中的列。如果指定规范,则标题背后的字符串列表数与数据中的列字段数相同。

  您可以打开out.csv以使用记事本++打开out.csv。

  简单的数据分析

  在[43]中:数据

  出去[43]:

  名称性能

  0 Hello 244937

  1 132008

  2残酷278446

  3 World 613409

  4 EN 799201

  第一个:整数

  Python可以处理任意整数。当然,它包含负整数。在Python程序中,整数的表示方法与数学写作完全相同,例如:1,100,-8080,0,等。

  由于计算机使用二进制,有时十六进制表明整数更方便。十六进制前缀和0-9,a-f表示:0xff00。

  第二类:浮点号

  浮点的数量也是小数。之所以被称为浮点数 - 点数是因为当表达科学计数方法时,浮点数的小数点位置是可变的。浮动点可以用数学编写,例如1.23,3.15,-9.01等。。无论如何,对于一个大或小的浮点数,必须使用科学计数方法用E代替10,1.23x10^9为1.23e9。

  计算机中整数和浮点的方法不同。整数操作始终是准确的,并且浮动点号操作可能有四座房屋和五个收入。

  第三类:字符串

  该字符串是“或”中包含的任意文本,例如'abc','xyz',等等。请注意,“或”本身只是一种表示的方式,而不是字符串的一部分。因此,字符串“ ABC”仅是a,b,c,三个字符。

  第四:布尔值

  布尔值和布尔代数完全相同。布尔值只有两种类型:真和错误,是对还是错。在python中,可以使用真假来表示布尔值。

  BUR值可以通过和或不可计算。

  和操作和操作,只有所有操作都是真实的,并且操作的结果是真实的。

  或计算是或操作,只要一个是正确的,或操作结果为真。

  不计算是非计算的。这是一个单眼操作员,将真实变成false,错误变为真实。

  第五:空价值

  空值是Python中的特殊值,该值由None表示。没有一个人不能理解为0,因为0是有意义的,没有一个特殊的空值。

  此外,Python还提供了多种数据类型,例如列表,词典,并允许创建自定义数据类型。

  如果是列表,则有最大值(列表),您也可以自己编写分类算法,例如IN范围内的I = [3,4,2,6,3]的冒泡排序a = [3,4,2,6,3](0,len(a),):对于J中的J(i+1,len(a)):first = int(a [i])second = int(a [j])如果第一次

  结论:以上是首席CTO注释为每个人编译的Python列的全部内容。感谢您阅读本网站的内容。我希望这对您有帮助。有关数据浓度的数列的更多信息。python的许多列可用于数据集。不要忘记在此网站上找到它。