简介:许多朋友问有关Python查询中有多少数据的问题。本文的首席CTO笔记开始为您的参考做出详细的答案。我希望这对每个人都会有所帮助!让我们一起看看!
1.首先打开计算机并打开软件Python,然后在Python中创建两个表格的数据量并选择要查看。
3.最后单击立即检查。
来自__future __ import print_functionimport timeif __name__ =='__ main ____':
导入系统
start = time.time()
以F:f的开放(sys.argv [1],'rb')为
计数= 0
last_data ='
'
而真:
data = f.Read(0x400000)
如果没有数据:
休息
count+= data.count(b'
')
last_data =数据
如果last_data [-1:]!= b'
':
计数+= 1#如果需要类似WC的计数,请删除此
end = time.time()
打印(计数)
打印(末端*1000)
这与WC -L略有不同。如果您想与WC -L一致,则可以删除注释行。
没有逻辑,例如通用新线和忽略空气线。如果需要这些功能,该程序将变得更加复杂。
创建数据
由Python的ZIP作为数据框架的输入数据REC构建了由一个犯罪组组成的列表。
在[3]中:将大熊猫作为pd导入
在[4]中:导入随机
在[5]中:num = andural.sample(Xrange(10000,1000000),5)
在[6]中:num
OUT [6]:[244937,132008,278446,613409,799201]
在[8]中:名称=“ Hello the Surbuel World En” .split()
在[9]中:名称
out [9]:['Hello','The',“残酷”,“世界”,'en']
在[10]中:rec = zip(名称,num)
在[15]中:data = pd.dataframe(r,columns = [u“ name”,u“ performance”])
在[16]中:数据
出去[16]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
数据帧方法函数的第一个参数是数据源,第二个参数列是输出数据表的标题或表的字段名称。
导出数据CSV
Windows平台上的编码问题,我们可以首先执行一个简单的过程,它是Ipython-Notebook支持UTF8。
导入系统
重新加载(系统)
sys.setdefaultencoding(“ utf8”)
数据可以接下来导出。
在[31]中:数据
出去[31]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
#
在[32]中:data.to_csv?
在[33]中:data.to_csv(“ c:\ out.csv”,index = true,header = [u“雇员”,u“ sales绩效”])
将数据导出到out.csv文件,索引参数表示是否有主要索引。如果未指定标题,则将是数据中的列。如果指定规范,则标题背后的字符串列表数与数据中的列字段数相同。
您可以打开out.csv以使用记事本++打开out.csv。
简单的数据分析
在[43]中:数据
出去[43]:
名称性能
0 Hello 244937
1 132008
2残酷278446
3 World 613409
4 EN 799201
Python Metal Group Count()方法用于计算元素,列表和字符串中元素数量出现的次数。选项参数是字符串搜索的开始和结尾
myList = [2,3,(1,2),5]
其中,元素0,1和3是整数,而元素2是元组。我想创建一个计数器,告诉我列表出现之前列表中有多少个元素。
在此示例中,我想要一个计数器,将需要2(2个元素,2和3,在第一个组小组之前)。我尝试了以下内容:
计数器= 0
而mylist [countrist]不元素:
计数器=计数器 + 1
但是它不起作用,因为当它评估句子“(1,2)不是金属群体”时,它不是要改善false.thanks。
解决方案:
您可以用于循环并突破:
计数器= 0
对于MyList中的Elem:
如果Isinstance(Elem,元组):
休息
计数器 += 1
或者,使用枚举():
对于计数器,Elem在枚举中(myList):
如果Isinstance(Elem,元组):
休息
#countr *如果``MyList'是空的
从Itertools进口时需要
counter = sum(elem in take in take(lambda e:not isInstance(e,tuple),myList))
一种证明的方法:
从Itertools进口时需要
myList = [2,3,(1,2),5]
sum(1 elem in take in take(lambda e:不是isinstance(e,tuple),myList),myList)
使用“打开功能”一一读取文件,然后按顺序比较它们。如果包含所需的字符串,则累积了数字1。在阅读后,可以计算旅行的数量。代码如下:
n = 0
对于打开的行('filename','r'):
如果在“固定字符串”中,则行:
n+= 1
打印(n)
阐明:
在开放方法中使用线可以提高代码效率。如果需要更复杂的统计信息,例如重复,您可以使用哈希功能将哈希值存储在列表中,然后进行统计信息。
结论:以上是首席执行官指出引入的Python查询的所有内容。我希望这对每个人都会有所帮助。如果您仍然想了解有关此信息的更多信息,请记住收集并关注此网站。