当前位置: 首页 > 网络应用技术

Python的简短介绍多少钱

时间:2023-03-07 21:43:28 网络应用技术

  今天,我将与您分享对Python缺少价值观的知识。它也将解释它。如果您可以解决您现在面临的问题,请不要忘记注意此网站。让我们现在开始!

  本文目录清单:

  1.如何删除python数据框的缺失值2. python填补了缺失值的损失3. Python数据处理:筛选,统计,连续表,拼接,拆卸,拆卸,缺失值处理4. Python检查是否有缺失值1。导入库。

  2.生成缺失的data.data = pdataframe({'name':['kite','lily','hanmei','hanmei','danny','bob'],'英语':[92,78,np.nan,23,82],“数学”:[69,87,91,np.nan,90],'centern':[np.nan,78,96,np.nan,75]}),print(data)。

  3.检查缺失的值.data.isnull()#view所有缺少的值,data.isnull()。任何()#get包含缺失值的列,data.isnull()。all()#get所有na列。

  4.删除缺失的值。此处理方法是更多信息。data2= data.dropna().print(data2)可以看出,删除后,只剩下两行数据。

  5.使用Sklearn替换缺失的值。当缺失值是数值数据时,可以更换平均值。

  6.使用pandas替换缺陷。data.fillna(0)#缺失值被0代替。

  扩展信息

  执行Python后,PY文件中的源代码将编译到Python的字节代码(字节码)中,然后执行Python虚拟机(Python Virtual Machine)来执行这些编译的字节代码。与Java一致。

  但是,Python虚拟机不同于Java或.NET的虚拟机。Python的虚拟机是一台更高级的虚拟机。

  从通常的意义上讲,这里的高级级别并不是说Python的虚拟机比Java或.Net更强大。

  与Java或Net相比,Python的虚拟机距离真实机器更远。或者可以说Python的虚拟机是一种具有更高抽象水平的虚拟机。

  c python编制的字节码文件通常是pyc格式。此外,python也可以在交互式模式下运行,例如主流操作系统unix/linux,mac和windows可以直接在命令模式下直接运行Python Interactive环境可以发出直接操作说明以实现交互式操作。

  Python的设计目标之一是使代码高度可读。它使用标点符号符号和英语单词,这些符号和英语单词通常用其他语言使用,以使代码看起来整洁且美丽。

  它不需要像C和Pascal等其他静态语言那样反复编写陈述,也不需要像他们的语法那样经常出现特殊情况和事故。

  Python开发人员打算制定违反缩进规则的程序,不能汇编以迫使程序员养成良好的编程习惯。

  python语言的开始和退出使用句子块的起点和退出(外部规则),而不是使用括号或某些关键字。插入短语块的开头,减少凹痕表示退出的退出。句子块。扩展已成为语法的一部分。

  在大多数情况下,填充方法是最重要的函数。用常数替换为常数值。

  填充(值)

  参数:值

  注意:它用于填充缺少的标量值或字典对象。

  #call fillna通过常数

  写作方法:df.fillna(0)#use 0替换缺失值

  #call fillna通过词典

  写作方法:df.fillna({1:0.5,3:-1})

  fillna(value,Inplace = true)

  参数:Inplote

  注意:修改可选对象而不生成副本

  #始终返回对填补人的参考

  写作方法:df.fillna(0,Inplace = true)

  填充(方法= ffill)

  参数:方法

  注意:插入方法。如果在函数调用时未指定其他参数,则默认值为“ ffill”

  那些有效屈光的插值方法也可以用于FillNA:

  在[23]中:从numpy导入nan为na

  在[21]中:df = dataframe(np.random.randn(6,3))

  在[24]中:df.ix [2:1] = na;df.ix [4:,2] = na

  在[25]中:DF

  出去[25]:

  0 1 2

  0 -0.863925 1.005127 -0.529901

  1 0.701671 -0.501728 -0.617387

  2 -0.951060 NAN -0.263626

  3 0.810230 NAN -0.277401

  4 -0.403899 Nan Nan

  5 -0.081091 Nan Nan

  在[26]中:df.fillna(方法='ffill')

  出去[26]:

  0 1 2

  0 -0.863925 1.005127 -0.529901

  1 0.701671 -0.501728 -0.617387

  2 -0.951060 -0.501728 -0.263626

  3 0.810230 -0.501728 -0.277401

  4 -0.403899 -0.501728 -0.277401

  5 -0.081091 -0.501728 -0.277401

  填充(限制= 2)

  参数:限制

  注意:(对于前后),可以连续填充的最大数字

  在[27]中:df.fillna(方法='ffill',limit = 2)

  出去[27]:

  0 1 2

  0 -0.863925 1.005127 -0.529901

  1 0.701671 -0.501728 -0.617387

  2 -0.951060 -0.501728 -0.263626

  3 0.810230 -0.501728 -0.277401

  4 -0.403899 NAN -0.277401

  5 -0.081091 NAN -0.277401

  fillna(data.me.me()))

  只要您稍微移动大脑,就可以使用FillNA实施许多其他功能。例如,该系列的平均或中位数可以介绍:

  在[28]中:data =系列([1,na,3.5,na,7])))))

  在[29]中:data.fillna(data.mean())

  file1_path ='e:/ users/lenovo/desktop/chine tv/622召回.csv'#源数据

  格式:file1 = pd.read_csv(file1_path)

  pd.read_csv(file1_path,encoding ='gbk')

  pd.read_csv(file1_path,encoding ='gbk',skiprows = [2,3])

  pd.read_csv(file1_path,encoding ='gbk',skiprows = lambda x:x%2 == 1)

  pd.read_csv(file1_path,encoding ='gbk',keep_default_na = false)

  new = pdataframe()

  new.new [[0,1,2]]

  new.new [0:2]

  查询结果与上述相同

  new.loc [new ['激活号] 1000]

  LOC和ILOC之间的差异:

  LOC:纯标签筛选

  ILOC:纯数字筛选

  #

  new = new.loc [:,['phone','收件人名称']]

  #1

  new.iloc [:,[0,1]]]

  使用“ ==”屏幕筛选“ Cui Xu”的人(只能筛选出明确的规格)

  #new = file1.loc [(file1 ['收件人名称'] =='cui xu')|(file1 ['收件人名称'] =='cui xia')]]]]]]]

  #print(新)

  #将loc函数用于屏幕-str.包含函数筛选名称,其中包含“明亮”和“ sea”

  #new = file1.loc [file1 ['收件人名称'] .str.Contains('liang | sea')]

  #print(新)

  #将loc函数用于屏幕-str.contains函数屏幕'cui'姓氏

  #new = file1.loc [file1 ['收件人名称'] .str.startswitch('cui')]

  #print(新)

  df = df [(df ['reade_pay_time_x']。

  print(“ ofer_time(number)= 0:”,newdata [newdata ['extry_time(number)'] == 0] .count()

  print(“ ofer_time(number)= 1,2,3数字:”,newdata [(newdata ['eccore_time(number)'] 0)(newdata ['ofer_time(number)]。)'])

  print(newdata [newdata ['ofer_time(number)'] == 0]

  newdata [newdata ['team']。isin(['grand','意大利','俄罗斯']] [['team','射击学院']]]]]

  DF。年龄。value_counts()

  1.修改指定位置数据的值(修改行0,‘订单的值'列为3836)

  new.loc [0,'创建订单'number'] = 3836

  2.替换“小敏” - “小”

  df.replace({'name':{'xiao ming':'xiaoming'}})

  3.批次替换列的值

  方法1:df ['gengender'] = df ['gengender'] .map({'男性':“男性','女性':'女性'})

  方法两个:df ['gender'] .replace('雌性','女性',Inplace = true)

  或df ['性别'] = df ['性别'] .ruplace('女性','women')这是内置的角色

  +df ['性别'] .replace('男性','男性',intplace = true)

  4.更换索引

  df.columns = ['sex','名称','高度','age']

  或:df.rename(列= {'性别':'sex','name':'name','height':'height':'height':'height','age':'age'})

  5.删除特定列

  del DF ['player']

  6.删除列(方法2)并删除一行(默认轴= 0删除行,并删除1列)

  删除特定列(方法2)

  df.drop('性别',轴= 1)

  删除一行

  DF.Drop(1,轴= 0)

  file1 = pd.read_csv(file1_path)

  file2 = pd.read_csv(file2_path)

  new1 = pd.dataframe()

  new1 ['phone'] = file1 ['phone']

  new1 ['contact_time'] = file1 ['Contact_time']

  new2 = pd.dataframe()

  new2 ['phone'] = file2 ['phone']

  new2 ['cummission_audit_time'] = file2 ['提交评论时间']

  newdata = pd.merge(new1,new2,on ='phone',how ='left')

  df = pd.concat([[df1,df2],轴= 0)

  4.2.2水平计连接

  df = pd.concat([[DF1,df2],轴= 1)

  df1 ['region'] .str.split('·,3,展开= true)

  DF1:

  df1 [['City',“城市区域”,'地址']] = df1 ['region'] .str.split('·,3,Expand = true)

  5.1删除

  data.dropna(轴= 0,子集

  data.dropna(如何='all')#传递此参数后,您只会丢弃所有错过值的行

  data.dropna(Axis = 1)#丢弃缺失值列表(通常不这样做,这将删除功能)

  data.dropna(轴= 1,how =“ all”)##d d d d d d d d d d d d d d d d d

  5.2丢失的值填充:pandas.dataframe.fillna()函数

  dataframe.fillna(value = none,method = none,axis = none,innplace = false = false,limit = none,download = none,** kwargs)

  功能:使用指定的方法填充Na/Nan值

  其中,Invlace = true是直接以原始为基础填充

  5.3丢失的价值查询:

  查询丢失值的数量:df.isnull()。sum()

  缺乏价值线查询:df [df.isnull()。t.any()]

  newdata ['ofer_time'] = pd.to_dateTime(newdata ['cubmission_audit_time'])-pd.to_dattime(newdata ['contact_time']))

  newdata ['ofer_time(number)'] =(pd.to_dateTime(newdata ['bistion_audit_time'])-pd.to_dattime(newdata ['contact_time'])。

  new = pdataframe()

  new = newdata [newdata ['extry_time(number)'] == 0]

  new.to_csv(save_path,encoding ='utf-8-sig')

  拆卸数据并将其存储到不同的CSV文件中:

  路径='c:/users/edz/desktop/work/2021.08.19/'

  对于我的范围(0,30):

  df.loc [[I]。to_csv(路径+str(i)+'。csv',encoding ='gbk')

  df = df [['购买日期','周',“社会保险卡号”,“产品编码”,“产品名称”,“销售数量”,“应收款项”,“收入金额”]]]]]]]]]]]]]]]]]]

  统计数据中的每一列是否具有空置值:

  data.isnull()。任何 ()

  统计数据中的每一列的数量:

  data.isnull()。任何 ()。sum()

  但是有时候,很明显,有空值但不能计算。

  最近,我遇到的数据,空值的填充为null。在使用上述功能之前,需要对此进行转换。

  data = data.replace('null',np.nan)

  然后,您继续使用data.isnull()。任何(),ata.isnull()。任何 ()。sum()很好。

  如果这样做,您的问题尚未解决。检查您的缺乏价值被NP.Nan.取代

  另一种方法:

  np.any(np.isnan(数据))

  np.All(np.Iffinite(数据))

  让我们谈谈python有多少丢失值。感谢您阅读本网站的内容。有关python有多少丢失值的更多信息,请不要忘记在此站点上找到它。