当前位置: 首页 > 网络应用技术

Python阅读了多少行CVS文件(2023年最新共享)

时间:2023-03-08 11:05:56 网络应用技术

  简介:今天,首席CTO注释将与您分享有关CVS文件的CVS文件的数量。如果您可以解决您现在面临的问题,请不要忘记注意此网站。让我们现在开始!

  1.打开文件并返回行数。

  2.返回到列数,返回特定行,返回前几行,返回特定列,返回前几列,然后返回到行的行。

  3.一一读取CSV以满足条件并返回行号。

  阅读CSV文件

  最多

  简化版本

  filepath_or_buffer:str,pathlib.str,pathlib.path,py._path.local.local.localpath或任何带有read()方法的对象

  它可以是URL,URL类型包括:http,ftp,s3和files.multi -file正在准备

  阅读本地文件的示例:: //localhost/path/to/table.csv

  ** sep **:str,默认',’

  指定分隔符。如果您不指定参数,则将尝试将逗号分开。分离器成长为角色而不是“ s+”,它将使用Python语法分析仪。并忽略数据中的逗号。表达: ' '

  **定界符**:str,默认没有

  固定边界,替代部门(如果此参数指定,则SEP参数无效)

  delim_whitespace:布尔值,默认为false。

  指定空间(例如'或''')是否用作分离主义者。它等效于设置sep ='s+'。如果将此参数设置为ture,则定界符参数将失败。

  在新版本0.18.1中的支持

  标题:int或int列表,默认的“ ins”

  指定的行数被用作名称列表,并且数据数启动。如果文件中没有名称,则默认值为0,否则将其设置为无。如果标题= 0明确设置了,则原始存在被替换。Header参数可以是一个列表,例如:[0,1,3],此列表表明文件中的这些行用作列标题(每列中的多个标题),并且中间的线将被忽略。

  注意:如果skip_blank_lines = true,则标题参数忽略注释和空行,因此标头= 0表示第一行数据的第一行,而不是文件的第一行。

  **名称**:类似数组,默认没有

  结果的名称列表,如果数据文件中没有标题行,则需要在默认列表中执行header = none.no重复,除非设置参数mangle_dupe_cols = true。

  index_col:int或sequence或false,默认没有

  对于索引的列号或名称,如果给出了序列,则有多个行索引。

  如果文件不规则并且尾巴具有分离器,则可以设置index_col = false的pandas不适用于第一列作为行索引。

  UseCols:类似阵列,默认没有

  返回数据集,此列表中的值必须对应于文件中位置的位置(数字可以对应于指定的列)或字符传输的名称是文件的名称。例如:有效USERCOL的参数可能为[0,1,2]或['foo','bar','baz']。使用此参数可以加快加载并减少内存消耗。

  AS_RECARRAY:布尔值,默认为false

  不同意使用:将在未来版本中删除此参数。请使用pd.read_csv(...)。to_records()。

  返回一个numpy recarlay以替换数据框。如果将参数设置为true。它将首先使用。索引将不再可用,并且索引列将被忽略。

  **挤压**:布尔,默认为false

  如果文件值包含列,请返回服务器

  **前缀**:str,默认没有

  当没有标题时,将前缀添加到列。例如:添加'x'成为x0,x1,...

  ** mangle_dupe_cols **:布尔值,默认为true

  重复的列,将“ x” ... x'表示为“ x.0” ...'x.n。如果设置为false,则将覆盖所有重复。

  dtype:键入colmn -type的名称或dict,默认没有

  每列的数据类型。例如

  **引擎**:{‘c’,‘python’},可选

  解析器使用。当Python发动机目前更加完整时,C发动机的速度更快。

  使用的分析引擎。您可以选择C或Python.c引擎很快,但是Python发动机功能更完整。

  转换器:dict,默认没有

  转换函数的字典。关键可以是列或列的序列号。

  true_values:列表,默认没有

  值为真实的价值观

  false_values:列表,默认没有

  值为假的值

  ** skipinitialspace **:布尔值,默认为false

  分段后忽略空白(默认为false,即不忽略)。

  跳过:类似列表或整数,默认没有

  需要忽略的行数(从文件的开头开始)或需要跳过的行号列表(从0开始)。

  Skipfooter:int,默认值0

  从文件的末尾开始。(不支持C引擎)

  skip_footer:int,默认值0

  不建议这样做:建议使用skipfooter,该功能相同。

  nrows:int,默认没有

  需要读取的行数(从文件头开始)。

  na_values:scalan,str,类似于列表或dict,默认没有

  一组替换na/nan的值。如果您传递参数,则需要制定特定列的空值。默认值为“ 1.#ind”,'1.#qnan','n/a','na','null','nan','nan'。

  ** keep_default_na **:bool,默认为true

  如果指定了na_values参数并keep_default_na = false,则将涵盖默认的NAN,否则将其添加。

  ** na_filter **:布尔值,默认为true

  检查您是否丢失了值(空字符串还是空值)。对于大文件,没有空值,设置na_filter = false可以提高读取速度。

  冗长:布尔值,默认为false

  是否打印各种解析器的输出信息,例如:“非价值列中丢失值的数量”等等。

  skip_blank_lines:布尔值,默认为true

  如果您是真的,您将跳过空线;否则,它将被记录为Nan。

  ** parse_dates **:布尔值或ints或名称列表或列表或dict的列表,默认为false

  peash_datetime_format:boolean,默认错误false

  如果将其设置为True且Parse_dates可用,则PANDAS将尝试将其转换为日期类型。在某些情况下,它将快5-10倍。

  ** keep_date_col **:布尔值,默认为false

  如果连接多个列,请保持列参与连接。默认值为false。

  date_parser:函数,默认没有

  用于分析日期的功能,使用dateutil.parser.parser转换default.pandas尝试使用三种不同的方法来分析,并在遇到问题时使用下一个方法。

  1.将一个或多个数组(由PARSE_DATES指定)作为参数;

  2.将指定的多列字符串作为参数连接为列;

  3.调用date_parser函数一次将一行分析一个或多个字符串(由parse_dates指定)为参数。

  ** dayfirst **:布尔值,默认为false

  DD/mm格式日期类型

  **迭代器**:布尔值,默认为false

  返回textfilereader对象以通过块处理文件。

  块:int,默认没有

  文件块的大小,请参阅IO工具文档,以获取有关迭代器和块质量的更多信息。

  压缩:{{'推断',gzip','bz2','zip','xz',none},默认“ incer”

  如果您使用推论参数,使用gzip,bz2,zip或用'.gz','.bz2','.zip'或'xz'是一个是一个,请使用gzip,bz2,zip或'xz'是一个文件,否则不会解压缩。如果您使用zip,则zip软件包中国必须仅包含一个文件。如果没有解压缩,请否。

  新版本0.18.1版本支持ZIP和XZ减压

  这和:str,默认没有

  成千上万的积分划分,例如“”或“”。

  小数:str,默认为'。’

  字符中的小数点(例如:欧洲数据使用',’)。

  float_precision:字符串,默认没有

  

  指定

  **线粒体**:str(长度1),默认没有

  线路划分符号仅在C饼干下使用。

  ** quodechar **:str(长度1),可选

  引号被用作启动和解释的字符,引号中的分割符号将被忽略。

  引用:int或csv.quote_*实例,默认为0

  控制CSV中的引号常数。Optionalquote_minimal(0),quote_all(1),quote_nonnumeric(2)或quote_none(3)

  doublequote:布尔值,默认为真

  当定义单个引号并且引用参数不是QUOTE_NONE时,使用双引号将引号中的元素表示为元素。

  Escapechar:str(长度1),默认没有

  引用是quote_none时,请指定一个字符以实现无限限制。

  评论:str,默认没有

  如果字符出现在头部,则该行将被忽略。该参数只能是一个字符,空线的音符(就像skip_blank_lines = true一样)被header and skiprows.for忽略了。示例,如果注释='#'#'分析'#empty

  a,b,c

  1,2,3'为标题= 0,因此返回结果将基于“ A,B,C'为标头。

  编码:str,默认没有

  指定字符集的类型,通常指定为“ UTF-8”。Python标准编码列表

  方言:str或csv.dialect实例,默认没有

  如果没有特定的语言,则SEP大于字符,它将被忽略。检查csv.dialect文档

  tupleize_cols:boolean,默认为false

  在列上留下一个元组列表

  error_bad_lines:布尔值,默认为true

  如果一行包含太多列,则默认情况下不会返回数据框。如果将其设置为false,则将将其删除(仅在C Parster下使用)。

  warn_bad_lines:布尔值,默认为true

  如果error_bad_lines = false,并且warn_bad_lines = true,则将输出所有“坏线”(仅在C Parses下使用)。

  ** low_memory **:布尔值,默认为true

  将块加载到内存,然后在低内存消耗中分析。但是可能存在混淆类型。确保该类型不会混淆并设置为false.或使用dtype参数指定类型。注意使用chunksize或Itererator tyerator或Itererator参数,读取到一个块中会将整个文件读取到数据框中,而忽略该类型(仅在C Parster中有效)

  ** buffer_lines **:int,默认没有

  不建议,此参数将在未来版本中删除,因为不建议在解析器中使用其价值

  compact_ints:布尔值,默认为false

  不建议,此参数将在未来版本中删除

  如果设置compact_ints = true,则任何整数列都将根据最小整数类型存储。

  use_unsigned:布尔值,默认为false

  不建议:将来版本将删除此参数

  如果整数列被压缩(即compact_ints = true),则指定压缩列是符号还是非符号符号。

  memory_map:布尔值,默认为false

  如果存储器中使用的文件,请直接使用映射文件。使用此方法再次避免IO操作。

  参考:

  读取CSV文件并使用csv.reader()的方法。结果是_csv.reader的对象。我们可以遍历此对象以输出每行,一行或特定列。代码显示如下:

  每行都是列表,然后使用条件来判断

  结论:以上是首席CTO注释为每个人编制的CVS文件的相关内容的相关内容摘要。希望它对您有所帮助!如果您解决了问题,请与更多关心此问题的朋友分享?