关联两个或多个表是一个常见的操作。这时候通常使用SQLjoin进行关联和后续计算。但有时数据并没有存储在数据库中,而是以文件的形式存储在文件系统中。仅仅为了计算而将数据存入数据库是得不偿失的。Python的Pandas提供了丰富的相关性计算函数,可以更方便的完成文本文件之间的相关性计算。下面我们一起来讨论一下Python的关联处理。基本关联所谓关联,是指通过某个字段或某些字段之间的某种关系,将具有一定条件的两个数据表关联起来。SQL中的关联可以是等价的JOIN或非等价的JOIN。所谓non-equivalentJOIN是指JOIN的过滤条件不一定相等,比如selectA.x,B.yfromAjoinBonA.a
