当前位置:首页>编程日记>正文

python与excel的区别-Python比较两个excel文档内容的异同

本站寻求有缘人接手,详细了解请联系站长QQ1493399855

#-*- coding: utf-8 -*-

#比对两个Excel文件内容的差异

#---------------------假设条件----------------

#1、源表和目标表格式一致

#2、不存在合并单元格

#3、第2行开始比对

#---------------------------------------------

import xlrd

import xlwt

import os

import time; # 引入time模块

#往日志文件中追加内容函数

def writeappend_logfile(filename,content):

file=open(filename,'a') #以追加方式打开日志文件

time_now= time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) #系统时间格式化

file.writelines(time_now+':'+content+' ') #写入内容

file.close() #关闭文件

def read_excel(ori_path,tar_path,sub_name):#

#print("ori_path:", ori_path)

#print("tar_path:", tar_path)

success=0 #匹配一致数量

fail=0 #匹配不一致数量

origin_xls={} #存储源xls文件

target_xls={} #比对的xls文件

wb_ori=xlrd.open_workbook(ori_path) #打开原始文件

wb_tar=xlrd.open_workbook(tar_path) #打开目标文件

sheet_num = len(wb_ori.sheets()) #源表子表数量

## for sheet_i in range(sheet_num): #excel中子页面数量

## sheet_ori=wb_ori.sheet_by_index(sheet_i) #通过索引值获取源表名

## sheet_tar=wb_tar.sheet_by_index(sheet_i) #通过索引值获取源表名

startime=time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) #获取系统当前时间并格式化为格式

print (startime,' 开始比对...')

logname='log_'+startime[0:10]+'.log' #截取日期年月日构成日志文件名

logfile=open(logname,'w') #创建日志文件,如果文件存在则清空内容,不存在则创建,如果需要同时批量比对多张表,可以考虑将日志文件名作为参数传入

logfile.writelines(startime+':【开始比对】...'+' ') #写入开始时间

logfile.close() #关闭日志文件

#print("##########################")

try:

sheet_ori=wb_ori.sheet_by_name(sub_name)

#print("sheet_ori.name:", sheet_ori.name)

sheet_tar=wb_tar.sheet_by_name(sub_name)

#print("sheet_tar.name:", sheet_tar.name)

#print("1111111111111111111111111111111")

if sheet_ori.name==sheet_tar.name:

#sheet表名

if sheet_ori.name==sub_name:

#先将数存入dictionary中dictionary(rows:list)

#第一行存储表头

#源表取一行数据与目标表全表进行比对如果表中存在主键可以用主键进行索引

#数据从excel第3行开始

#print("222222222222222222222222222")

for rows in range(0,sheet_ori.nrows):

orign_list=sheet_ori.row_values(rows) #源表i行数据

#target_list=sheet_tar.row_values(rows) #目标表i行数据

origin_xls[rows]=orign_list #源表写入字典

#print("origin_xls[rows]:", origin_xls[rows])

#target_xls[rows]=target_list #目标表写入字典

for rows in range(0, sheet_tar.nrows):

target_list = sheet_tar.row_values(rows) # 目标表i行数据

target_xls[rows] = target_list # 目标表写入字典

#print("target_xls[rows]", target_xls[rows])

if origin_xls[0] == target_xls[0]:

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+' 表头一致')

num = len(origin_xls)

print("num:", num)

num1 = len(target_xls)

print("num1:", num1)

if num >= num1:

for ori_num in origin_xls:

print("ori_num:", ori_num)

flag='false' #判断是否一致标志

for tar_num in target_xls:

if origin_xls[ori_num]==target_xls[tar_num]:

flag='true'

break #如果匹配到结果退出循环

if flag=='true': #匹配上结果输出后台日志

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+' 文件:', ori_path+' '+' row:%d is ok'%(ori_num+1))

success+=1

else: #匹配不上将源表中行记录写入txt

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+' 文件:', ori_path+' '+' row:%d is different'%(ori_num+1))

fail+=1

data=origin_xls[ori_num]

logstr='文件:', ori_path + ' ' + '【不一致】row<'+str(ori_num)+'>:'+str(data)

writeappend_logfile(logname,logstr)

# logstr='【比对完成】总记录数:'+str(ori_num)+'条,一致:'+str(success)+'条,不一致:'+str(fail)+'条'

logstr='【比对完成】总记录数:{:d}条,一致:{:d}条,不一致:{:d}条'.format(ori_num + 1,success,fail)

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+' 【%s】比对结束'%sheet_ori.name)

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+' 总记录数:%d条,一致:%d条,不一致:%d条'%(ori_num+1,success,fail))

else:

#for ori_num in origin_xls:

#print("tar_num:", tar_num)

flag = 'false' # 判断是否一致标志

#for tar_num in target_xls:

#if origin_xls[ori_num] == target_xls[tar_num]:

if target_xls[tar_num] == origin_xls[ori_num]:

flag = 'true'

break # 如果匹配到结果退出循环

if flag == 'true': # 匹配上结果输出后台日志

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) + ' 文件: ', tar_path+' '+ ' row:%d is ok' % (tar_num + 1))

success += 1

else: # 匹配不上将源表中行记录写入txt

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+ ' 文件: ', tar_path+' ' + ' row:%d is different' % (

tar_num + 1))

fail += 1

data = target_xls[tar_num]

#logstr = '文件: ', tar_path + ' ' + '【不一致】row<' + str(tar_num+1) + '>:' + str(data)

logstr = '【不一致】row<' + str(tar_num + 1) + '>:' + str(data)

#logstr1 = ' 文件: ', tar_path

#logstr = logstr2 + logstr1

writeappend_logfile(logname, logstr)

logstr = '【比对完成】总记录数:{:d}条,一致:{:d}条,不一致:{:d}条'.format(tar_num + 1, success, fail)

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) + ' 【%s】比对结束' % sheet_tar.name)

print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()) + ' 总记录数:%d条,一致:%d条,不一致:%d条' % (

tar_num + 1, success, fail))

errmsg='【'+sub_name+'】子表名不一致'

writeappend_logfile(logname,errmsg)

except Exception as err:

writeappend_logfile(logname,str(err)) #输出异常

def main():

pass

if __name__ == '__main__':

read_excel(r'1.xlsx','2.xlsx','Sheet1')


http://www.coolblog.cn/news/123ca16a767ed80c.html

相关文章:

  • asp多表查询并显示_SpringBoot系列(五):SpringBoot整合Mybatis实现多表关联查询
  • s7day2学习记录
  • 【求锤得锤的故事】Redis锁从面试连环炮聊到神仙打架。
  • 矿Spring入门Demo
  • 拼音怎么写_老师:不会写的字用圈代替,看到孩子试卷,网友:人才
  • Linux 实时流量监测(iptraf中文图解)
  • Win10 + Python + GPU版MXNet + VS2015 + RTools + R配置
  • 美颜
  • shell访问php文件夹,Shell获取某目录下所有文件夹的名称
  • 如何优雅的实现 Spring Boot 接口参数加密解密?
  • LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络
  • Mac原生Terminal快速登录ssh
  • 法拉利虚拟学院2010 服务器,法拉利虚拟学院2010
  • 支撑微博千亿调用的轻量级RPC框架:Motan
  • mysql commit 机制_1024MySQL事物提交机制
  • java受保护的数据与_Javascript类定义语法,私有成员、受保护成员、静态成员等介绍...
  • 2019-9
  • jquery 使用小技巧
  • 科学计算工具NumPy(3):ndarray的元素处理
  • vscode pylint 错误_将实际未错误的py库添加到pylint白名单
  • 工程师在工作电脑存 64G 不雅文件,被公司开除后索赔 41 万,结果…
  • linux批量创建用户和密码
  • js常用阻止冒泡事件
  • 气泡图在开源监控工具中的应用效果
  • newinsets用法java_Java XYPlot.setInsets方法代碼示例
  • 各类型土地利用图例_划重点!国土空间总体规划——土地利用
  • php 启动服务器监听
  • dubbo简单示例
  • Ubuntu13.10:[3]如何开启SSH SERVER服务
  • [iptables]Redhat 7.2下使用iptables实现NAT
  • Django View(视图系统)
  • 【设计模式】 模式PK:策略模式VS状态模式
  • CSS小技巧——CSS滚动条美化
  • JS实现-页面数据无限加载
  • 最新DOS大全
  • 阿里巴巴分布式服务框架 Dubbo
  • 阿里大鱼.net core 发送短信
  • Sorenson Capital:值得投资的 5 种 AI 技术
  • 程序员入错行怎么办?
  • Arm芯片的新革命在缓缓上演
  • 两张超级大表join优化
  • 第九天函数
  • Linux软件安装-----apache安装
  • HDU 5988 最小费用流
  • 《看透springmvc源码分析与实践》读书笔记一
  • 通过Spark进行ALS离线和Stream实时推荐
  • nagios自写插件—check_file
  • python3 错误 Max retries exceeded with url 解决方法
  • 正式开课!如何学习相机模型与标定?(单目+双目+鱼眼+深度相机)
  • 行为模式之Template Method模式