最近遇到一些接入第三方的数据需要验证数据库的准确性,刚好学了一段时间 python,进简单的应用下。

目的:解析 xml 中的数据和数据库进行比对, 我这边暂时把 xml 中的数据解析出来保存到 excel,在通过对比工具和数据库里的数据做比对。
下面直接上代码:

# -*- coding:utf-8 -*-
from bs4 import BeautifulSoup
import requests
import xlwt

proxies = {
    "http": "10.19.110.55:8080",
}

url = "xxxxxx"  # url中的数据未xml格式

page = requests.get(url, proxies=proxies)  # 读取xml接口中的数据
t = page.text

soup = BeautifulSoup(t, 'xml')  # 实例化soup
str1 = ''
with open(r'D:\pycharm\test1\qiu.txt', 'wb') as fp:  # 打开本地空文档存放解析的xml数据
    for match in soup.find_all('match'):  # 查找match标签包含的所有内容,生成一个列表
        matchInfo = match.matchInfo
        description = matchInfo.description
        str1 += description.text + '    ' + matchInfo['id'] + '\r\n'
    fp.write(str1.encode())

# 保存到excel
wb = xlwt.Workbook()  # 创建Excel
ws = wb.add_sheet('shuJu')
f = open(r'D:\pycharm\test1\qiu.txt', encoding='utf-8')

for j in range(0, 380):  # 解析出来的数据一共380行
    x = f.readline()  # 一行一行读取
    y = x.split('    ')  # 4个空格打断
    for i in range(0, 2):
        ws.write(j, i, y[i])
wb.save('shuJu.xls')

下面的图为接口中的 xml 数据

第一次发布,多多指教


↙↙↙阅读原文可查看相关链接,并与作者交流