首页 > 代码库 > 【Python】Xml To Excel
【Python】Xml To Excel
【Python3】
之前做的入门练习里有一题将excel文件转化为xml文件,这回补上逆向转换→xml to excel
用的还是beautifulsoup。
主要还是:①读取待处理文件文本内容 ②处理文本写入数据到所需格式文件中
原xml文件如下:
<?xml version="1.0"?><doc><taxML cnName="增值税发票开具明细" xmlns="http://www.chinatax.gov.cn/dataspec/" name="slSbbtjZzsfpkjmxRequest" version="SW5001-2006" xsi:type="slSbbtjZzsfpkjmxRequest" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <sbbZzsfpkjmx> <head> <publicHead> <nsrsbh>440100581884333</nsrsbh> <nsrmc>广州贝凡信息技术有限公司</nsrmc> <tbrq>20160801</tbrq> <sssq> <rqQ>20160101</rqQ> <rqZ>20160831</rqZ> </sssq> </publicHead> </head> <body> <zyfpkjmx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117808</fphm> <kprq>20160107 11:16:03</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>1</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117809</fphm> <kprq>20160107 11:18:54</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>2</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117810</fphm> <kprq>20160107 11:20:09</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>3</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117811</fphm> <kprq>20160107 11:22:58</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>142.03</je> <se>8.52</se> <zfbz>N</zfbz> <xh>4</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117812</fphm> <kprq>20160107 11:24:28</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>5</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117813</fphm> <kprq>20160107 11:26:07</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>60417.70</je> <se>3625.06</se> <zfbz>N</zfbz> <xh>6</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117814</fphm> <kprq>20160107 11:32:33</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>7</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117815</fphm> <kprq>20160107 11:34:30</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>434.35</je> <se>26.06</se> <zfbz>N</zfbz> <xh>8</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117816</fphm> <kprq>20160107 11:35:54</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>9</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117817</fphm> <kprq>20160107 11:37:47</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>10</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117818</fphm> <kprq>20160107 11:39:00</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>11</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117819</fphm> <kprq>20160107 11:39:53</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>12</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117820</fphm> <kprq>20160107 11:41:13</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>13</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117821</fphm> <kprq>20160107 11:42:21</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>14</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117822</fphm> <kprq>20160107 11:43:38</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>8740.53</je> <se>524.43</se> <zfbz>N</zfbz> <xh>15</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117823</fphm> <kprq>20160112 12:16:13</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>Y</zfbz> <xh>16</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117824</fphm> <kprq>20160112 12:29:19</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>17</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117825</fphm> <kprq>20160112 12:33:53</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>30428.34</je> <se>1825.70</se> <zfbz>N</zfbz> <xh>18</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117826</fphm> <kprq>20160113 12:44:58</kprq> <gmfnsrsbh>441601749182176</gmfnsrsbh> <je>21650.94</je> <se>1299.06</se> <zfbz>N</zfbz> <xh>19</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117827</fphm> <kprq>20160129 12:09:48</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>20</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117828</fphm> <kprq>20160129 12:11:15</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>21</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117829</fphm> <kprq>20160129 12:12:25</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>22</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117830</fphm> <kprq>20160129 12:14:05</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>23</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117831</fphm> <kprq>20160129 12:15:31</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>24</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117832</fphm> <kprq>20160129 12:16:57</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>25</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117833</fphm> <kprq>20160129 12:18:07</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>26</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117834</fphm> <kprq>20160129 12:19:11</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>27</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117835</fphm> <kprq>20160129 12:20:03</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>28</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>19117836</fphm> <kprq>20160129 12:20:53</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>29</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199509</fphm> <kprq>20160129 13:52:10</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>30</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199510</fphm> <kprq>20160129 13:53:27</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>31</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199511</fphm> <kprq>20160129 13:54:18</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>32</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199512</fphm> <kprq>20160129 13:55:24</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>33</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199513</fphm> <kprq>20160129 13:56:23</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>34</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199514</fphm> <kprq>20160129 13:58:24</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>35</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199515</fphm> <kprq>20160129 13:59:39</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>22371.25</je> <se>1342.27</se> <zfbz>N</zfbz> <xh>36</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199516</fphm> <kprq>20160303 13:49:44</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>15091.66</je> <se>905.50</se> <zfbz>N</zfbz> <xh>37</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199517</fphm> <kprq>20160303 13:52:13</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>53915.00</je> <se>3234.90</se> <zfbz>N</zfbz> <xh>38</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199518</fphm> <kprq>20160303 13:54:22</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>39</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199519</fphm> <kprq>20160303 13:55:30</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>40</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199520</fphm> <kprq>20160303 13:56:30</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>41</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199521</fphm> <kprq>20160303 13:57:56</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>42</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199522</fphm> <kprq>20160303 13:58:48</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>43</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199523</fphm> <kprq>20160303 14:00:11</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>44</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199524</fphm> <kprq>20160303 14:02:45</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>45</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199525</fphm> <kprq>20160303 14:04:04</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>46</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199526</fphm> <kprq>20160303 14:06:00</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>20448.11</je> <se>1226.89</se> <zfbz>N</zfbz> <xh>47</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199527</fphm> <kprq>20160307 11:24:32</kprq> <gmfnsrsbh>110106783995939</gmfnsrsbh> <je>50283.02</je> <se>3016.98</se> <zfbz>Y</zfbz> <xh>48</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199528</fphm> <kprq>20160307 11:26:36</kprq> <gmfnsrsbh>110106783995939</gmfnsrsbh> <je>51886.79</je> <se>3113.21</se> <zfbz>Y</zfbz> <xh>49</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199529</fphm> <kprq>20160307 11:35:41</kprq> <gmfnsrsbh>110106783995939</gmfnsrsbh> <je>50283.02</je> <se>3016.98</se> <zfbz>N</zfbz> <xh>50</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199530</fphm> <kprq>20160307 11:36:52</kprq> <gmfnsrsbh>110106783995939</gmfnsrsbh> <je>51886.79</je> <se>3113.21</se> <zfbz>N</zfbz> <xh>51</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199531</fphm> <kprq>20160310 11:39:04</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>84218.44</je> <se>5053.11</se> <zfbz>N</zfbz> <xh>52</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199532</fphm> <kprq>20160310 17:07:28</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>53</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199533</fphm> <kprq>20160310 17:12:42</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>23911.56</je> <se>1434.69</se> <zfbz>N</zfbz> <xh>54</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199534</fphm> <kprq>20160317 17:18:11</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>34106.16</je> <se>2046.37</se> <zfbz>N</zfbz> <xh>55</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199535</fphm> <kprq>20160321 11:58:10</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>465.58</je> <se>27.94</se> <zfbz>N</zfbz> <xh>56</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199536</fphm> <kprq>20160412 11:44:03</kprq> <gmfnsrsbh>441601749182176</gmfnsrsbh> <je>21650.94</je> <se>1299.06</se> <zfbz>N</zfbz> <xh>57</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199537</fphm> <kprq>20160412 11:46:11</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>58</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24199538</fphm> <kprq>20160412 11:48:16</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>26140.43</je> <se>1568.43</se> <zfbz>N</zfbz> <xh>59</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947256</fphm> <kprq>20160425 16:05:03</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>60</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947257</fphm> <kprq>20160425 16:07:05</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>7281.89</je> <se>436.91</se> <zfbz>N</zfbz> <xh>61</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947258</fphm> <kprq>20160426 17:33:48</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>56935.85</je> <se>3416.15</se> <zfbz>N</zfbz> <xh>62</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947259</fphm> <kprq>20160607 13:33:45</kprq> <gmfnsrsbh>91440000190351003U</gmfnsrsbh> <je>97087.38</je> <se>2912.62</se> <zfbz>Y</zfbz> <xh>63</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947260</fphm> <kprq>20160607 13:40:27</kprq> <gmfnsrsbh>91440000190351003U</gmfnsrsbh> <je>19911.46</je> <se>597.34</se> <zfbz>Y</zfbz> <xh>64</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947261</fphm> <kprq>20160607 17:14:14</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>65</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947262</fphm> <kprq>20160607 17:18:44</kprq> <gmfnsrsbh>31022869575617X</gmfnsrsbh> <je>6091.66</je> <se>365.50</se> <zfbz>N</zfbz> <xh>66</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947263</fphm> <kprq>20160607 17:36:18</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>76950.19</je> <se>4617.01</se> <zfbz>N</zfbz> <xh>67</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947264</fphm> <kprq>20160607 17:37:46</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>68</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947265</fphm> <kprq>20160607 17:39:49</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>69</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947266</fphm> <kprq>20160607 17:41:03</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>70</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947267</fphm> <kprq>20160607 17:42:28</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>71</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947268</fphm> <kprq>20160607 17:43:23</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>72</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947269</fphm> <kprq>20160607 17:46:36</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>44303.26</je> <se>2658.20</se> <zfbz>N</zfbz> <xh>73</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947270</fphm> <kprq>20160608 12:56:10</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>74</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947271</fphm> <kprq>20160608 12:57:43</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>75</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947272</fphm> <kprq>20160608 12:59:23</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>65097.55</je> <se>3905.85</se> <zfbz>N</zfbz> <xh>76</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947273</fphm> <kprq>20160616 17:36:20</kprq> <gmfnsrsbh>91440000190351003U</gmfnsrsbh> <je>97087.38</je> <se>2912.62</se> <zfbz>N</zfbz> <xh>77</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947274</fphm> <kprq>20160616 17:41:26</kprq> <gmfnsrsbh>91440000190351003U</gmfnsrsbh> <je>19911.46</je> <se>597.34</se> <zfbz>N</zfbz> <xh>78</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947275</fphm> <kprq>20160622 11:52:50</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>18955.47</je> <se>1137.33</se> <zfbz>N</zfbz> <xh>79</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947276</fphm> <kprq>20160623 12:55:56</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>80052.88</je> <se>4803.17</se> <zfbz>N</zfbz> <xh>80</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947277</fphm> <kprq>20160623 17:18:44</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>81</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947278</fphm> <kprq>20160623 17:22:32</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>48811.51</je> <se>2928.69</se> <zfbz>N</zfbz> <xh>82</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947279</fphm> <kprq>20160630 11:44:56</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>94339.62</je> <se>5660.38</se> <zfbz>N</zfbz> <xh>83</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947280</fphm> <kprq>20160630 11:46:32</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>7771.70</je> <se>466.30</se> <zfbz>N</zfbz> <xh>84</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947281</fphm> <kprq>20160706 17:13:12</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>7253.25</je> <se>435.19</se> <zfbz>Y</zfbz> <xh>85</xh> </mxxx> <mxxx> <fpdm>4400153130</fpdm> <fphm>24947282</fphm> <kprq>20160706 17:21:08</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>7253.25</je> <se>435.19</se> <zfbz>N</zfbz> <xh>86</xh> </mxxx> <mxxx> <fpdm>4400154130</fpdm> <fphm>10394896</fphm> <kprq>20160713 11:53:26</kprq> <gmfnsrsbh>441601749182176</gmfnsrsbh> <je>21650.94</je> <se>1299.06</se> <zfbz>Y</zfbz> <xh>87</xh> </mxxx> <mxxx> <fpdm>4400154130</fpdm> <fphm>10394897</fphm> <kprq>20160714 11:53:23</kprq> <gmfnsrsbh>320111790421052</gmfnsrsbh> <je>71216.98</je> <se>4273.02</se> <zfbz>N</zfbz> <xh>88</xh> </mxxx> <mxxx> <fpdm>4400154130</fpdm> <fphm>10394898</fphm> <kprq>20160720 10:58:42</kprq> <gmfnsrsbh>440106749182803</gmfnsrsbh> <je>13698.11</je> <se>821.89</se> <zfbz>N</zfbz> <xh>89</xh> </mxxx> <mxxx> <fpdm>4400154130</fpdm> <fphm>10394899</fphm> <kprq>20160728 12:25:07</kprq> <gmfnsrsbh>914416027491821765</gmfnsrsbh> <je>21650.94</je> <se>1299.06</se> <zfbz>N</zfbz> <xh>90</xh> </mxxx> </zyfpkjmx> <zyfpkjhjxx> <zyfpkjhjs>90</zyfpkjhjs> <zzszyfphjJe>6134426.75</zzszyfphjJe> <zzszyfphjSe>361045.81</zzszyfphjSe> </zyfpkjhjxx> <ptfpkjmx /> <ptfpkjhjxx> <ptfpkjhjs>0</ptfpkjhjs> <ptfpkjhjJe>0</ptfpkjhjJe> <ptfpkjhjSe>0</ptfpkjhjSe> </ptfpkjhjxx> </body> </sbbZzsfpkjmx></taxML><doc>
目标是将以下标签内内容提取成列表格式:
<fpdm>...</fpdm> <fphm>...</fphm> <kprq>...</kprq> <gmfnsrsbh>...</gmfnsrsbh> <je>...</je> <se>...</se> <zfbz>...</zfbz> <xh>...<z/xh>
Code(粗糙应用版):
from bs4 import BeautifulSoupimport xlwtwith open(‘cww.xml‘, ‘r‘) as f: xml_doc =f.read() #读取xml文本内容soup = BeautifulSoup(xml_doc, ‘html.parser‘)keyword = [‘fpdm‘,‘fphm‘,‘kprq‘,‘gmfnsrsbh‘,‘je‘,‘se‘,‘zfbz‘,‘xh‘] #关键词listdatatable = xlwt.Workbook(encoding=‘utf-8‘, style_compression=0) newsheet = datatable.add_sheet(‘mxxx‘, cell_overwrite_ok=True) #新建excel文档sheetnum = 0 #列for i in range(len(keyword)): newsheet.write(0, num, keyword[i]) #写入每列keyword info_list = [] for se in soup.find_all(keyword[i]): info = se.get_text() info_list.append(info) #找出所有对应标签内的text组成list print(info_list) for i in range(len(info_list)): newsheet.write(i+1, num, info_list[i]) #将该list中数据以列写入excel表 num += 1 #列数加一,继续遍历关键词写入excel表格datatable.save(‘liez.xls‘)
整理结果如图:
【待续】
【Python】Xml To Excel
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。