首页 > 代码库 > python处理word文件:win32com用法详解

python处理word文件:win32com用法详解

目标:用python处理doc文件

方法:引入win32com模块


**************************************************************************

一、安装

**************************************************************************


首先要先下载安装win32com模块(起先在linux下装不成功,后在windows下面成功了。。。)

下载地址:http://sourceforge.net/projects/pywin32/files/

python处理word文件:win32com用法详解


python处理word文件:win32com用法详解


python处理word文件:win32com用法详解找到正确匹配的

 


python处理word文件:win32com用法详解

 python处理word文件:win32com用法详解python处理word文件:win32com用法详解python处理word文件:win32com用法详解


下载之后,安装即可:

python处理word文件:win32com用法详解


**************************************************************************

二、应用1 拷贝doc文件内容

**************************************************************************


现在,就可以用起来了。

以下是一个实例,将D:\a.doc中的内容复制到新的doc中去,新文件命名为D:\b.doc

mt.py

#-*- encoding: utf8 -*-

‘‘‘

Created on 2011-12-01

处理doc文件

@author : 

‘‘‘

from win32com import client    #将模块加载进来

 python处理word文件:win32com用法详解word = client.Dispatch(‘Word.Application‘)    

 

 python处理word文件:win32com用法详解#word.Visible = 0    

 

# 打开一个已存在的文件

 python处理word文件:win32com用法详解doc = word.Documents.Open( r‘D:\a.doc‘)   

 

# newdoc为新word文件

newdoc = word.Documents.Add()

 python处理word文件:win32com用法详解docC = word.Documents.Count    

 

#打印doc(第一个word文件)内容,中文不能打,报错

print doc.Content    

 python处理word文件:win32com用法详解#range = newdoc.Range(0,0)

 

range = newdoc.Range()#尾部

 python处理word文件:win32com用法详解#range = newdoc.Range(doc.Content.Strat,doc.Content.end)

 

#range.InsertBefore(‘daisy‘)#在范围前写入字符串

 python处理word文件:win32com用法详解range.InsertAfter(doc.Content)   

 

newdoc.SaveAs(r‘D:\b.docx‘)  #另存为b.docx(office2010)

 

# 关闭

doc.Close()

newdoc.Close()

word.Quit()

部分参考于:http://hi.baidu.com/?????/blog/item/70e7f388a7ea97ba0f244494.html

 

 

#链接word应用进程

 

#可视化1(可以看见该word进程),不可视0(后台运行word进程).

 

#后面打开的文件前面加r,不加的话后面的\就变成了转义字符。得是中文名

 

获取打开word进程个数,此时为2

 

 

取得Range物件,文件的最首端。

 

# 取得Range物件,范围整份文件

 

#将doc的内容添加到newdoc的最后

 

 

 

 

 

 


python处理word文件:win32com用法详解


**************************************************************************

二、应用2 实际应用

**************************************************************************


下面来实现最初的目的:将教育学文件夹下的02-09(教育学09.doc)年的试题合并到out.docx中去。

edutest.py

#-*- encoding: utf8 -*-

‘‘‘

Created on 2011-12-01

处理word文件

@author : xiaodi

‘‘‘

import os, string, shutil

from win32com import client

#原本叫做教师资格证,教育学

 

 python处理word文件:win32com用法详解dirname = "D:\\Learning\\other\\Teacher\\Edu"

 

word = client.Dispatch(‘Word.Application‘)

newdoc = word.Documents.Add()    #*0*.doc

 python处理word文件:win32com用法详解for filen in os.listdir(dirname):

 python处理word文件:win32com用法详解    if ‘0‘ not in filen:

        continue

 python处理word文件:win32com用法详解    fileinname = os.path.join(dirname,filen)

    doc = word.Documents.Open( fileinname)

   #fileoutname = os.path.join(dirname,‘out2.docx‘)

    # print fileoutname

    # shutil.copy(fileinname,fileoutname)

    range = newdoc.Range()

    range.InsertAfter(fileinname + ‘\n‘)

    

 python处理word文件:win32com用法详解range.InsertAfter(doc.Content)

    range.InsertAfter(‘\n‘)

    doc.Close()

 python处理word文件:win32com用法详解newdoc.SaveAs(r"D:\Learning\other\Teacher\Edu\out.docx")

newdoc.Close()

word.Quit()

print ‘ok‘



python处理word文件:win32com用法详解






**************************************************************************

三、总结

**************************************************************************

几年前搞的东西了,现在直接从原本存的word文档拷贝过来。(20131218)

看样子还是失败的例子。。.