首页 > 代码库 > python读取excel数据
python读取excel数据
excel是很常用的表格工具。不过,对程序员来说,这可不是件好事件。因为excel的数据既不像txt那样,随意一种语言、脚本,写个函数就能把数据读出来分析。也不像JSON这种开源的数据格式,有N多的开源库来读取。就算没有,知道数据格式,自己写个库也自己用不至于太难。
要想读取excel的数据,大多使用ODBC数据库驱动或者COM的方式。对于ODBC,不同的语言有不同的实现,如java的JDBC。而对于COM方式,几乎是在后台运行一个excel程序,像new Excel.Application(),相当于用自己的程序,去控制别人的程序。逻辑不是自己实现的,不能完全控制,总不大好。
一开始我想用Qt通过ODBC驱动来读取。代码如下:
QSqlDatabase db = QSqlDatabase::addDatabase("QODBC","excelexport"); if( !db.isValid()) return; //! type error QString dsn = "DRIVER={Microsoft Excel Driver (*.xls)};" "DSN=‘‘;FIRSTROWHASNAMES=0;READONLY=FALSE;CREATE_DB=\"item.xls\";DBQ=item.xls"; db.setDatabaseName(dsn); // open connection if( !db.open()) { qDebug()<<"error"; return; //! db error } qDebug()<<db.tables(QSql::AllTables); qDebug()<<db.tables(QSql::Tables); qDebug()<<db.tables(QSql::SystemTables); qDebug()<<db.tables(QSql::Views);
测试文件item.xls里有item、award两个sheet,但是输出却如下:
("award$", "item$", "item$_")
()
()
()
我一直没搞明白item$_这个表是怎么出现的。是我的参数不对,还是逻辑错误,还是本身Qt对Excel的数据库驱动有问题???知道的还请多多指教。
Qt没做成功,后来找到了python。因为python有个开源(BSD License)的库xlrd(也许其他语言也有,只是我孤陋寡闻),专门读取excel数据。试了一下,感觉还很不错。
下载python:https://www.python.org/
下载xlrd:https://pypi.python.org/pypi/xlrd
xlrd帮助文档:http://www.python-excel.org/
基本代码一例(在帮助文档里该有的都有了,别告诉我说看不懂):
from xlrd import open_workbook,cellname book = open_workbook(‘odd.xls‘) sheet = book.sheet_by_index(0) print sheet.name print sheet.nrows print sheet.ncols for row_index in range(sheet.nrows): for col_index in range(sheet.ncols): print cellname(row_index,col_index),‘-‘, print sheet.cell(row_index,col_index).value
其实在http://www.python-excel.org/上可以看到,xlrd、xlwt都属于xlutils,xlrd是读excel文件,xlwt是写excel文件。xlutils则是两都的合并。