首页 > 代码库 > Android SQLite性能分析

Android SQLite性能分析

作为Android预置的数据库模块,对SQLite的深入理解是非常有必要的,可以从中找到一些优化的方向。这里对SQLite的性能和内存进行了一些测试分析,对比了不同操作的执行性能和内存占用的情况,粗略地列在这里算是作个小结。


1. 基本架构


先了解一下SQLite主要架构 (详见《The Definitive Guide to SQLite》), 需要关注的是Compiler和Backend两个模块。正因为有一个虚拟机的存在,所以才有了Compiled Statement的价值,因为它可以减少前置的编译时间,直接到VDBE上执行。而Backend端的Pager,则是重要数据管理者,真正决定者数据操作的性能,以及内存占用。


这里不再赘述,详细的内容还是阅读有关SQLite介绍的资料。



2. 性能


这次测试基于Sumsung i9103和Google Nexus S1进行。使用Python脚本及adb指令通过Intent操作Android应用进行数据库操作。


i. SELECT操作

首先观察到SELECT在不同记录数下的峰值分布,可见整体上有上升的趋势。正如SQLite官方说的它并不适合存储大量数据,一定要控制其中的记录数量。

另外SELECT操作性能也取决于查询的栏位个数,而@行云进一步确认和返回栏位的内容大小有关,也就是栏位的内容和多少也需要权衡。



ii. 关于事务

事务是提高SQLite操作性能的一个重要技术,特别是SQLite实现了WAL,使得事务与SELECT不会互斥,大大提高了应用的性能。参见附2。


下面是未使用事务时,三类操作的平均值:


使用了事务后,各个操作的性能大幅下降。


但是问题是事务提交的时间会变长,这个时间一是需要形成新的峰值,另外也要平分到各个操作来看:

     

所以不能贪多,事务还是要及时提交。另外注意, 虽然Compiled Statement有利于性能表现,但还不如使用事务的效果来得直接。


iii. 不同机型的操作性能

先看SELECT操作的平均值在两种机型上的表现, 可以看到i9103上的波动性比较大,而Nexsus S1则一直保持稳定:

散点图,可以观察到时间分布情况:




再看另外三个操作的表现(上下两部分false和true分别表示为未使用事务和使用事务的情况):



运用WAL可以大幅提升性能,不过它也有一个副作用。它会导致数据查询需要进行两次,可以理解为一次在db文件,一次在wal文件。具体原因参见<<The Definitive Guide to SQLite>>最后一章。WAL是满1000Pages时才会合并到主数据库里,这个时机称为checking point, 可以进行配置。按默认的Page Size:1024计算,也就是当WAL文件接近1M时,进行检查。如果没有活动的事务使用这些pages,就会提交。而WAL的大小,对SELECT的影响表现不同。


下面是WAL对查询性能峰值影响的测试数据(i9103上测试),图中的true,false表示是否有WAL文件存在。


 *整体的平均值相差在1ms,但峰值的才是真正值得注意的。


为了避免WAL过大,可以选择调用SQLiteDatabase::disableWriteAheadLogging()强制合并到主数据库文件,这个调用会异步在SQLite内部执行,不会明显阻塞用户的线程。


*另外,SQLiteDatabase::query()只是对SQLiteDatabase::rawQuery()的封装,多了一个字串组装的过程,反而不如直接使用SQLiteDatabase::rawQuery()。



3. 内存 


SQLite以Page为单位存储数据,默认一个Page有1024字节,然后通过B- Tree组织起来(Table使用B+ Tree组织):



Lookaside则是SQLite应用的内存管理的技术,优化了内存的使用效率,主要思想是先分配一整块内存, 分成若干个slots,然后SQLite再按需使用。这个许多小内存分配器的思想是一样的。详见附1。


再解释一下Page Cache Overflow, 主要是在一个Page中的记录的数据无法刚好放在一个Page内,还要使用额外的另一个Page空间, 这就是Overflow Page。

     


Android还有个万能dumpsys, 使用dumpsys meminfo可以查看到一个进程的SQLite使用的内存信息。如:

SQL

                heap:      265          MEMORY_USED:      265

  PAGECACHE_OVERFLOW:       73          MALLOC_SIZE:       46

 

 DATABASES

      pgsz     dbsz   Lookaside(b)          cache  Dbname

         4       60             17      199/114/1  webviewCache.db

                                          1/541/1  (pooled # 1) webviewCache.db


   . cache的三个值分别是:

        Page Cache的命中次数、未命中次数,以及Page Cache个数。可以在Android源码中的SQLiteDebug.java以及ActivityThread.java找到细节的内容。

   . page size, db size的单位是KBytes, Lookaside(b)是指使用多少个Lookaside的slots。

   . 对于Heap和Overflow Pages,SQLiteDatabase的内存回收可能没有那么及时,可以调用SQLiteDatabase::releaseMemory()进行主动释放。


*使用SQLite的PRAGMA可以直接获取一些通过SQLiteDatabase获取不到信息,当然如果SQLite不支持,也会抛异常出来,详见附4。


转载请注明出处: http://blog.csdn.net/horkychen  SQLite是一个非常精致的系统,很值得研究学习。


参考

  1. SQLite Dynamic Memory Allocation

  2. Write-Ahead Logging 或 SQLite的WAL机制

  3. The Definitive Guide to SQLite(两处关于架构和Overflow page的截图来于此书.)

  4. PRAGMA Statement

  5. 官方文档

  6. NEC关于Android系统上存储器操作性能的研究报告




Android SQLite性能分析