首页 > 代码库 > pugixml的简单使用

pugixml的简单使用

一、简介

pugixml的官方主页为:http://pugixml.org/

pugixml是一个很棒的XML操作库,

  • 它很轻量,只有三个文件(pugiconfig.hpp   pugixml.cpp  pugixml.hpp )
  • 支持Unicode
  • 支持XPATH解析
  • 速度快,仅比RapidXml慢一些
  • 跨平台(windows/linux)
  • 面向对象

 

       Xml库解析性能比较表  

(表格来自:http://rapidxml.sourceforge.net/manual.html

 

二、配置

pugixml的三个文件,可以只include头文件pugixml.hpp,CPP文件不用放到项目中,

方法是,在pugiconfig.hpp中:

?
1
2
3
// Uncomment this to switch to header-only version
 #define PUGIXML_HEADER_ONLY
 #include "pugixml.cpp"

  将这两行的注释去掉就可以了。

另外,如果项目使用的是Unicode设置,则可以在pugiconfig.hpp中:

?
1
2
// Uncomment this to enable wchar_t mode
 #define PUGIXML_WCHAR_MODE

  将wchar模式打开即可。

 

三、使用

XML文件:

<?xml version="1.0" encoding="GBK"?>
<root>
    <ip>192.168.1.1</ip>
<root>

C++:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
void SaveToConfig( const wchar_t* xml_file, const wchar_t* ip )
{
    using namespace pugi;
 
    xml_document doc;
    xml_parse_result result = doc.load_file( xml_file );
    if ( result.status != xml_parse_status::status_ok )
        return;
 
    xml_node node = doc.child( L"root" ).child( L"ip" );
    node.text().set( ip );
 
    doc.save_file( xml_file );
}

  这里需要注意的是,ip节点的内容是一个pcdata类型的节点,这个节点的内容才是ip字符串,所以这里用text()来读写IP节点内容。

如果要用.value()方法得到ip字符串的话,需要这样用:

?
1
2
wstring ip = node.first_child().value();
node.first_child().set_value(L"10.10.10.10");

另外,node.text().set()方法也不错,提供了常用的数据类型写入XML的重载方法:

        // Set text (returns false if object is empty or there is not enough memory)
        bool set(const char_t* rhs);

        // Set text with type conversion (numbers are converted to strings, boolean is converted to "true"/"false")
        bool set(int rhs);
        bool set(unsigned int rhs);
        bool set(double rhs);
        bool set(bool rhs);

    #ifdef PUGIXML_HAS_LONG_LONG
        bool set(long long rhs);
        bool set(unsigned long long rhs);
    #endif

而node.text().as_xxx()方法可以按需要直接从XML文件中读取出指定类型的数据:

        // Get text, or "" if object is empty
        const char_t* get() const;

        // Get text, or the default value if object is empty
        const char_t* as_string(const char_t* def = PUGIXML_TEXT("")) const;

        // Get text as a number, or the default value if conversion did not succeed or object is empty
        int as_int(int def = 0) const;
        unsigned int as_uint(unsigned int def = 0) const;
        double as_double(double def = 0) const;
        float as_float(float def = 0) const;

    #ifdef PUGIXML_HAS_LONG_LONG
        long long as_llong(long long def = 0) const;
        unsigned long long as_ullong(unsigned long long def = 0) const;
    #endif

实际上node.text()返回的是xml_text对象实例,上面的set()和as_xxx()是由xml_text实现的。

 

如果IP节点有属性的话,可以遍历属性:

        for (pugi::xml_attribute attr = node.first_attribute(); attr; attr = attr.next_attribute())  
        {  
            std::cout << " " << attr.name() << "=" << attr.value();  
        }  

 

作为读取配置文件用,上面这些也差不多了,其它接口看看源码就能明白怎样用,pugixml提供了些高级用法,可以看他官网上提供的例子。

 

四、注意事项

除了上面提到的<ip>节点内容为pcdata节点外,

关于中文的问题,clever101曾在pugixml库的一个使用心得中提到,要用

std::locale::global(std::locale("chs"));  
const std::wstring strFilePath = _T(“c:\\ xgconsole.xml”);  
std::wifstream stream(strFilePath.c_str());  
pugi::xml_document doc;  
doc.load(stream);  

这种load stream的方式读取,其实不必如此,只要保证文件保存时编码为GB2312并且XML文件头的声明encoding="gb2312“就可以了。

<?xml version="1.0" encoding="gb2312"?>