首页 > 代码库 > C++ string::size_type 类型【转】

C++ string::size_type 类型【转】

1 int main()2    {3        string str("Hello World!\n");4        cout << "The size of " << str << "is " << str.size()5             << " characters, including the newline" << endl;6        return 0;7    }
View Code

从逻辑上来讲,size() 

成员函数似乎应该返回整形数值,或是无符号整数。但事实上,size 操作返回的是 string::size_type 类型的值。

   string 类类型和许多其他库类型都定义了一些配套类型(companion type)。通过这些配套类型,库类型的使用就能与机器无关(machine-independent)。size_type 就是这些配套类型中的一种。它定义为与 unsigned 型(unsigned int 或 unsigned long)具有相同的含义,而且可以保证足够大能够存储任意 string 对象的长度。为了使用由 string 类型定义的 size_type 类型是由 string 类定义。任何存储stringsize操作结果的变量必须为string::size_type 类型。特别重要的是,还要把size的返回值赋给一个 int 变量。

   虽然我们不知道 string::size_type 的确切类型,但可以知道它是 unsigned 型。对于任意一种给定的数据类型,它的 unsigned 型所能表示的最大正数值比对应的 signed 型要大一倍。这个事实表明 size_type 存储的 string 长度是 int 所能存储的两倍。

   使用 int 变量的另一个问题是,有些机器上 int 变量的表示范围太小,甚至无法存储实际并不长的 string 对象。如在有 16 位 int 型的机器上,int 类型变量最大只能表示 32767 个字符的 string 对象。而能容纳一个文件内容的 string 对象轻易就会超过这个数字。因此,为了避免溢出,保存一个 stirng 对象 size 的最安全的方法就是使用标准库类型 string::size_type

 string str("some string"); for (string::size_type index = 0; index != str.size(); ++index)     cout << str[index] << endl;

 

来自http://blog.sina.com.cn/s/blog_4cb9953f0100duon.html

 

 =================================================================================================

 

相同知识点介绍文章:

来自http://xueqi.iteye.com/blog/1569713

 

从逻辑上来讲,size()成员函数似乎应该返回整型数值,或如2.2节“建议”中所述的无符号整数。但事实上,size操作返回的是string::size_type类型的值。我们需要对这种类型做一些解释。

string类类型和许多其他库类型都定义了一些伙伴类型(companion types)。这些伙伴类型使得库类型的使用是机器无关的(machine-independent)。size_type就是这些伙伴类型中的一种。它定义为与unsigned型(unsigned int或unsigned long)具有相同的含义,而且可以保证足够大可存储任意string对象的长度。为了使用由string类型定义的size_type类型,程序员必须加上作用域操作符来说明所使用的size_type类型是由string类定义的。

任何存储string的size操作结果的变量必须为string::size_type类型。特别重要的是,不要把size的返回值赋给一个int变量。

虽然我们不知道string::size_type的确切类型,但可以知道它是unsigned型(2.1.1节)。对于任意一种给定的数据类型,它的unsigned型所能表示的最大正数值比对应的signed要大一倍。这个事实表明size_type存储的string长度是int所能存储的两倍。

使用int变量的另一个问题是,有些机器上int变量的表示范围太小,甚至无法存储实际并不长的string对象。如在有16位int型的机器上,int类型变量最大只能表示32767个字符的string对象。而能容纳一个文件内容的string对象轻易就会超过这个数字。因此,为了避免溢出,保存一个string对象size的最安全的方法就是使用标准库类型string:: size_type。

 

--------------------------------------------------------------------------------------------------------

所有的查找函数都返回一个size_type类型,这个返回值一般都是所找到字符串的位置,如果没有找到,则返回string::npos。有一点需要特别注意,所有和string::npos的比较一定要用string::size_type来使用,不要直接使用int 或者unsigned int等类型。

--------------------------------------------------------------------------------------------------------

 

问题起源于这样一段代码:

01 #include <algorithm>
02 #include <stdio.h>
03
04 int main()
05 {
06     size_t indexs = -1;
07     size_t ps = 100;
08     int index = -1;
09     int p = 100;
10     printf("%d\n",std::min(p,index));
11     printf("%d\n",std::min(ps,indexs));
12     return 0;
13 }

 

其实是很简单的题目,不过要对size_t类型有一个了解才行。

关于size_t的来源

数据类型"socklen_t"和int应该具有相同的长度。否则就会破坏 BSD套接字层的填充.POSIX开始的时候用的是size_t, Linus Torvalds(他希望有更多的人,但显然不是很多) 努力向他们解释使用size_t是完全错误的,因为在64位结构中 size_t和int的长度是不一样的,而这个参数(也就是accept函数的第三参数)的长度必须和int一致,因为这是BSD套接字接口标准.最终POSIX的那帮家伙找到了解决的办法,那就是创造了一个新的类型"socklen_t".Linux Torvalds说这是由于他们发现了自己的错误但又不好意思向大家伙儿承认,所以另外创造了一个新的数据类型 。

 

size_t在C语言中就有了,size_t和ssize_t是ANSI C提供的标准头文件里定义的一个"数据类型",其实并不是新的数据类型,不是关键字,是通过typedef从已有数据类型定义而来。

ANSI C总共提供了24个头文件。

<cstddef>里这么定义了

#include <stddef.h>

using ::size_t

using::ptrdiff_t

在/usr/lib/gcc/i486-linux-gnu/4.4/include下面

<stddef.h>里面我找到了这么几句:

#ifndef __SIZE_TYPE__

#define __SIZE__TYPE__ long unsigned int

#endif

#if !(defined(__GUNU__) && defined (size_t))

typedef __SIZE_TYPE__ size_t;

#ifdef __BEOS

typedef long ssize_t

没太看明白,不过从网上找到了不错的一个解释

 

size_t是为了方便系统之间的移植而定义的。

在32位系统上定义为 unsigned int

在64位系统上定义为 unsigned long

 

更准确的说法是在32位系统上是32位无符号整型

在64位系统上是64位无符号整型

 

size_t一般用来表示一种计数,比如有多少东西被拷贝等。

sizeof操作符的结果类型是size_t,

该类型保证能容纳实现所建立的最大对象的字节大小。

 

它的意义大致是"适于计量内存中可容纳的数据项目的个数的无符号整数类型"。

所以,它在数组下标和内存管理函数之类的地方广泛使用

 

ssize_t:

这个数据类型用来表示可以被执行读写操作的数据块的大小。它和size_t类似,但必须是signed。

再来看下size_t与size_type的区别

我觉得有一句话总结的很好:

size_t是全局的,而size_type是跟容器相关的。

找了下相关的文件:

/c++/4.3/bits/stl_tree.h,stl_list.h,stl_deque.h等直接这么定义了

typedef size_t size_type

stl_mutiset.h则这么定义的:

typedef typename _Rep_type::size_type size_type;

 

那么size_type到底是一种什么样的类型呢?

string类类型和许多其他库类型都定义了一些配套类型(companion type)。通过这些配套类型,库类型的使用就能与机器无关。size_type就是这些配套类型中的一种。

size_type被定义为与unsigned型(unsigned int, unsigned long)具有相同的含义,而且可以保证足够大能够存储任意string对象的长度。为而来使用由string类型定义的size_type类型。程序员必须加上作用于操作符来说明所使用的size_type类型是由string类定义的。

我们为什么不适用int变量来保存string的size呢?

使用int变量的问题是:有些机器上的int变量的表示范围太小,甚至无法存储实际并不长的string对象。如在有16位int型的机器上,int类型变量最大只能表示32767个字符的string对象。而能容纳一个文件内容的string对象轻易就能超过这个数字,因此,为了避免溢出,保存一个string对象的size的最安全的方法就是使用标准库类型string::size_type().

一点注意:虽然是在学习标准库string的时候巧遇了size_type类型,但是,其实vector库也可以定义size_type类型,在vector库中还有一个difference_type类型,该类型用来存储任何两个迭代器对象间的距离,所以是signed类型的。

 

啰啰嗦嗦说了这么多,其实关于这个问题文章里红字标注的部分就足够了。其他的看下加深印象即可,最开始的程序结果输出为:

-1 100。

 

====================================================================================

 

下面来自:http://www.cnblogs.com/debuging/archive/2012/07/27/2612090.html

关于string::size_type

size_type其实是string模板类定义的一种类型之一,它与 size_of的用法相似,只是它根据存储的类型返回字符串的长度.对于 string具体化,将根据char返回字符串的长度,在这种情况下,size_type与size_of等效.size_of是一种无符号类型.  
你说的   size_type   其实就是   unsigned   int   类型   其实并不正确,它要看其存储的类型.

 

size_type实际上是做为解决string类设计上的严重失误而引入的。

size_type是在string类内定义的一个无符号整形类型,由于string类里很多方法的返回值都是size_type类型的,所以必须使用size_type进行类型声明。
如下:
string   a= "abcdefg ";
string::size_type   idx;
idx   =   a.find( "h ");   //not   found,return   string::npos
if(   idx   ==   string::npos   )     //check   if   not   find
{
  .....
}

由于npos为find返回的特殊值(-1),而不幸的是,size_type类型为unsigned   int,所以
不同的编译器对npos的理解不同。
试想一下,用8字节来unsigned   int   来表示-1和用4字节表示,值是完全不同的。
这可能是string类设计时的一个致命缺陷,为了兼容和可移植性,
特定义size_type类型,在不同编译器中,size_type的解释也不同,这样就做到了可移植。

以上内容可见
STL:11.2.12节。

 

C++ string::size_type 类型【转】