每日一学--深究字节与字符

首页 > 代码库 > 每日一学--深究字节与字符

每日一学--深究字节与字符

2024-10-15 08:27:02 215人阅读

转载自:http://www.cnblogs.com/strivers/archive/2011/01/04/1925826.html

package com.suypower.chengyu.test;

public class ByteTest {

 /**
  * byte 8 bits -128 - + 127
  * 1 bit = 1 二进制数据
  * 1 byte = 8 bit
  * 1 字母 = 1 byte = 8 bit(位)
  * 1 汉字 = 2 byte = 16 bit
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
  byte b1 = 127;
  byte b2 = -128;
  byte b3 = ‘a‘;
  byte b4 = ‘A‘; // 一个字母 = 1 byte = 8 bit
//  byte b5 =‘aa‘;  这就错了
//  byte b6 =‘中‘; 这就错了 一个汉字 2个字节 16bit
  short s1 = ‘啊‘; // 一个汉字 2个字节 16bit short 是 16 bit位的
//  short s2 = ‘汉字‘;  // 2个汉字 4个字节 32 bit int 是32 bit的
//  int i1 = ‘汉字‘;  但是 int 是数字类型的 , char 是 16 bit的 = 2 byte = 一个汉字
  char c1 = ‘汗‘;
//  byte 转换 string
  String string = "中文";
  byte by[] = string.getBytes();
  String str = new String(by);
  System.out.println("str="+str);
 }

}

==================================================================================

        1 bit     = 1 二进制数据
        1 byte = 8 bit
        1 字母 = 1 byte = 8 bit
        1 汉字 = 2 byte = 16 bit

1. bit：位
一个二进制数据0或1，是1bit；

2. byte：字节
存储空间的基本计量单位，如：MySQL中定义 VARCHAR(45) 即是指 45个字节；
1 byte = 8 bit

3. 一个英文字符占一个字节；
1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节；
1 汉字 = 2 byte = 16 bit

5. 标点符号
A>. 汉字输入状态下，默认为全角输入方式；
B>. 英文输入状态下，默认为半角输入方式；

C>. 全角输入方式下，标点符号占2字节；
D>. 半角输入方式下，标点符号占1字节；

故：汉字输入状态下的字符，占2个字节 (但不排除，自己更改了默认设置)；
英文输入状态下的字符，占1个字节 (但不排除，自己更改了默认设置)；

老美在发明电脑时，肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位，于是也就有了不规范的1字符=1byte，岂不知还有我们伟大的汉字计量单位，NND，一个汉字也是一个字符，我们的1汉字字符就等于2byte，后来，他们可能意识到这个尴尬的问题，于是又标榜为：一个字母为一个标准字符，去球吧，谁整天没事说个字符还“标准字符”，所以啊，个人认为：字符，不能用于标准的计量单位。

转载自:http://blog.csdn.net/andyzhaojianhui/article/details/53785656

字符和字节的进阶

（一）“字节”的定义

字节（Byte）是一种计量单位，表示数据量多少，它是计算机信息技术用于计量存储容量的一种计量单位。

（二）“字符”的定义

字符是指计算机中使用的文字和符号，比如1、2、3、A、B、C、~！·#￥%……—*（）——+、等等。

（三）“字节”与“字符”

它们完全不是一个位面的概念，所以两者之间没有“区别”这个说法。不同编码里，字符和字节的对应关系不同：

①ASCII码中，一个英文字母（不分大小写）占一个字节的空间，一个中文汉字占两个字节的空间。一个二进制数字序列，在计算机中作为一个数字单元，一般为8位二进制数，换算为十进制。最小值0，最大值255。

②UTF-8编码中，一个英文字符等于一个字节，一个中文（含繁体）等于三个字节。

③Unicode编码中，一个英文等于两个字节，一个中文（含繁体）等于两个字节。

符号：英文标点占一个字节，中文标点占两个字节。举例：英文句号“.”占1个字节的大小，中文句号“。”占2个字节的大小。

④UTF-16编码中，一个英文字母字符或一个汉字字符存储都需要2个字节（Unicode扩展区的一些汉字存储需要4个字节）。

⑤UTF-32编码中，世界上任何字符的存储都需要4个字节。

每日一学--深究字节与字符

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 每日一学--深究字节与字符