首页 > 代码库 > Linux文件系统之inode与软硬连接

Linux文件系统之inode与软硬连接

一、inode是什么?

理解inode,要从文件储存说起。

文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存512字节(相当于0.5KB)。

操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即连续八个 sector组成一个 block。

文件数据都储存在"块"中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为"索引节点"。

每一个文件都有对应的inode,里面包含了与该文件有关的一些信息。

二、inode的内容

inode包含文件的元信息,具体来说有以下内容:

  * 文件的字节数

  * 文件拥有者的User ID

  * 文件的Group ID

  * 文件的读、写、执行权限

  * 文件的时间戳,共有三个:ctime指inode上一次变动的时间,mtime指文件内容上一次变动的时间,atime指文件上一次打开的时间。

  * 链接数,即有多少文件名指向这个inode

  * 文件数据block的位置

inode结构图:

技术分享

inode要记录的数据非常多,但偏偏只有128bytes而已,而inode记录一个block号码要花掉4bytes,假设我一个文件有400MB,且每个block为4KB时,那么至少也要10万条block号码的记录。inode哪有那么多可记录的信息?为此,我们的系统聪明的将inode记录block号码的区域定义为12个直接,1个双间接,一个3间接记录区 这样子inode能够指定多少个block呢?我们以较小的1KB的block来说明:

(1) 12个直接指向   12*1K = 12K
(2)每条block号码的记录会花去4bytes,因此1K的block大小能够记录256条记录。所以间接地256*1K = 256K
(3)双间接 256*256*1K = 256^2K
 (4)三间接     256*256*256*1K = 256^3K

总额:12+256+256*256+256+256+256=16GB 此时我们知道当文件系统将block格式化为1K大小时,能够容纳的最大文件为16GB,比较一下文件系统的限制表的结果可以发现结果是一致的。但是这个方法不能够用在2K及4K的block大小的计算中,因为2K的block将会受到Ext2文件系统本身的限制,所以计算的结果会有不符合 。

可以用stat命令,查看某个文件的inode信息:

[root@localhost ~]# stat anaconda-ks.cfg 
  File: `anaconda-ks.cfg‘
  Size: 1874            Blocks: 8          IO Block: 4096   regular file
Device: fd00h/64768d    Inode: 131083      Links: 1
Access: (0600/-rw-------)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2016-12-29 16:35:26.562699425 +0800
Modify: 2016-12-26 15:29:45.735999937 +0800
Change: 2016-12-26 15:29:49.750999936 +0800

总之,除了文件名以外的所有文件信息,都存在inode之中。至于为什么没有文件名,下文会有详细解释。

三、inode的大小

inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是inode区(inode table),存放inode所包含的信息。

每个inode节点的大小,一般是128字节或256字节。inode节点的总数,在格式化时就给定,一般是每1KB或每2KB就设置一个inode。假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每1KB就设置一个inode,那么inode table的大小就会达到128MB,占整块硬盘的12.8%。

查看每个硬盘分区的inode总数和已经使用的数量,可以使用df命令:

[root@localhost ~]# df -i
Filesystem            Inodes IUsed   IFree IUse% Mounted on
/dev/mapper/vg0-root 1310720  7556 1303164    1% /
tmpfs                 125517     1  125516    1% /dev/shm
/dev/sda1              51200    38   51162    1% /boot
/dev/mapper/vg0-usr   655360 25449  629911    4% /usr
/dev/mapper/vg0-var  1310720  1132 1309588    1% /var

查看每个inode节点的大小,可以用如下命令:

[root@localhost ~]# dumpe2fs -h /dev/sda1 | grep ‘Inode size‘ 
dumpe2fs 1.41.12 (17-May-2010)
Inode size:               128

或者 # tune2fs -l /dev/sda7 | grep "Inode size" Inode size: 256

由于每个文件都必须有一个inode,因此有可能发生inode已经用光,但是硬盘还未存满的情况。这时,就无法在硬盘上创建新文件。

四、inode号码

每个inode都有一个号码,操作系统用inode号码来识别不同的文件。

这里值得重复一遍,Unix/Linux系统内部不使用文件名,而使用inode号码来识别文件。对于系统来说,文件名只是inode号码便于识别的别称或者绰号。

表面上,用户通过文件名,打开文件。实际上,系统内部这个过程分成三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在block,读出数据。

使用ls -i命令,可以看到文件名对应的inode号码:

[root@localhost ~]# ls -i anaconda-ks.cfg 
131083 anaconda-ks.cfg

五、目录文件

Unix/Linux系统中,目录(directory)也是一种文件。打开目录,实际上就是打开目录文件。

目录文件的结构非常简单,就是一系列目录项(dirent)的列表。每个目录项,由两部分组成:所包含文件的文件名,以及该文件名对应的inode号码。

inode与目录关系图:

技术分享ls命令只列出目录文件中的所有文件名:

[root@localhost ~]# ls /var/log
anaconda.ifcfg.log    anaconda.yum.log  cron        maillog   secure
anaconda.log          audit             dmesg       messages  spooler
anaconda.program.log  boot.log          dmesg.old   ntpstats  tallylog
anaconda.storage.log  btmp              dracut.log  prelink   wtmp
anaconda.syslog       ConsoleKit        lastlog     sa        yum.log

ls -i命令列出整个目录文件,即文件名和inode号码:

[root@localhost ~]# ls -i /var/log
524312 anaconda.ifcfg.log    524293 ConsoleKit  524305 prelink
524308 anaconda.log          524322 cron        524302 sa
524310 anaconda.program.log  524318 dmesg       524299 secure
524311 anaconda.storage.log  524314 dmesg.old   524301 spooler
524309 anaconda.syslog       524307 dracut.log  524292 tallylog
524313 anaconda.yum.log      524294 lastlog     524295 wtmp
524306 audit                 524300 maillog     524342 yum.log
524319 boot.log              524298 messages
524296 btmp                  524303 ntpstats

如果要查看文件的详细信息,就必须根据inode号码,访问inode节点,读取信息。ls -l命令列出文件的详细信息。

[root@localhost ~]# ls -l /var/log
total 1328
-rw-------. 1 root root   2646 Dec 26 15:29 anaconda.ifcfg.log
-rw-------. 1 root root  23138 Dec 26 15:29 anaconda.log
-rw-------. 1 root root  45436 Dec 26 15:29 anaconda.program.log
-rw-------. 1 root root 113674 Dec 26 15:29 anaconda.storage.log
...

理解了上面这些知识,就能理解目录的权限。目录文件的读权限(r)和写权限(w),都是针对目录文件本身。由于目录文件内只有文件名和inode号码,所以如果只有读权限,只能获取文件名,无法获取其他信息,因为其他信息都储存在inode节点中,而读取inode节点内的信息需要目录文件的执行权限(x)。

六、inode的特殊作用

由于inode号码与文件名分离,这种机制导致了一些Unix/Linux系统特有的现象。

1.有时,文件名包含特殊字符,无法正常删除。这时,直接删除inode节点,就能起到删除文件的作用。

  

2.打开一个文件以后,系统就以inode号码来识别这个文件,不再考虑文件名。因此,通常来说,系统无法从inode号码得知文件名。   

3.cp与inode:分配一个空闲的inode号,在inode表中生成新条目在目录中创建一个目录项,将名称与inode编号关联拷贝数据生成新的文件。

4.rm与inode:链接数递减,从而释放的inode号可以被重用把数据块放空闲列表中删除目录项数据实际上不会马上被删除,但当另一个文件使用数据块时将被覆盖。

5.mv与inode:如果mv命令的目标和源在相同的文件系统,作为mv 命令用新的文件名创建对应新的目录项删除旧目录条目对应的旧的文件名不影响inode表(除时间戳)或磁盘上的数据位置:没有数据被移动!如果目标和源在一个不同的文件系统, mv相当于cp和rm。如果mv命令的目标和源在相同的文件系统,作为mv 命令用新的文件名创建对应新的目录项删除旧目录条目对应的旧的文件名不影响inode表(除时间戳)或磁盘上的数据位置:没有数据被移动!如果目标和源在一个不同的文件系统, mv相当于cp和rm。

注:第3点使得软件更新变得简单,可以在不关闭软件的情况下进行更新,不需要重启。因为系统通过inode号码,识别运行中的文件,不通过文件名。更新的时候,新版文件以同样的文件名,生成一个新的inode,不会影响到运行中的文件。等到下一次运行这个软件的时候,文件名就自动指向新版文件,旧版文件的inode则被回收。

七、POSIX inode

POSIX标准强制规范了文件系统的行为。每个“文件系统对象”必须具有:

以字节为单位表示的文件大小。
设备ID,标识容纳该文件的设备。
文件所有者的User ID。
文件的Group ID
文件的模式(mode),确定了文件的类型,以及它的所有者、它的group、其它用户访问此文件的权限。
额外的系统与用户标志(flag),用来保护该文件。
3个时间戳,记录了inode自身被修改(ctime, inode change time)、文件内容被修改(mtime, modification time)、最后一次访问(atime, access time)的时间。
1个链接数,表示有多少个硬链接指向此inode。
到文件系统存储位置的指针。通常是1K字节或者2K字节的存储容量为基本单位。

使用stat系统调用可以查询一个文件的inode号码及一些元信息。

八、软连接与硬链接

从 inode 了解 Linux 文件系统

硬链接与软链接是 Linux 文件系统中的一个重要概念,其涉及文件系统中的索引节点 (index node 又称 inode),而索引节点对象是 Linux 虚拟文件系统 (VFS) 的四个基本概念之一。通过剖析硬链接与软链接的联系与区别,我们可更好的了解 Linux 中 VFS 这一通用文件模型。并让 Linux 普通用户和系统管理员正确使用硬链接与软链接,帮助文件系统开发者获取 inode 的相关知识。

硬链接与软链接的联系与区别

我们知道文件都有文件名与数据,这在 Linux 上被分成两个部分:用户数据 (user data) 与元数据 (metadata)。用户数据,即文件数据块 (data block),数据块是记录文件真实内容的地方;而元数据则是文件的附加属性,如文件大小、创建时间、所有者等信息。在 Linux 中,元数据中的 inode 号(inode 是文件元数据的一部分但其并不包含文件名,inode 号即索引节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过 inode 号寻找正确的文件数据块。图 1.展示了程序通过文件名获取文件内容的过程。

图 1. 通过文件名打开文件

技术分享

为解决文件的共享使用,Linux 系统引入了两种链接:硬链接 (hard link) 与软链接(又称符号链接,即 soft link 或 symbolic link)。链接为 Linux 系统解决了文件的共享使用,还带来了隐藏文件路径、增加权限安全及节省存储等好处。若一个 inode 号对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件使用了多个别名(见 图 2.hard link 就是 file 的一个别名,他们有共同的 inode)。

硬链接可由命令 link 或 ln 创建。

[root@localhost ~]# ls -i anaconda-ks.cfg 
131083 anaconda-ks.cfg
[root@localhost ~]# ln anaconda-ks.cfg anaconda-hardlink
[root@localhost ~]# ls -i anaconda-hardlink 
131083 anaconda-hardlink
[root@localhost ~]# ll anaconda-hardlink 
-rw-------. 2 root root 1874 Dec 26 15:29 anaconda-hardlink
[root@localhost ~]# ll anaconda-ks.cfg 
-rw-------. 2 root root 1874 Dec 26 15:29 anaconda-ks.cfg

运行上面这条命令以后,源文件与目标文件的inode号码相同,都指向同一个inode。inode信息中有一项叫做"链接数",记录指向该inode的文件名总数,这时就会增加1。

反过来,删除一个文件名,就会使得inode节点中的"链接数"减1。当这个值减到0,表明没有文件名指向这个inode,系统就会回收这个inode号码,以及其所对应block区域。

这里顺便说一下目录文件的"链接数"。创建目录时,默认会生成两个目录项:"."和".."。前者的inode号码就是当前目录的inode号码,等同于当前目录的"硬链接";后者的inode号码就是当前目录的父目录的inode号码,等同于父目录的"硬链接"。所以,任何一个目录的"硬链接"总数,总是等于2加上它的子目录总数(含隐藏目录)。

由于硬链接是有着相同 inode 号仅文件名不同的文件,因此硬链接存在以下几点特性:

文件有相同的 inode 及 data block;
只能对已存在的文件进行创建;
不能交叉文件系统进行硬链接的创建;   ##node 号仅在各文件系统下是唯一的,当 Linux 挂载多个文件系统后将出现 inode 号重复的现象,因此硬链接创建时不可跨文件系统
不能对目录进行创建,只可对文件创建;
删除一个硬链接文件并不影响其他有相同 inode 号的文件。

硬链接特性展示

 # ls -li 
 total 0 

 // 只能对已存在的文件创建硬连接
 # link old.file hard.link 
 link: cannot create link `hard.link‘ to `old.file‘: No such file or directory 

 # echo "This is an original file" > old.file 
 # cat old.file 
 This is an original file 
 # stat old.file 
  File: `old.file‘
  Size: 25           Blocks: 8          IO Block: 4096   regular file 
 Device: 807h/2055d      Inode: 660650      Links: 2 
 Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root) 
 ... 
 // 文件有相同的 inode 号以及 data block 
 # link old.file hard.link | ls -li 
 total 8 
 660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 hard.link 
 660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 old.file 

 // 不能交叉文件系统
 # ln /dev/input/event5 /root/bfile.txt 
 ln: failed to create hard link `/root/bfile.txt‘ => `/dev/input/event5‘: 
 Invalid cross-device link 

 // 不能对目录进行创建硬连接
 # mkdir -p old.dir/test 
 # ln old.dir/ hardlink.dir 
 ln: `old.dir/‘: hard link not allowed for directory 
 # ls -iF 
 660650 hard.link  657948 old.dir/  660650 old.file

查找有相同 inode 号的文件

 # df -i --print-type 
 Filesystem     Type       Inodes  IUsed    IFree IUse% Mounted on 
 /dev/sda7      ext4      3147760 283483  2864277   10% / 
 udev           devtmpfs   496088    553   495535    1% /dev 
 tmpfs          tmpfs      499006    491   498515    1% /run 
 none           tmpfs      499006      3   499003    1% /run/lock 
 none           tmpfs      499006     15   498991    1% /run/shm 
 /dev/sda6      fuseblk  74383900   4786 74379114    1% /media/DiskE 
 /dev/sda8      fuseblk  29524592  19939 29504653    1% /media/DiskF 

 # find / -inum 1114 
 /media/DiskE/Pictures/t3.jpg 
 /media/DiskF/123.txt 
 /bin/sync

软链接与硬链接不同,若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软连接。软链接就是一个普通文件,只是数据块内容有点特殊。软链接有着自己的 inode 号以及用户数据块(见 图 2.)。因此软链接的创建与使用没有类似硬链接的诸多限制:

软链接有自己的文件属性及权限等;
可对不存在的文件或目录创建软链接;
软链接可交叉文件系统;
软链接可对文件或目录创建;
创建软链接时,链接计数 i_nlink 不会增加;
删除软链接并不影响被指向的文件,但若被指向的原文件被删除,则相关软连接被称为死链接(即 dangling link,若被指向路径文件被重新创建,死链接可恢复为正常的软链接)。

图 2. 软链接的访问

技术分享

软链接特性展示

 # ls -li 
 total 0 

 // 可对不存在的文件创建软链接
 # ln -s old.file soft.link 
 # ls -liF 
 total 0 
 789467 lrwxrwxrwx 1 root root 8 Sep  1 18:00 soft.link -> old.file 

 // 由于被指向的文件不存在,此时的软链接 soft.link 就是死链接
 # cat soft.link 
 cat: soft.link: No such file or directory 

 // 创建被指向的文件 old.file,soft.link 恢复成正常的软链接
 # echo "This is an original file_A" >> old.file 
 # cat soft.link 
 This is an original file_A 

 // 对不存在的目录创建软链接
 # ln -s old.dir soft.link.dir 
 # mkdir -p old.dir/test 
 # tree . -F --inodes 
 . 
├── [ 789497]  old.dir/ 
│   └── [ 789498]  test/ 
├── [ 789495]  old.file 
├── [ 789495]  soft.link -> old.file 
└── [ 789497]  soft.link.dir -> old.dir/

当然软链接的用户数据也可以是另一个软链接的路径,其解析过程是递归的。但需注意:软链接创建时原文件的路径指向使用绝对路径较好。使用相对路径创建的软链接被移动后该软链接文件将成为一个死链接(如下所示的软链接 a 使用了相对路径,因此不宜被移动),因为链接数据块中记录的亦是相对路径指向。

 $ ls -li 
 total 2136 
 656627 lrwxrwxrwx 1 harris harris       8 Sep  1 14:37 a -> data.txt
 656662 lrwxrwxrwx 1 harris harris       1 Sep  1 14:37 b -> a 
 656228 -rw------- 1 harris harris 2186738 Sep  1 14:37 data.txt 6

使用命令 find 查找软链接与硬链接

 // 查找在路径 /home 下的文件 data.txt 的软链接
 # find /home -lname data.txt 
 /home/harris/debug/test2/a 

 // 查看路径 /home 有相同 inode 的所有硬链接
 # find /home -samefile /home/harris/debug/test3/old.file 
 /home/harris/debug/test3/hard.link 
 /home/harris/debug/test3/old.file 

 # find /home -inum 660650 
 /home/harris/debug/test3/hard.link 
 /home/harris/debug/test3/old.file 

 // 列出路径 /home/harris/debug/ 下的所有软链接文件
 # find /home/harris/debug/ -type l -ls 
 656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a
 656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> 
 data.txt
 789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> 
 old.file 
 789496    0 lrwxrwxrwx   1 root     root            7 Sep  1 18:01 
 /home/harris/debug/test/soft.link.dir -> old.dir


本文出自 “追求不完美” 博客,请务必保留此出处http://yolynn.blog.51cto.com/11575833/1887870

Linux文件系统之inode与软硬连接