首页 > 代码库 > 看完这篇文章才对【GIT】有了大彻大悟的认识
看完这篇文章才对【GIT】有了大彻大悟的认识
git定义:版本管理工具
历史:没有git的时候,我们修改完一个文件,要先把文件拷贝一个副本到备份文件夹中,还要建个文档来记录当前文件的信息和操作记录。当文件多的时候,人工操作起来将是个非常辛苦非常庞大的工作量。
如今:有了git帮我们管理这些副本,为我们节约了非常大的人力成本,让我们的工作变得更加轻松。我们不要把git看得那么神秘,git的核心就是创建备份和恢复备份,但是衍生出一堆的新概念,有很多同学因为被困在这些抽象概念上而不能利用好git,本文章是从文件的层面出发来理解git原理和git命令是怎么来创建副本和恢复副本的。,无论是分支、HEAD、快照、仓库、还是工作区等,都是存在硬盘上的文件。
基础理论知识:
1.文件系统:我们可以把硬盘理解成一本汉语词典,词典前面的索引部分就是文件系统,能帮助我们快速找到文件内容的具体位置。我们知道从操作系统删除文件,其实只是删除了索引,具体文件内容还是存在硬盘上的。
2.git快照:快照并不是整个项目文件夹的副本,快照仅仅是一个记录文件结构的文档。我们知道git是通过快照来管理版本的,快照就是git的文件系统,每一份快照就是一份文件索引,每次commit就是创建一份快照,并给快照起一个编号,这个编号就是HEAD。在工作中,git通过head找到快照,通过快照找到备份到仓库中的文件。快照记录了文件的概要信息,包括校验值(通过对文件内容进行一系列算法获得),通过对比两个文件的校验值就可以快速判断两个文件内容是否一样。
3.git仓库:仓库才是真正存放文件内容的地方,快照/索引关联的就是仓库中的文件。没有git的时候我们会把创建的副本拷贝到一个备份文件夹管理起来,这个地方现在被git仓库替代,但是git仓库不是简单的拷贝一份一模一样的文件,而是经过压缩的,这些压缩文件存放在.git/objects目录中,直接打开是乱码。
4.工作区:工作区就是除开.git目录的其他东西。通过操作系统的文件索引来管理的内容。就是我们正常使用电脑的时候所看到,能编辑的内容。
5.暂存区/缓冲区:缓冲区并不存放文件内容,缓冲区仅仅是一份处于编辑状态的快照(索引文件),这份快照没有编号。commit就是把缓冲区保存一个副本,并加上一个编号(HEAD/版本号)指向这个快照副本。快照中保存的是项目中的所有文件信息,并建立索引跟仓库中的文件关联起来。
同学们可以通过下面的图片来理解以上几个概念,下图中的每个方块都是存放在硬盘上的文件,git就是建立了这样一个关系库来管理版本的。
大家不要被上图的复杂线条缩困扰,你只需要弄清HEAD就行了,我们移动HEAD指针其实就是通过HEAD编号找到快照,再通过快照找到这个HEAD的所有文件。
git命令的理解:
1、status
1.1、对比缓冲区跟工作区,对比结果主要存在3种情况:
1.1.1、【删】缓冲区记录的文件在工作区没有,add的时候会从缓冲区移除对应的文件索引,但并不影响git仓库的内容。
1.1.2、【增】工作区已有的文件在缓冲区没有记录的,add的时候会把对应的文件拷贝到仓库中,并在缓冲区建立一条索引指向仓库中对应的文件。
1.1.3、【改】对工作区的文件内容进行算法得出校验值与缓冲区记录的校验值不同,add的时候会把对应的文件拷贝到仓库中,并更新缓冲区该条索引的信息。
1.2、对比缓冲区与当前HEAD所指向的快照,对比结果也是增、删、改3种情况:
2、add
add会执行2个任务,第一是把【增】【改】的文件拷贝到仓库,第二个是维护缓冲区索引,保证缓冲区索引跟操作系统的文件索引内容一致,快照索引指向的是仓库中的文件,操作系统索引指向的是工作区的文件。
3、commit
commit做的事情就简单些了,先对比缓冲区与工作区,当缓冲区与工作区内容相同的时候,直接保存缓冲区为一份新的快照、并给这个快照生成1个编号,并把当前分支HEAD改成这个编号。
4、reset
reset分2情况:
4.1、reset文件:reset b86563 b.txt ,将b86563这份快照中b.txt索引复制到缓冲区的b.txt的索引。仅仅是对缓冲区的索引进行修改,不影响文件内容,仅仅是修改了文件的关联。
4.2、reset HEAD:reset b86563
4.2.1、参数--soft:仅仅修改HEAD/版本号。
4.2.2、参数--mixed:默认参数,修改当前HEAD/版本号,然后用指定的快照覆盖缓冲区,工作区不变。
4.2.3、参数--hard:修改当前HEAD为参数中的HEAD,用参数HEAD关联的快照覆盖缓冲区,并把工作区恢复到快照创建时的工作区状态,实际就是对比这份“历史快照”与工作区,快照中没有的文件,从工作区删除,校验码不同以及工作区没有的文件,通过快照找到关联的文件(仓库中的),并复制到工作区。
5、checkout
reset分2情况:
4.1、checkout分支:checkout dev ,切换到dev分支,并修改当前版本号为dev上最后一个版本号。如果dev分支不存在,创建一个名为dev的分支,版本号不变。
4.2、checkout HEAD:用HEAD关联的快照覆盖缓冲区,并把工作区恢复到快照创建时的工作区状态,checkout 快照与reset --hard的却别就是不修改当前HEAD,修改版本号,会“丢弃”掉该版本号之后的commit,可以理解成删除快照,比如我们在第5个版本上输入命令git log,会看到1、2、3、4、5这些head日志,当我们修改当前版本号为3之后再输入命令git log,就只能看到1、2、3这些head日志了。
6、revert
revert就是复制一个快照,并把HEAD修改为新创建快照的编号,用该快照覆盖缓冲区,并把工作区恢复到快照创建时的工作区状态。相当于一次checkout +commit
7、远程仓库
工作区的文件是可以编辑的,git仓库的文件是不能编辑的,git上传到远程仓库或从远程仓库下载的时候,并不是下载或上传全部文件。
7.1、上传的时候,远程仓库的最新快照编号肯定是包含在本地的快照日志中的,如果不存在,则证明远程仓库在上次下载后有改动,这时候要求先pull。反之,git会把本地新增的文件上传到远程仓库,并把新增的快照上传到远程快照。通过图1,我们可以看出git是怎么通过HEAD轻松的找到新增的快照和文件的。
7.2、下载的时候与上传同理...
如果还有什么不明白的可以加我QQ:158937496
看完这篇文章才对【GIT】有了大彻大悟的认识