首页 > 代码库 > .git文件过大!删除大文件

.git文件过大!删除大文件

在我们日常使用Git的时候,一般比较小的项目,我们可能不会注意到.git 这个文件。

其实, .git文件主要用来记录每次提交的变动,当我们的项目越来越大的时候,我们发现 .git文件越来越大。

很大的可能是因为提交了大文件,如果你提交了大文件,那么即使你在之后的版本中将其删除,但是,

实际上,记录中的大文件仍然存在。

为什么呢?仔细想一想,虽然你在后面的版本中删除了大文件,但是Git是有版本倒退功能的吧,那么如果大文件不记录下来,

git拿什么来给你回退呢?但是,.git文件越来越大导致的问题是: 每次拉项目都要耗费大量的时间,并且每个人都要花费

那么多的时间。。

git给出了解决方案,使用git branch-filter来遍历git history tree, 可以永久删除history中的大文件,达到让.git文件瘦身的目的。

下面给出步骤(以下步骤非常危险,操作需谨慎!别把公司删没了哈哈)

首先找出git中前五大的文件: 

git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -5

执行的结果实际上是这个样子的:

技术分享

第一行的字母其实相当于文件的id,用以下命令可以找出id 对应的文件名:

git rev-list --objects --all | grep 8f10eff91bb6aa2de1f5d096ee2e1687b0eab007

好了,最大的文件找到了。怎么删除呢?

git filter-branch --index-filter git rm --cached --ignore-unmatch <your-file-name>
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git fsck --full --unreachable
git repack -A -d
git gc --aggressive --prune=now
git push --force [remote] master

首先,里面最重要的两条命令是 git filter-branch 和 gc, filter-branch 真正在清理,但是只运行它也是没用的,需要再删除备份的文件,重新打包之类的,最后的gc命令,

用来收集产生的垃圾,最终清除大文件。

一步到位,再看看你的.git文件,有没有大吃一惊呢!

 

.git文件过大!删除大文件