有时在使用git时。不小心在项目文件夹中放入了一些图像数据集或者模型参数等,导致push后记录很大。哪怕后来删除了这些文件,也会导致.git中的记录文件过大。代码就几百kb,记录文件范围几百mb。如何清理,转载一个看到的博客,亲测有用,作为记录以便日后好用。
博客地址:https://www.cnblogs.com/bushuosx/p/10965485.html
Git 仓库 清理 瘦身
第一步,找出大文件或误添加的文件
git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -5 | awk '{print $1}')"
第二步,从仓库中删除文件或文件夹
- 删文件,将 bigfile 换成上面找出的文件名
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch "bigfile"' --prune-empty -- --all
- 删文件夹,将 wrongdir 换成上面找出的文件夹
git filter-branch --force --index-filter 'git rm -r --cached --ignore-unmatch "wrongdir"' --prune-empty -- --all
第三步,删除缓存的对象
这一步可以暂时跳过,等到确认完全不会出现问题之后再执行。(这些缓存对象给你提供了撤销操作的一次机会)。
git for-each-ref --format='delete %(refname)' refs/original | git update-ref --stdin
git reflog expire --expire=now --all
git gc --prune=now
第四步,强制更新远程仓库
这一步执行了,就真没救了。请确认已备份。
git push --force --verbose --dry-run
git push --force