Git 三大区域的操作分析

可以将git简单的分为三个区域

1、工作区(working directry)
2、暂缓区(stage index)
3、历史记录区(history)
如图:

git add files 把当前工作目录中的文件放入暂存区域
其实做了两件事:
1、将本地文件的时间戳、长度,当前文档对象的id等信息保存到一个树形目录中去(index,即平时说的暂存区)
2、将本地文件的内容做快照并保存到Git 的对象库
(综上:实际上就是一个包含文件索引的目录树,像是一个虚拟的工作区。

        在这个虚拟工作区的目录树中,记录了文件名、文件的状态信息(时间戳、文件长度等),

        文件的 内容并不存储其中,而是保存在 Git 对象库(.git/objects)中,文件索引建立了文件和对象库中对象实体之间的对应。)
如图:

在这个图中,我们可以看到部分 Git 命令是如何影响工作区和暂存区(stage, index)的:
图中左侧为工作区,右侧为版本库。在版本库中标记为 "index" 的区域是暂存区(stage, index),标记为 "master" 的是 master 分支所代表的目录树。
图中我们可以看出此时 "HEAD" 实际是指向 master 分支的一个“游标”。所以图示的命令中出现 HEAD 的地方可以用 master 来替换。
图中的 objects 标识的区域为 Git 的对象库,实际位于 ".git/objects" 目录下
当对工作区修改(或新增)的文件执行 "git add" 命令时,暂存区的目录树被更新,同时工作区修改(或新增)的文件内容被写入到对象库中的一个新的对象中,而该对象的ID 被记录在暂存区的文件索引中
当执行提交操作(git commit)时,暂存区的目录树写到版本库(对象库)中,master 分支会做相应的更新。即 master 指向的目录树就是提交时暂存区的目录树


git reset -- files 用来撤销最后一次

    git add files(因为每git add file一次,暂存区的文件都会被更改一次),你也可以用git reset 撤销所有暂存区域文件。
git checkout -- files 把文件从暂存区域复制到工作目录,用来丢弃本地修改。

    当执行 "git rm --cached " 命令时,会直接从暂存区删除文件,工作区则不做出改变
当执行 "git checkout ." 或者 "git checkout -- " 命令时,会用暂存区全部或指定的文件替换工作区的文件。这个操作很危险,会清除工作区中未添加到暂存区的改动
当执行 "git checkout HEAD ." 或者 "git checkout HEAD " 命令时,会用 HEAD 指向的 master 分支中的全部或者部分文件替换暂存区和以及工作区中的文件。这个命令也是极具危险性的,因为不但会清除工作区中未提交的改动,也会清除暂存区中未提交的改 动
当执行 "git status" 命令扫描工作区改动的时候,先依据 .git/index 文件中记录的(工作区跟踪文件的)时间戳、长度等信息

    判断工作区文件是否改变。如果工作区的文件时间戳改变,说明文件的内容 可能 被改变了,需要要打开文件,读取文件内容,和更改前的原始文件相比较

    (本地文件和与之对应的object库中的文件的内容进行对比),判断文件内容是否被更改。

    如果文件内容没有改变,则将该文件新的时间戳记录到 .git/index 文件中。因为判断文件是否更改,

    使用时间戳、文件长度等信息进行比较要比通过文件内容比较要快的多,

    所以 Git 这样的实现方式可以让工作区状态扫描更快速的执行,这也是 Git 高效的因素之一。


git diff files 来进行具体文件的变动对比,通常用来进行work directory 与 stage之间的对比,实质上是用 git objects 库中的快照与work directory 文件的内容的对比