]> git.phdru.name Git - git-wiki.git/blob - pep-git.txt
Describe staging area
[git-wiki.git] / pep-git.txt
1 PEP: XXX
2 Title: Collecting information about git
3 Version: $Revision$
4 Last-Modified: $Date$
5 Author: Oleg Broytman <phd@phdru.name>
6 Status: Draft
7 Type: Informational
8 Content-Type: text/x-rst
9 Created: 01-Jun-2015
10 Post-History: 
11
12 Abstract
13 ========
14
15 This Informational PEP collects information about git. There is, of
16 course, a lot of documentation for git, so the PEP concentrates on
17 more complex issues, scenarios and topics.
18
19 The plan is to extend the PEP in the future collecting information
20 about equivalence of Mercurial and git scenarios to help migrating
21 Python development from Mercurial to git.
22
23 The author of the PEP doesn't currently plan to write a Process PEP on
24 migration from Mercurial to git.
25
26
27 Documentation
28 =============
29
30 Git is accompanied with a lot of documentation, both online and
31 offline.
32
33 Documentation for starters
34 --------------------------
35
36 Git Tutorial: `part 1
37 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial.html>`_,
38 `part 2
39 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial-2.html>`_.
40
41 `Git User's manual
42 <https://www.kernel.org/pub/software/scm/git/docs/user-manual.html>`_.
43 `Everyday GIT With 20 Commands Or So
44 <https://www.kernel.org/pub/software/scm/git/docs/everyday.html>`_.
45 `Git workflows
46 <https://www.kernel.org/pub/software/scm/git/docs/gitworkflows.html>`_.
47
48 Advanced documentation
49 ----------------------
50
51 `Git Magic
52 <http://www-cs-students.stanford.edu/~blynn/gitmagic/index.html>`_,
53 also with a number of translations.
54
55 `Pro Git <https://git-scm.com/book>`_. The Book about git. Buy it at
56 Amazon or download in PDF, mobi, or ePub form. Has translations to
57 many different languages. Download Russian translation from `GArik
58 <https://github.com/GArik/progit/wiki>`_.
59
60 `Git Wiki <https://git.wiki.kernel.org/index.php/Main_Page>`_.
61
62 Offline documentation
63 ---------------------
64
65 Git has builtin help: run ``git help $TOPIC``. For example, run
66 ``git help git`` or ``git help help``.
67
68
69 Quick start
70 ===========
71
72 Download and installation
73 -------------------------
74
75 Unix users: download and install using your package manager.
76
77 Microsoft Windows: download `git-for-windows
78 <https://github.com/git-for-windows/git/releases>`_ or `msysGit
79 <https://github.com/msysgit/msysgit/releases>`_.
80
81 MacOS X: use git installed with `XCode
82 <https://developer.apple.com/xcode/downloads/>`_ or download from
83 `MacPorts <https://www.macports.org/ports.php?by=name&substr=git>`_ or
84 `git-osx-installer
85 <http://sourceforge.net/projects/git-osx-installer/files/>`_ or
86 install git with `Homebrew <http://brew.sh/>`_: ``brew install git``.
87
88 `git-cola <https://git-cola.github.io/index.html>`_ is a Git GUI
89 written in Python and GPL licensed. Linux, Windows, MacOS X.
90
91 `TortoiseGit <https://tortoisegit.org/>`_ is a Windows Shell Interface
92 to Git based on TortoiseSVN; open source.
93
94 Initial configuration
95 ---------------------
96
97 This simple code is often appears in documentation, but it is
98 important so let repeat it here. Git stores author and committer
99 names/emails in every commit, so configure your real name and
100 preferred email::
101
102     $ git config --global user.name "User Name"
103     $ git config --global user.email user.name@example.org
104
105
106 Examples in this PEP
107 ====================
108
109 Examples of git commands in this PEP use the following approach. It is
110 supposed that you, the user, works with a local repository named
111 ``python`` that has an upstream remote repo named ``origin``. Your
112 local repo has two branches ``v1`` and ``master``. For most examples
113 the currently checked out branch is ``master``. That is, it's assumed
114 you have done something like that::
115
116     $ git clone http://git.python.org/python.git
117     $ cd python
118     $ git branch v1 origin/v1
119
120 The first command clones remote repository into local directory
121 `python``, creates a new local branch master, sets
122 remotes/origin/master as its upstream remote-tracking branch and
123 checks it out into the working directory.
124
125 The last command creates a new local branch v1 and sets
126 remotes/origin/v1 as its upstream remote-tracking branch.
127
128 The same result can be achieved with commands::
129
130     $ git clone -b v1 http://git.python.org/python.git
131     $ cd python
132     $ git checkout --track origin/master
133
134 The last command creates a new local branch master, sets
135 remotes/origin/master as its upstream remote-tracking branch and
136 checks it out into the working directory.
137
138
139 Branches and branches
140 =====================
141
142 Git terminology can be a bit misleading. Take, for example, the term
143 "branch". In git it has two meanings. A branch is a directed line of
144 commits (possibly with merges). And a branch is a label or a pointer
145 assigned to a line of commits. It is important to distinguish when you
146 talk about commits and when about their labels. Lines of commits are
147 by itself unnamed and are usually only lengthening and merging.
148 Labels, on the other hand, can be created, moved, renamed and deleted
149 freely.
150
151
152 Remote repositories and remote branches
153 =======================================
154
155 Remote-tracking branches are branches (pointers to commits) in your
156 local repository. They are there for you to remember what branches and
157 commits have been pulled from and pushed to what remote repos (you can
158 pull from and push to many remotes). Remote-tracking branches live
159 under ``remotes/$REMOTE`` namespaces, e.g. ``remotes/origin/master``.
160
161 To see the status of remote-tracking branches run::
162
163     $ git branch -rv
164
165 To see local and remote-tracking branches (and tags) pointing to
166 commits::
167
168     $ git log --decorate
169
170 You never do your own development on remote-tracking branches. You
171 create a local branch that has a remote branch as upstream and do
172 development on that local branch. On push git pushes commits to the
173 remote repo and updates remote-tracking branches, on pull git fetches
174 commits from the remote repo, updates remote-tracking branches and
175 fast-forwards, merges or rebases local branches.
176
177 When you do an initial clone like this::
178
179     $ git clone -b v1 http://git.python.org/python.git
180
181 git clones remote repository ``http://git.python.org/python.git`` to
182 directory ``python``, creates remote-tracking branches, creates a
183 local branch ``v1``, configure it to track upstream remotes/origin/v1
184 branch and checks out ``v1`` into the working directory.
185
186 Updating local and remote-tracking branches
187 -------------------------------------------
188
189 There is a major difference between
190
191 ::
192
193     $ git fetch $REMOTE $BRANCH
194
195 and
196
197 ::
198
199     $ git fetch $REMOTE $BRANCH:$BRANCH
200
201 The first command fetches commits from the named $BRANCH in the
202 $REMOTE repository that are not in your repository, updates
203 remote-tracking branch and leaves the id (the hash) of the head commit
204 in file .git/FETCH_HEAD.
205
206 The second command fetches commits from the named $BRANCH in the
207 $REMOTE repository that are not in your repository and updates both
208 the local branch $BRANCH and its upstream remote-tracking branch. But
209 it refuses to update branches in case of non-fast-forward. And it
210 refuses to update the current branch.
211
212 The first command is used internally by ``git pull``.
213
214 ::
215
216     $ git pull $REMOTE $BRANCH
217
218 is equivalent to
219
220 ::
221
222     $ git fetch $REMOTE $BRANCH
223     $ git merge FETCH_HEAD
224
225 Certainly, $BRANCH in that case should be your current branch. If you
226 want to merge a different branch into your current branch first update
227 that non-current branch and then merge::
228
229     $ git fetch origin v1:v1  # Update v1
230     $ git pull --rebase origin master  # Update the current branch master
231                                        # using rebase instead of merge
232     $ git merge v1
233
234 If you have not yet pushed commits on ``v1``, though, the scenario has
235 to become a bit more complex. Git refuses to update
236 non-fast-forwardable branch, and you don't want to do force-pull
237 because that would remove your non-pushed commits and you would need
238 to recover. So you want to rebase ``v1`` but you cannot rebase
239 non-current branch. Hence, checkout ``v1`` and rebase it before
240 merging::
241
242     $ git checkout v1
243     $ git pull --rebase origin v1
244     $ git checkout master
245     $ git pull --rebase origin master
246     $ git merge v1
247
248 It is possible to configure git to make it fetch/pull a few branches
249 or all branches at once, so you can simply run
250
251 ::
252
253     $ git pull origin
254
255 or even
256
257 ::
258
259     $ git pull
260
261 Default remote repository for fetching/pulling is origin. Default set
262 of references to fetch is calculated using matching algorithm: git
263 fetches all branches having the same name on both ends.
264
265 Push
266 ''''
267
268 Pushing is a bit simpler. There is only one command ``push``. When you
269 run
270
271 ::
272
273     $ git push origin v1 master
274
275 git pushes local v1 to remote v1 and local master to remote master.
276 The same as::
277
278     $ git push origin v1:v1 master:master
279
280 Git pushes commits to the remote repo and updates remote-tracking
281 branches. Git refuses to push commits that aren't fast-forwardable.
282 You can force-push anyway, but please remember - you can force-push to
283 your own repositories but don't force-push to public or shared repos.
284 If you find git refuses to push commits that aren't fast-forwardable,
285 better fetch and merge commits from the remote repo (or rebase your
286 commits on top of the fetched commits), then push. Only force-push if
287 you know what you do and why you do it. See the section `Commit
288 editing and caveats`_ below.
289
290 It is possible to configure git to make it push a few branches or all
291 branches at once, so you can simply run
292
293 ::
294
295     $ git push origin
296
297 or even
298
299 ::
300
301     $ git push
302
303 Default remote repository for pushing is origin. Default set
304 of references to push in git before 2.0 is calculated using matching
305 algorithm: git pushes all branches having the same name on both ends.
306 Default set of references to push in git 2.0+ is calculated using
307 simple algorithm: git pushes the current branch back to its
308 @{upstream}.
309
310 To configure git before 2.0 to the new behaviour run::
311
312 $ git config push.default simple
313
314 To configure git 2.0+ to the old behaviour run::
315
316 $ git config push.default matching
317
318 Git refuses to push a branch if it's the current branch in the remote
319 non-bare repository: git refuses to update remote working directory.
320 You really should push only to bare repositories. For non-bare
321 repositories git prefers pull-based workflow.
322
323 When you want to deploy code on a remote host and can only use push
324 (because your workstation is behind a firewall and you cannot pull
325 from it) you do that in two steps using two repositories: you push
326 from the workstation to a bare repo on the remote host, ssh to the
327 remote host and pull from the bare repo to a non-bare deployment repo.
328
329 That changed in git 2.3, but see `the blog post
330 <https://github.com/blog/1957-git-2-3-has-been-released#push-to-deploy>`_
331 for caveats; in 2.4 the push-to-deploy feature was `further improved
332 <https://github.com/blog/1994-git-2-4-atomic-pushes-push-to-deploy-and-more#push-to-deploy-improvements>`_.
333
334 Tags
335 ''''
336
337 Git automatically fetches tags that point to commits being fetched
338 during fetch/pull. To fetch all tags (and commits they point to) run
339 ``git fetch --tags origin``. To fetch some specific tags fetch them
340 explicitly::
341
342     $ git fetch origin tag $TAG1 tag $TAG2...
343
344 For example::
345
346     $ git fetch origin tag 1.4.2
347     $ git fetch origin v1:v1 tag 2.1.7
348
349 Git doesn't automatically pushes tags. That allows you to have private
350 tags. To push tags list them explicitly::
351
352     $ git push origin tag 1.4.2
353     $ git push origin v1 master tag 2.1.7
354
355 Don't move tags with ``git tag -f`` or remove tags with ``git tag -d``
356 after they have been published.
357
358 Private information
359 '''''''''''''''''''
360
361 When cloning/fetching/pulling/pushing git copies only database objects
362 (commits, trees, files and tags) and symbolic references (branches and
363 lightweight tags). Everything else is private to the repository and
364 never cloned, updated or pushed. It's your config, your hooks, your
365 private exclude file.
366
367 If you want to distribute hooks, copy them to the working tree, add,
368 commit, push and instruct the team to update ind install the hook
369 manually.
370
371
372 Commit editing and caveats
373 ==========================
374
375 A warning not to edit published (pushed) commits also appears in
376 documentation but it's repeated here anyway as it's very important.
377
378 It is possible to recover from forced push but it's PITA for the
379 entire team. Please avoid it.
380
381 To see what commits have not been published yet compare the head of the
382 branch with its upstream remote-tracking branch::
383
384     $ git log origin/master..
385     $ git log origin/v1..v1
386
387 For every branch that has an upstream remote-tracking branch git
388 maintains an alias @{upstream} (short version @{u}), so the commands
389 above can be given as::
390
391     $ git log @{u}..
392     $ git log v1@{u}..v1
393
394 To see the status of all branches::
395
396     $ git branch -avv
397
398 To compare the status of local branches with a remote repo::
399
400     $ git remote show origin
401
402 Read `how to recover from upstream rebase
403 <https://git-scm.com/docs/git-rebase#_recovering_from_upstream_rebase>`_.
404 It is in ``git help rebase``.
405
406 On the other hand don't be too afraid about commit editing. You can
407 safely edit, remove, reorder, combine and split commits that haven't
408 been pushed yet. You can even push commits to your own (backup) repo,
409 edit them later and force-push edited commits to replace what have
410 already been pushed. Not a problem until commits are in a public
411 or shared repository.
412
413
414 Undo
415 ====
416
417 Whatever you do, don't panic. Almost anything in git can be undone.
418
419 git checkout: restore file's content
420 ------------------------------------
421
422 ``git checkout``, for example, can be used to restore the content of
423 file(s) to that one of a commit. Like this::
424
425     git checkout HEAD~ README
426
427 The commands restores the contents of README file to the last but one
428 commit in the current branch. By default the commit ID is simply HEAD;
429 i.e. ``git checkout README`` restores README to the latest commit.
430
431 (Do not use ``git checkout`` to view a content of a file in a commit,
432 use ``git cat-file -p``; e.g. ``git cat-file -p HEAD~:path/to/README``).
433
434 git reset: remove (non-pushed) commits
435 --------------------------------------
436
437 ``git reset`` moves the head of the current branch. The head can be
438 moved to point to any commit but it's often used to remove a commit or
439 a few (preferably, non-pushed ones) from the top of the branch - that
440 is, to move the branch backward in order to undo a few (non-pushed)
441 commits.
442
443 ``git reset`` has three modes of operation - soft, hard and mixed.
444 Default is mixed. ProGit `explains
445 <https://git-scm.com/book/en/Git-Tools-Reset-Demystified>`_ the
446 difference very clearly. Bare repositories don't have indices or
447 working trees so in a bare repo only soft reset is possible.
448
449 Unstaging
450 '''''''''
451
452 Mixed mode reset with a path or paths can be used to unstage changes -
453 that is, to remove from index changes added with ``git add`` for
454 committing. See `The Book
455 <https://git-scm.com/book/en/Git-Basics-Undoing-Things>`_ for details
456 about unstaging and other undo tricks.
457
458 git reflog: reference log
459 -------------------------
460
461 Removing commits with ``git reset`` or moving the head of a branch
462 sounds dangerous and it is. But there is a way to undo: another
463 reset back to the original commit. Git doesn't remove commits
464 immediately; unreferenced commits (in git terminology they are called
465 "dangling commits") stay in the database for some time (default is two
466 weeks) so you can reset back to it or create a new branch pointing to
467 the original commit.
468
469 For every move of a branch's head - with ``git commit``, ``git
470 checkout``, ``git fetch``, ``git pull``, ``git rebase``, ``git reset``
471 and so on - git stores a reference log (reflog for short). For every
472 move git stores where the head was. Command ``git reflog`` can be used
473 to view (and manipulate) the log.
474
475 In addition to the moves of the head of every branch git stores the
476 moves of the HEAD - a symbolic reference that (usually) names the
477 current branch. HEAD is changed with ``git checkout $BRANCH``.
478
479 By default ``git reflog`` shows the moves of the HEAD, i.e. the
480 command is equivalent to ``git reflog HEAD``. To show the moves of the
481 head of a branch use the command ``git reflog $BRANCH``.
482
483 So to undo a ``git reset`` lookup the original commit in ``git
484 reflog``, verify it with ``git show`` or ``git log`` and run ``git
485 reset $COMMIT_ID``. Git stores the move of the branch's head in
486 reflog, so you can undo that undo later again.
487
488 In a more complex situation you'd want to move some commits along with
489 resetting the head of the branch. Cherry-pick them to the new branch.
490 For example, if you want to reset the branch ``master`` back to the
491 original commit but preserve two commits created in the current branch
492 do something like::
493
494     $ git branch save-master # create a new branch saving master
495     $ git reflog # find the original place of master
496     $ git reset $COMMIT_ID
497     $ git cherry-pick save-master~ save-master
498     $ git branch -D save-master # remove temporary branch
499
500 git revert: revert a commit
501 ---------------------------
502
503 ``git revert`` reverts a commit or commits, that is, it creates a new
504 commit or commits that revert(s) the effects of the given commits.
505 It's the only way to undo published commits (``git commit --amend``,
506 ``git rebase`` and ``git reset`` change the branch in
507 non-fast-forwardable ways so they should only be used for non-pushed
508 commits.)
509
510 There is a problem with reverting a merge commit. ``git revert`` can
511 undo the code created by the merge commit but it cannot undo the fact
512 of merge. See the discussion `How to revert a faulty merge
513 <https://www.kernel.org/pub/software/scm/git/docs/howto/revert-a-faulty-merge.html>`_.
514
515 One thing that cannot be undone
516 -------------------------------
517
518 Whatever you undo, there is one thing that cannot be undone -
519 overwritten uncommitted changes. Uncommitted changes don't belong to
520 git so git cannot help preserving them.
521
522 Most of the time git warns you when you're going to execute a command
523 that overwrites uncommitted changes. Git warns you when you try to
524 switch branches with ``git checkout``. It warns you when you're going
525 to rebase with non-clean working tree. It refuses to pull new commits
526 over non-committed files.
527
528 But there are commands that do exactly that - overwrite files in the
529 working tree. Commands like ``git checkout $PATHs`` or ``git reset
530 --hard`` silently overwrite files including your uncommitted changes.
531
532 With that in mind you can understand the stance "commit early, commit
533 often". Commit as often as possible. Commit on every save in your
534 editor or IDE. You can edit your commits before pushing - change,
535 reorder, combine, remove. But save your changes in git database,
536 either commit changes or at least stash them with ``git stash``.
537
538
539 Merge or rebase?
540 ================
541
542 Internet is full of heated discussions on the topic: "merge or
543 rebase?" Most of them are meaningless. When a DVCS is being used in a
544 big team with a big and complex project with many branches there is
545 simply no way to avoid merges. So the question's diminished to
546 "whether to use rebase, and if yes - when to use rebase?" Considering
547 that it is very much recommended not to rebase published commits the
548 question's diminished even further: "whether to use rebase on
549 non-pushed commits?"
550
551 That small question is for the team to decide. The author of the PEP
552 recommends to use rebase when pulling, i.e. always do ``git pull
553 --rebase`` or even configure automatic setup of rebase for every new
554 branch::
555
556     $ git config branch.autosetuprebase always
557
558 and configure rebase for existing branches::
559
560     $ git config branch.$NAME.rebase true
561
562 For example::
563
564     $ git config branch.v1.rebase true
565     $ git config branch.master.rebase true
566
567 After that ``git pull origin master`` becomes equivalent to ``git pull
568 --rebase origin master``.
569
570 In case when merge is preferred it is recommended to create new
571 commits in a separate feature or topic branch while using rebase to
572 update the mainline branch. When the topic branch is ready merge it
573 into mainline. To avoid a tedious task of resolving large number of
574 conflicts at once you can merge the topic branch to the mainline from
575 time to time and switch back to the topic branch to continue working
576 on it. The entire workflow would be something like::
577
578     $ git checkout -b issue-42  # create a new issue branch and switch to it
579         ...edit/test/commit...
580     $ git checkout master
581     $ git pull --rebase origin master  # update master from the upstream
582     $ git merge issue-42
583     $ git branch -d issue-42  # delete the topic branch
584     $ git push origin master
585
586 When the topic branch is deleted only the label is removed, commits
587 are stayed in the database, they are now merged into master::
588
589     o--o--o--o--o--M--< master - the mainline branch
590         \         /
591          --*--*--*             - the topic branch, now unnamed
592
593 The topic branch is deleted to avoid cluttering branch namespace with
594 small topic branches. Information on what issue was fixed or what
595 feature was implemented should be in the commit messages.
596
597
598 Null-merges
599 ===========
600
601 Git has a builtin merge strategy for what Python core developers call
602 "null-merge"::
603
604     $ git merge -s ours v1  # null-merge v1 into master
605
606
607 Advanced configuration
608 ======================
609
610 Line endings
611 ------------
612
613 Git has builtin mechanisms to handle line endings between platforms
614 with different EOL styles. To allow git to do CRLF conversion assign
615 ``text`` attribute to files using `.gitattributes
616 <https://www.kernel.org/pub/software/scm/git/docs/gitattributes.html>`_.
617 For files that have to have specific line ending assign ``eol``
618 attribute. For binary files the attribute is, naturally, ``binary``.
619
620 For example::
621
622     $ cat .gitattributes
623     *.py text
624     *.txt text
625     *.png binary
626     /readme.txt eol=CRLF
627
628 To check what attributes git uses for files use ``git check-attr``
629 command. For example::
630
631 $ git check-attr -a -- \*.py
632
633
634 Advanced topics
635 ===============
636
637 Staging area
638 ------------
639
640 Staging area aka index aka cache is a distinguishing feature of git.
641 Staging area is where git collects patches before committing them.
642 Separation between collecting patches and commit phases provides a
643 very useful feature of git: one can review collected patches before
644 commit and even edit them - remove some hunks, add new hunks and
645 review again.
646
647 To add files to the index use ``git add``. Collecting patches before
648 committing means you need to do that for every change, not only to add
649 new (untracked) files. To simplify committing in case you just want to
650 commit everything without reviewing run ``git commit --all`` (or just
651 ``-a``) - the command adds every changed tracked file to the index and
652 then commit.
653
654 To add hunks of patches to the index use ``git add --patch`` (or just
655 ``-p``). To remove collected files from the index use ``git reset HEAD
656 -- $FILE...`` To add/inspect/remove collected hunks use ``git add
657 --interactive`` (``-i``).
658
659 To see the diff between the index and the last commit (i.e., collected
660 patches) use ``git diff --cached``. To see the diff between the
661 working tree and the index (i.e., uncollected patches) use just ``git
662 diff``.
663
664 See `WhatIsTheIndex
665 <https://git.wiki.kernel.org/index.php/WhatIsTheIndex>`_ and
666 `IndexCommandQuickref
667 <https://git.wiki.kernel.org/index.php/IndexCommandQuickref>`_ in Git
668 Wiki.
669
670
671 ReReRe
672 ======
673
674 https://git-scm.com/book/en/Git-Tools-Rerere
675
676
677 Database maintenance
678 ====================
679
680 TODO: dangling objects, git gc, git repack.
681
682 https://gcc.gnu.org/ml/gcc/2007-12/msg00165.html
683
684 http://vcscompare.blogspot.ru/2008/06/git-repack-parameters.html
685
686
687 Tips and tricks
688 ===============
689
690 TODO: sticky options; example: git grep -O.
691
692 TODO: tricky options; example: git log -p3.
693
694 TODO: bash/zsh completion, bash/zsh prompt.
695 https://git.kernel.org/cgit/git/git.git/tree/contrib/completion
696
697
698 git on server
699 =============
700
701 TODO: anonymous access; git over ssh; gitolite; gitweb; cgit; gitlab.
702
703 http://gitolite.com/gitolite/index.html
704
705 https://git.kernel.org/cgit/git/git.git/tree/gitweb
706
707 http://git.zx2c4.com/cgit/
708
709 From Mercurial to git
710 =====================
711
712 Mercurial for Git users https://mercurial.selenic.com/wiki/GitConcepts
713
714 https://github.com/felipec/git-remote-hg
715
716 https://hg-git.github.io/
717
718
719 References
720 ==========
721
722 .. [] 
723
724
725 Copyright
726 =========
727
728 This document has been placed in the public domain.
729
730
731 \f
732 ..
733    Local Variables:
734    mode: indented-text
735    indent-tabs-mode: nil
736    sentence-end-double-space: t
737    fill-column: 70
738    coding: utf-8
739    End:
740    vim: set fenc=us-ascii tw=70 :