]> git.phdru.name Git - git-wiki.git/blob - pep-103.txt
bbcb3d46408a8d9f6054cff8e42f9ed52d8616b1
[git-wiki.git] / pep-103.txt
1 PEP: 103
2 Title: Collecting information about git
3 Version: $Revision$
4 Last-Modified: $Date$
5 Author: Oleg Broytman <phd@phdru.name>
6 Status: Draft
7 Type: Informational
8 Content-Type: text/x-rst
9 Created: 01-Jun-2015
10 Post-History: 12-Sep-2015
11
12 Abstract
13 ========
14
15 This Informational PEP collects information about git. There is, of
16 course, a lot of documentation for git, so the PEP concentrates on
17 more complex (and more related to Python development) issues,
18 scenarios and examples.
19
20 The plan is to extend the PEP in the future collecting information
21 about equivalence of Mercurial and git scenarios to help migrating
22 Python development from Mercurial to git.
23
24 The author of the PEP doesn't currently plan to write a Process PEP on
25 migration Python development from Mercurial to git.
26
27
28 Documentation
29 =============
30
31 Git is accompanied with a lot of documentation, both online and
32 offline.
33
34
35 Documentation for starters
36 --------------------------
37
38 Git Tutorial: `part 1
39 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial.html>`_,
40 `part 2
41 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial-2.html>`_.
42
43 `Git User's manual
44 <https://www.kernel.org/pub/software/scm/git/docs/user-manual.html>`_.
45 `Everyday GIT With 20 Commands Or So
46 <https://www.kernel.org/pub/software/scm/git/docs/giteveryday.html>`_.
47 `Git workflows
48 <https://www.kernel.org/pub/software/scm/git/docs/gitworkflows.html>`_.
49
50
51 Advanced documentation
52 ----------------------
53
54 `Git Magic
55 <http://www-cs-students.stanford.edu/~blynn/gitmagic/index.html>`_,
56 with a number of translations.
57
58 `Pro Git <https://git-scm.com/book>`_. The Book about git. Buy it at
59 Amazon or download in PDF, mobi, or ePub form. It has translations to
60 many different languages. Download Russian translation from `GArik
61 <https://github.com/GArik/progit/wiki>`_.
62
63 `Git Wiki <https://git.wiki.kernel.org/index.php/Main_Page>`_.
64
65 `Git Buch <http://gitbu.ch/index.html>`_ (German).
66
67
68 Offline documentation
69 ---------------------
70
71 Git has builtin help: run ``git help $TOPIC``. For example, run
72 ``git help git`` or ``git help help``.
73
74
75 Quick start
76 ===========
77
78 Download and installation
79 -------------------------
80
81 Unix users: `download and install using your package manager
82 <https://git-scm.com/download/linux>`_.
83
84 Microsoft Windows: download `git-for-windows
85 <https://github.com/git-for-windows/git/releases>`_ or `msysGit
86 <https://github.com/msysgit/msysgit/releases>`_.
87
88 MacOS X: use git installed with `XCode
89 <https://developer.apple.com/xcode/downloads/>`_ or download from
90 `MacPorts <https://www.macports.org/ports.php?by=name&substr=git>`_ or
91 `git-osx-installer
92 <http://sourceforge.net/projects/git-osx-installer/files/>`_ or
93 install git with `Homebrew <http://brew.sh/>`_: ``brew install git``.
94
95 `git-cola <https://git-cola.github.io/index.html>`_ is a Git GUI
96 written in Python and GPL licensed. Linux, Windows, MacOS X.
97
98 `TortoiseGit <https://tortoisegit.org/>`_ is a Windows Shell Interface
99 to Git based on TortoiseSVN; open source.
100
101
102 Initial configuration
103 ---------------------
104
105 This simple code is often appears in documentation, but it is
106 important so let repeat it here. Git stores author and committer
107 names/emails in every commit, so configure your real name and
108 preferred email::
109
110     $ git config --global user.name "User Name"
111     $ git config --global user.email user.name@example.org
112
113
114 Examples in this PEP
115 ====================
116
117 Examples of git commands in this PEP use the following approach. It is
118 supposed that you, the user, works with a local repository named
119 ``python`` that has an upstream remote repo named ``origin``. Your
120 local repo has two branches ``v1`` and ``master``. For most examples
121 the currently checked out branch is ``master``. That is, it's assumed
122 you have done something like that::
123
124     $ git clone https://git.python.org/python.git
125     $ cd python
126     $ git branch v1 origin/v1
127
128 The first command clones remote repository into local directory
129 `python``, creates a new local branch master, sets
130 remotes/origin/master as its upstream remote-tracking branch and
131 checks it out into the working directory.
132
133 The last command creates a new local branch v1 and sets
134 remotes/origin/v1 as its upstream remote-tracking branch.
135
136 The same result can be achieved with commands::
137
138     $ git clone -b v1 https://git.python.org/python.git
139     $ cd python
140     $ git checkout --track origin/master
141
142 The last command creates a new local branch master, sets
143 remotes/origin/master as its upstream remote-tracking branch and
144 checks it out into the working directory.
145
146
147 Branches and branches
148 =====================
149
150 Git terminology can be a bit misleading. Take, for example, the term
151 "branch". In git it has two meanings. A branch is a directed line of
152 commits (possibly with merges). And a branch is a label or a pointer
153 assigned to a line of commits. It is important to distinguish when you
154 talk about commits and when about their labels. Lines of commits are
155 by itself unnamed and are usually only lengthening and merging.
156 Labels, on the other hand, can be created, moved, renamed and deleted
157 freely.
158
159
160 Remote repositories and remote branches
161 =======================================
162
163 Remote-tracking branches are branches (pointers to commits) in your
164 local repository. They are there for git (and for you) to remember
165 what branches and commits have been pulled from and pushed to what
166 remote repos (you can pull from and push to many remotes).
167 Remote-tracking branches live under ``remotes/$REMOTE`` namespaces,
168 e.g. ``remotes/origin/master``.
169
170 To see the status of remote-tracking branches run::
171
172     $ git branch -rv
173
174 To see local and remote-tracking branches (and tags) pointing to
175 commits::
176
177     $ git log --decorate
178
179 You never do your own development on remote-tracking branches. You
180 create a local branch that has a remote branch as upstream and do
181 development on that local branch. On push git pushes commits to the
182 remote repo and updates remote-tracking branches, on pull git fetches
183 commits from the remote repo, updates remote-tracking branches and
184 fast-forwards, merges or rebases local branches.
185
186 When you do an initial clone like this::
187
188     $ git clone -b v1 https://git.python.org/python.git
189
190 git clones remote repository ``https://git.python.org/python.git`` to
191 directory ``python``, creates a remote named ``origin``, creates
192 remote-tracking branches, creates a local branch ``v1``, configure it
193 to track upstream remotes/origin/v1 branch and checks out ``v1`` into
194 the working directory.
195
196 Some commands, like ``git status --branch`` and ``git branch --verbose``,
197 report the difference between local and remote branches.
198 Please remember they only do comparison with remote-tracking branches
199 in your local repository, and the state of those remote-tracking
200 branches can be outdated. To update remote-tracking branches you
201 either fetch and merge (or rebase) commits from the remote repository
202 or update remote-tracking branches without updating local branches.
203
204
205 Updating local and remote-tracking branches
206 -------------------------------------------
207
208 To update remote-tracking branches without updating local branches run
209 ``git remote update [$REMOTE...]``. For example::
210
211     $ git remote update
212     $ git remote update origin
213
214
215 Fetch and pull
216 ''''''''''''''
217
218 There is a major difference between
219
220 ::
221
222     $ git fetch $REMOTE $BRANCH
223
224 and
225
226 ::
227
228     $ git fetch $REMOTE $BRANCH:$BRANCH
229
230 The first command fetches commits from the named $BRANCH in the
231 $REMOTE repository that are not in your repository, updates
232 remote-tracking branch and leaves the id (the hash) of the head commit
233 in file .git/FETCH_HEAD.
234
235 The second command fetches commits from the named $BRANCH in the
236 $REMOTE repository that are not in your repository and updates both
237 the local branch $BRANCH and its upstream remote-tracking branch. But
238 it refuses to update branches in case of non-fast-forward. And it
239 refuses to update the current branch (currently checked out branch,
240 where HEAD is pointing to).
241
242 The first command is used internally by ``git pull``.
243
244 ::
245
246     $ git pull $REMOTE $BRANCH
247
248 is equivalent to
249
250 ::
251
252     $ git fetch $REMOTE $BRANCH
253     $ git merge FETCH_HEAD
254
255 Certainly, $BRANCH in that case should be your current branch. If you
256 want to merge a different branch into your current branch first update
257 that non-current branch and then merge::
258
259     $ git fetch origin v1:v1  # Update v1
260     $ git pull --rebase origin master  # Update the current branch master
261                                        # using rebase instead of merge
262     $ git merge v1
263
264 If you have not yet pushed commits on ``v1``, though, the scenario has
265 to become a bit more complex. Git refuses to update
266 non-fast-forwardable branch, and you don't want to do force-pull
267 because that would remove your non-pushed commits and you would need
268 to recover. So you want to rebase ``v1`` but you cannot rebase
269 non-current branch. Hence, checkout ``v1`` and rebase it before
270 merging::
271
272     $ git checkout v1
273     $ git pull --rebase origin v1
274     $ git checkout master
275     $ git pull --rebase origin master
276     $ git merge v1
277
278 It is possible to configure git to make it fetch/pull a few branches
279 or all branches at once, so you can simply run
280
281 ::
282
283     $ git pull origin
284
285 or even
286
287 ::
288
289     $ git pull
290
291 Default remote repository for fetching/pulling is ``origin``. Default
292 set of references to fetch is calculated using matching algorithm: git
293 fetches all branches having the same name on both ends.
294
295
296 Push
297 ''''
298
299 Pushing is a bit simpler. There is only one command ``push``. When you
300 run
301
302 ::
303
304     $ git push origin v1 master
305
306 git pushes local v1 to remote v1 and local master to remote master.
307 The same as::
308
309     $ git push origin v1:v1 master:master
310
311 Git pushes commits to the remote repo and updates remote-tracking
312 branches. Git refuses to push commits that aren't fast-forwardable.
313 You can force-push anyway, but please remember - you can force-push to
314 your own repositories but don't force-push to public or shared repos.
315 If you find git refuses to push commits that aren't fast-forwardable,
316 better fetch and merge commits from the remote repo (or rebase your
317 commits on top of the fetched commits), then push. Only force-push if
318 you know what you do and why you do it. See the section `Commit
319 editing and caveats`_ below.
320
321 It is possible to configure git to make it push a few branches or all
322 branches at once, so you can simply run
323
324 ::
325
326     $ git push origin
327
328 or even
329
330 ::
331
332     $ git push
333
334 Default remote repository for pushing is ``origin``. Default set of
335 references to push in git before 2.0 is calculated using matching
336 algorithm: git pushes all branches having the same name on both ends.
337 Default set of references to push in git 2.0+ is calculated using
338 simple algorithm: git pushes the current branch back to its
339 @{upstream}.
340
341 To configure git before 2.0 to the new behaviour run::
342
343 $ git config push.default simple
344
345 To configure git 2.0+ to the old behaviour run::
346
347 $ git config push.default matching
348
349 Git doesn't allow to push a branch if it's the current branch in the
350 remote non-bare repository: git refuses to update remote working
351 directory. You really should push only to bare repositories. For
352 non-bare repositories git prefers pull-based workflow.
353
354 When you want to deploy code on a remote host and can only use push
355 (because your workstation is behind a firewall and you cannot pull
356 from it) you do that in two steps using two repositories: you push
357 from the workstation to a bare repo on the remote host, ssh to the
358 remote host and pull from the bare repo to a non-bare deployment repo.
359
360 That changed in git 2.3, but see `the blog post
361 <https://github.com/blog/1957-git-2-3-has-been-released#push-to-deploy>`_
362 for caveats; in 2.4 the push-to-deploy feature was `further improved
363 <https://github.com/blog/1994-git-2-4-atomic-pushes-push-to-deploy-and-more#push-to-deploy-improvements>`_.
364
365
366 Tags
367 ''''
368
369 Git automatically fetches tags that point to commits being fetched
370 during fetch/pull. To fetch all tags (and commits they point to) run
371 ``git fetch --tags origin``. To fetch some specific tags fetch them
372 explicitly::
373
374     $ git fetch origin tag $TAG1 tag $TAG2...
375
376 For example::
377
378     $ git fetch origin tag 1.4.2
379     $ git fetch origin v1:v1 tag 2.1.7
380
381 Git doesn't automatically pushes tags. That allows you to have private
382 tags. To push tags list them explicitly::
383
384     $ git push origin tag 1.4.2
385     $ git push origin v1 master tag 2.1.7
386
387 Or push all tags at once::
388
389     $ git push --tags origin
390
391 Don't move tags with ``git tag -f`` or remove tags with ``git tag -d``
392 after they have been published.
393
394
395 Private information
396 '''''''''''''''''''
397
398 When cloning/fetching/pulling/pushing git copies only database objects
399 (commits, trees, files and tags) and symbolic references (branches and
400 lightweight tags). Everything else is private to the repository and
401 never cloned, updated or pushed. It's your config, your hooks, your
402 private exclude file.
403
404 If you want to distribute hooks, copy them to the working tree, add,
405 commit, push and instruct the team to update and install the hooks
406 manually.
407
408
409 Commit editing and caveats
410 ==========================
411
412 A warning not to edit published (pushed) commits also appears in
413 documentation but it's repeated here anyway as it's very important.
414
415 It is possible to recover from a forced push but it's PITA for the
416 entire team. Please avoid it.
417
418 To see what commits have not been published yet compare the head of the
419 branch with its upstream remote-tracking branch::
420
421     $ git log origin/master..  # from origin/master to HEAD (of master)
422     $ git log origin/v1..v1  # from origin/v1 to the head of v1
423
424 For every branch that has an upstream remote-tracking branch git
425 maintains an alias @{upstream} (short version @{u}), so the commands
426 above can be given as::
427
428     $ git log @{u}..
429     $ git log v1@{u}..v1
430
431 To see the status of all branches::
432
433     $ git branch -avv
434
435 To compare the status of local branches with a remote repo::
436
437     $ git remote show origin
438
439 Read `how to recover from upstream rebase
440 <https://git-scm.com/docs/git-rebase#_recovering_from_upstream_rebase>`_.
441 It is in ``git help rebase``.
442
443 On the other hand don't be too afraid about commit editing. You can
444 safely edit, reorder, remove, combine and split commits that haven't
445 been pushed yet. You can even push commits to your own (backup) repo,
446 edit them later and force-push edited commits to replace what have
447 already been pushed. Not a problem until commits are in a public
448 or shared repository.
449
450
451 Undo
452 ====
453
454 Whatever you do, don't panic. Almost anything in git can be undone.
455
456
457 git checkout: restore file's content
458 ------------------------------------
459
460 ``git checkout``, for example, can be used to restore the content of
461 file(s) to that one of a commit. Like this::
462
463     git checkout HEAD~ README
464
465 The commands restores the contents of README file to the last but one
466 commit in the current branch. By default the commit ID is simply HEAD;
467 i.e. ``git checkout README`` restores README to the latest commit.
468
469 (Do not use ``git checkout`` to view a content of a file in a commit,
470 use ``git cat-file -p``; e.g. ``git cat-file -p HEAD~:path/to/README``).
471
472
473 git reset: remove (non-pushed) commits
474 --------------------------------------
475
476 ``git reset`` moves the head of the current branch. The head can be
477 moved to point to any commit but it's often used to remove a commit or
478 a few (preferably, non-pushed ones) from the top of the branch - that
479 is, to move the branch backward in order to undo a few (non-pushed)
480 commits.
481
482 ``git reset`` has three modes of operation - soft, hard and mixed.
483 Default is mixed. ProGit `explains
484 <https://git-scm.com/book/en/Git-Tools-Reset-Demystified>`_ the
485 difference very clearly. Bare repositories don't have indices or
486 working trees so in a bare repo only soft reset is possible.
487
488
489 Unstaging
490 '''''''''
491
492 Mixed mode reset with a path or paths can be used to unstage changes -
493 that is, to remove from index changes added with ``git add`` for
494 committing. See `The Book
495 <https://git-scm.com/book/en/Git-Basics-Undoing-Things>`_ for details
496 about unstaging and other undo tricks.
497
498
499 git reflog: reference log
500 -------------------------
501
502 Removing commits with ``git reset`` or moving the head of a branch
503 sounds dangerous and it is. But there is a way to undo: another
504 reset back to the original commit. Git doesn't remove commits
505 immediately; unreferenced commits (in git terminology they are called
506 "dangling commits") stay in the database for some time (default is two
507 weeks) so you can reset back to it or create a new branch pointing to
508 the original commit.
509
510 For every move of a branch's head - with ``git commit``, ``git
511 checkout``, ``git fetch``, ``git pull``, ``git rebase``, ``git reset``
512 and so on - git stores a reference log (reflog for short). For every
513 move git stores where the head was. Command ``git reflog`` can be used
514 to view (and manipulate) the log.
515
516 In addition to the moves of the head of every branch git stores the
517 moves of the HEAD - a symbolic reference that (usually) names the
518 current branch. HEAD is changed with ``git checkout $BRANCH``.
519
520 By default ``git reflog`` shows the moves of the HEAD, i.e. the
521 command is equivalent to ``git reflog HEAD``. To show the moves of the
522 head of a branch use the command ``git reflog $BRANCH``.
523
524 So to undo a ``git reset`` lookup the original commit in ``git
525 reflog``, verify it with ``git show`` or ``git log`` and run ``git
526 reset $COMMIT_ID``. Git stores the move of the branch's head in
527 reflog, so you can undo that undo later again.
528
529 In a more complex situation you'd want to move some commits along with
530 resetting the head of the branch. Cherry-pick them to the new branch.
531 For example, if you want to reset the branch ``master`` back to the
532 original commit but preserve two commits created in the current branch
533 do something like::
534
535     $ git branch save-master # create a new branch saving master
536     $ git reflog # find the original place of master
537     $ git reset $COMMIT_ID
538     $ git cherry-pick save-master~ save-master
539     $ git branch -D save-master # remove temporary branch
540
541
542 git revert: revert a commit
543 ---------------------------
544
545 ``git revert`` reverts a commit or commits, that is, it creates a new
546 commit or commits that revert(s) the effects of the given commits.
547 It's the only way to undo published commits (``git commit --amend``,
548 ``git rebase`` and ``git reset`` change the branch in
549 non-fast-forwardable ways so they should only be used for non-pushed
550 commits.)
551
552 There is a problem with reverting a merge commit. ``git revert`` can
553 undo the code created by the merge commit but it cannot undo the fact
554 of merge. See the discussion `How to revert a faulty merge
555 <https://www.kernel.org/pub/software/scm/git/docs/howto/revert-a-faulty-merge.html>`_.
556
557
558 One thing that cannot be undone
559 -------------------------------
560
561 Whatever you undo, there is one thing that cannot be undone -
562 overwritten uncommitted changes. Uncommitted changes don't belong to
563 git so git cannot help preserving them.
564
565 Most of the time git warns you when you're going to execute a command
566 that overwrites uncommitted changes. Git doesn't allow you to switch
567 branches with ``git checkout``. It stops you when you're going to
568 rebase with non-clean working tree. It refuses to pull new commits
569 over non-committed files.
570
571 But there are commands that do exactly that - overwrite files in the
572 working tree. Commands like ``git checkout $PATHs`` or ``git reset
573 --hard`` silently overwrite files including your uncommitted changes.
574
575 With that in mind you can understand the stance "commit early, commit
576 often". Commit as often as possible. Commit on every save in your
577 editor or IDE. You can edit your commits before pushing - edit commit
578 messages, change commits, reorder, combine, split, remove. But save
579 your changes in git database, either commit changes or at least stash
580 them with ``git stash``.
581
582
583 Merge or rebase?
584 ================
585
586 Internet is full of heated discussions on the topic: "merge or
587 rebase?" Most of them are meaningless. When a DVCS is being used in a
588 big team with a big and complex project with many branches there is
589 simply no way to avoid merges. So the question's diminished to
590 "whether to use rebase, and if yes - when to use rebase?" Considering
591 that it is very much recommended not to rebase published commits the
592 question's diminished even further: "whether to use rebase on
593 non-pushed commits?"
594
595 That small question is for the team to decide. To preserve the beauty
596 of linear history it's recommended to use rebase when pulling, i.e. do
597 ``git pull --rebase`` or even configure automatic setup of rebase for
598 every new branch::
599
600     $ git config branch.autosetuprebase always
601
602 and configure rebase for existing branches::
603
604     $ git config branch.$NAME.rebase true
605
606 For example::
607
608     $ git config branch.v1.rebase true
609     $ git config branch.master.rebase true
610
611 After that ``git pull origin master`` becomes equivalent to ``git pull
612 --rebase origin master``.
613
614 It is recommended to create new commits in a separate feature or topic
615 branch while using rebase to update the mainline branch. When the
616 topic branch is ready merge it into mainline. To avoid a tedious task
617 of resolving large number of conflicts at once you can merge the topic
618 branch to the mainline from time to time and switch back to the topic
619 branch to continue working on it. The entire workflow would be
620 something like::
621
622     $ git checkout -b issue-42  # create a new issue branch and switch to it
623         ...edit/test/commit...
624     $ git checkout master
625     $ git pull --rebase origin master  # update master from the upstream
626     $ git merge issue-42
627     $ git branch -d issue-42  # delete the topic branch
628     $ git push origin master
629
630 When the topic branch is deleted only the label is removed, commits
631 are stayed in the database, they are now merged into master::
632
633     o--o--o--o--o--M--< master - the mainline branch
634         \         /
635          --*--*--*             - the topic branch, now unnamed
636
637 The topic branch is deleted to avoid cluttering branch namespace with
638 small topic branches. Information on what issue was fixed or what
639 feature was implemented should be in the commit messages.
640
641 But even that small amount of rebasing could be too big in case of
642 long-lived merged branches. Imagine you're doing work in both ``v1``
643 and ``master`` branches, regularly merging ``v1`` into ``master``.
644 After some time you will have a lot of merge and non-merge commits in
645 ``master``. Then you want to push your finished work to a shared
646 repository and find someone has pushed a few commits to ``v1``. Now
647 you have a choice of two equally bad alternatives: either you fetch
648 and rebase ``v1`` and then have to recreate all you work in ``master``
649 (reset ``master`` to the origin, merge ``v1`` and cherry-pick all
650 non-merge commits from the old master); or merge the new ``v1`` and
651 loose the beauty of linear history.
652
653
654 Null-merges
655 ===========
656
657 Git has a builtin merge strategy for what Python core developers call
658 "null-merge"::
659
660     $ git merge -s ours v1  # null-merge v1 into master
661
662
663 Branching models
664 ================
665
666 Git doesn't assume any particular development model regarding
667 branching and merging. Some projects prefer to graduate patches from
668 the oldest branch to the newest, some prefer to cherry-pick commits
669 backwards, some use squashing (combining a number of commits into
670 one). Anything is possible.
671
672 There are a few examples to start with. `git help workflows
673 <https://www.kernel.org/pub/software/scm/git/docs/gitworkflows.html>`_
674 describes how the very git authors develop git.
675
676 ProGit book has a few chapters devoted to branch management in
677 different projects: `Git Branching - Branching Workflows
678 <https://git-scm.com/book/en/Git-Branching-Branching-Workflows>`_ and
679 `Distributed Git - Contributing to a Project
680 <https://git-scm.com/book/en/Distributed-Git-Contributing-to-a-Project>`_.
681
682 There is also a well-known article `A successful Git branching model
683 <http://nvie.com/posts/a-successful-git-branching-model/>`_ by Vincent
684 Driessen. It recommends a set of very detailed rules on creating and
685 managing mainline, topic and bugfix branches. To support the model the
686 author implemented `git flow <https://github.com/nvie/gitflow>`_
687 extension.
688
689
690 Advanced configuration
691 ======================
692
693 Line endings
694 ------------
695
696 Git has builtin mechanisms to handle line endings between platforms
697 with different end-of-line styles. To allow git to do CRLF conversion
698 assign ``text`` attribute to files using `.gitattributes
699 <https://www.kernel.org/pub/software/scm/git/docs/gitattributes.html>`_.
700 For files that have to have specific line endings assign ``eol``
701 attribute. For binary files the attribute is, naturally, ``binary``.
702
703 For example::
704
705     $ cat .gitattributes
706     *.py text
707     *.txt text
708     *.png binary
709     /readme.txt eol=CRLF
710
711 To check what attributes git uses for files use ``git check-attr``
712 command. For example::
713
714 $ git check-attr -a -- \*.py
715
716
717 Advanced topics
718 ===============
719
720 Staging area
721 ------------
722
723 Staging area aka index aka cache is a distinguishing feature of git.
724 Staging area is where git collects patches before committing them.
725 Separation between collecting patches and commit phases provides a
726 very useful feature of git: you can review collected patches before
727 commit and even edit them - remove some hunks, add new hunks and
728 review again.
729
730 To add files to the index use ``git add``. Collecting patches before
731 committing means you need to do that for every change, not only to add
732 new (untracked) files. To simplify committing in case you just want to
733 commit everything without reviewing run ``git commit --all`` (or just
734 ``-a``) - the command adds every changed tracked file to the index and
735 then commit. To commit a file or files regardless of patches collected
736 in the index run ``git commit [--only|-o] -- $FILE...``.
737
738 To add hunks of patches to the index use ``git add --patch`` (or just
739 ``-p``). To remove collected files from the index use ``git reset HEAD
740 -- $FILE...`` To add/inspect/remove collected hunks use ``git add
741 --interactive`` (``-i``).
742
743 To see the diff between the index and the last commit (i.e., collected
744 patches) use ``git diff --cached``. To see the diff between the
745 working tree and the index (i.e., uncollected patches) use just ``git
746 diff``. To see the diff between the working tree and the last commit
747 (i.e., both collected and uncollected patches) run ``git diff HEAD``.
748
749 See `WhatIsTheIndex
750 <https://git.wiki.kernel.org/index.php/WhatIsTheIndex>`_ and
751 `IndexCommandQuickref
752 <https://git.wiki.kernel.org/index.php/IndexCommandQuickref>`_ in Git
753 Wiki.
754
755
756 ReReRe
757 ======
758
759 Rerere is a mechanism that helps to resolve repeated merge conflicts.
760 The most frequent source of recurring merge conflicts are topic
761 branches that are merged into mainline and then the merge commits are
762 removed; that's often performed to test the topic branches and train
763 rerere; merge commits are removed to have clean linear history and
764 finish the topic branch with only one last merge commit.
765
766 Rerere works by remembering the states of tree before and after a
767 successful commit. That way rerere can automatically resolve conflicts
768 if they appear in the same files.
769
770 Rerere can be used manually with ``git rerere`` command but most often
771 it's used automatically. Enable rerere with these commands in a
772 working tree::
773
774     $ git config rerere.enabled true
775     $ git config rerere.autoupdate true
776
777 You don't need to turn rerere on globally - you don't want rerere in
778 bare repositories or single-branche repositories; you only need rerere
779 in repos where you often perform merges and resolve merge conflicts.
780
781 See `Rerere <https://git-scm.com/book/en/Git-Tools-Rerere>`_ in The
782 Book.
783
784
785 Database maintenance
786 ====================
787
788 Git object database and other files/directories under ``.git`` require
789 periodic maintenance and cleanup. For example, commit editing left
790 unreferenced objects (dangling objects, in git terminology) and these
791 objects should be pruned to avoid collecting cruft in the DB. The
792 command ``git gc`` is used for maintenance. Git automatically runs
793 ``git gc --auto`` as a part of some commands to do quick maintenance.
794 Users are recommended to run ``git gc --aggressive`` from time to
795 time; ``git help gc`` recommends to run it  every few hundred
796 changesets; for more intensive projects it should be something like
797 once a week and less frequently (biweekly or monthly) for lesser
798 active projects.
799
800 ``git gc --aggressive`` not only removes dangling objects, it also
801 repacks object database into indexed and better optimized pack(s); it
802 also packs symbolic references (branches and tags). Another way to do
803 it is to run ``git repack``.
804
805 There is a well-known `message
806 <https://gcc.gnu.org/ml/gcc/2007-12/msg00165.html>`_ from Linus
807 Torvalds regarding "stupidity" of ``git gc --aggressive``. The message
808 can safely be ignored now. It is old and outdated, ``git gc
809 --aggressive`` became much better since that time.
810
811 For those who still prefer ``git repack`` over ``git gc --aggressive``
812 the recommended parameters are ``git repack -a -d -f --depth=20
813 --window=250``. See `this detailed experiment
814 <http://vcscompare.blogspot.ru/2008/06/git-repack-parameters.html>`_
815 for explanation of the effects of these parameters.
816
817 From time to time run ``git fsck [--strict]`` to verify integrity of
818 the database. ``git fsck`` may produce a list of dangling objects;
819 that's not an error, just a reminder to perform regular maintenance.
820
821
822 Tips and tricks
823 ===============
824
825 Command-line options and arguments
826 ----------------------------------
827
828 `git help cli
829 <https://www.kernel.org/pub/software/scm/git/docs/gitcli.html>`_
830 recommends not to combine short options/flags. Most of the times
831 combining works: ``git commit -av`` works perfectly, but there are
832 situations when it doesn't. E.g., ``git log -p -5`` cannot be combined
833 as ``git log -p5``.
834
835 Some options have arguments, some even have default arguments. In that
836 case the argument for such option must be spelled in a sticky way:
837 ``-Oarg``, never ``-O arg`` because for an option that has a default
838 argument the latter means "use default value for option ``-O`` and
839 pass ``arg`` further to the option parser". For example, ``git grep``
840 has an option ``-O`` that passes a list of names of the found files to
841 a program; default program for ``-O`` is a pager (usually ``less``),
842 but you can use your editor::
843
844     $ git grep -Ovim # but not -O vim
845
846 BTW, if git is instructed to use ``less`` as the pager (i.e., if pager
847 is not configured in git at all it uses ``less`` by default, or if it
848 gets ``less`` from GIT_PAGER or PAGER environment variables, or if it
849 was configured with ``git config --global core.pager less``, or
850 ``less`` is used in the command ``git grep -Oless``) ``git grep``
851 passes ``+/$pattern`` option to ``less`` which is quite convenient.
852 Unfortunately, ``git grep`` doesn't pass the pattern if the pager is
853 not exactly ``less``, even if it's ``less`` with parameters (something
854 like ``git config --global core.pager less -FRSXgimq``); fortunately,
855 ``git grep -Oless`` always passes the pattern.
856
857
858 bash/zsh completion
859 -------------------
860
861 It's a bit hard to type ``git rebase --interactive --preserve-merges
862 HEAD~5`` manually even for those who are happy to use command-line,
863 and this is where shell completion is of great help. Bash/zsh come
864 with programmable completion, often automatically installed and
865 enabled, so if you have bash/zsh and git installed, chances are you
866 are already done - just go and use it at the command-line.
867
868 If you don't have necessary bits installed, install and enable
869 bash_completion package. If you want to upgrade your git completion to
870 the latest and greatest download necessary file from `git contrib
871 <https://git.kernel.org/cgit/git/git.git/tree/contrib/completion>`_.
872
873 Git-for-windows comes with git-bash for which bash completion is
874 installed and enabled.
875
876
877 bash/zsh prompt
878 ---------------
879
880 For command-line lovers shell prompt can carry a lot of useful
881 information. To include git information in the prompt use
882 `git-prompt.sh
883 <https://git.kernel.org/cgit/git/git.git/tree/contrib/completion/git-prompt.sh>`_.
884 Read the detailed instructions in the file.
885
886 Search the Net for "git prompt" to find other prompt variants.
887
888
889 git on server
890 =============
891
892 The simplest way to publish a repository or a group of repositories is
893 ``git daemon``. The daemon provides anonymous access, by default it is
894 read-only. The repositories are accessible by git protocol (git://
895 URLs). Write access can be enabled but the protocol lacks any
896 authentication means, so it should be enabled only within a trusted
897 LAN. See ``git help daemon`` for details.
898
899 Git over ssh provides authentication and repo-level authorisation as
900 repositories can be made user- or group-writeable (see parameter
901 ``core.sharedRepository`` in ``git help config``). If that's too
902 permissive or too restrictive for some project's needs there is a
903 wrapper `gitolite <http://gitolite.com/gitolite/index.html>`_ that can
904 be configured to allow access with great granularity; gitolite is
905 written in Perl and has a lot of documentation.
906
907 Web interface to browse repositories can be created using `gitweb
908 <https://git.kernel.org/cgit/git/git.git/tree/gitweb>`_ or `cgit
909 <http://git.zx2c4.com/cgit/about/>`_. Both are CGI scripts (written in
910 Perl and C). In addition to web interface both provide read-only dumb
911 http access for git (http(s):// URLs). `Klaus
912 <https://pypi.python.org/pypi/klaus>`_ is a small and simple WSGI web
913 server that implements both web interface and git smart HTTP
914 transport; supports Python 2 and Python 3, performs syntax
915 highlighting.
916
917 There are also more advanced web-based development environments that
918 include ability to manage users, groups and projects; private,
919 group-accessible and public repositories; they often include issue
920 trackers, wiki pages, pull requests and other tools for development
921 and communication. Among these environments are `Kallithea
922 <https://kallithea-scm.org/>`_ and `pagure <https://pagure.io/>`_,
923 both are written in Python; pagure was written by Fedora developers
924 and is being used to develop some Fedora projects. `GitPrep
925 <http://gitprep.yukikimoto.com/>`_ is yet another Github clone,
926 written in Perl. `Gogs <https://gogs.io/>`_ is written in Go.
927 `GitBucket <https://takezoe.github.io/gitbucket/about/>`_ is written
928 in Scala.
929
930 And last but not least, `Gitlab <https://about.gitlab.com/>`_. It's
931 perhaps the most advanced web-based development environment for git.
932 Written in Ruby, community edition is free and open source (MIT
933 license).
934
935
936 From Mercurial to git
937 =====================
938
939 There are many tools to convert Mercurial repositories to git. The
940 most famous are, probably, `hg-git <https://hg-git.github.io/>`_ and
941 `fast-export <http://repo.or.cz/w/fast-export.git>`_ (many years ago
942 it was known under the name ``hg2git``).
943
944 But a better tool, perhaps the best, is `git-remote-hg
945 <https://github.com/felipec/git-remote-hg>`_. It provides transparent
946 bidirectional (pull and push) access to Mercurial repositories from
947 git. Its author wrote a `comparison of alternatives
948 <https://github.com/felipec/git/wiki/Comparison-of-git-remote-hg-alternatives>`_
949 that seems to be mostly objective.
950
951 To use git-remote-hg, install or clone it, add to your PATH (or copy
952 script ``git-remote-hg`` to a directory that's already in PATH) and
953 prepend ``hg::`` to Mercurial URLs. For example::
954
955     $ git clone https://github.com/felipec/git-remote-hg.git
956     $ PATH=$PATH:"`pwd`"/git-remote-hg
957     $ git clone hg::https://hg.python.org/peps/ PEPs
958
959 To work with the repository just use regular git commands including
960 ``git fetch/pull/push``.
961
962 To start converting your Mercurial habits to git see the page
963 `Mercurial for Git users
964 <https://mercurial.selenic.com/wiki/GitConcepts>`_ at Mercurial wiki.
965 At the second half of the page there is a table that lists
966 corresponding Mercurial and git commands. Should work perfectly in
967 both directions.
968
969 Python Developer's Guide also has a chapter `Mercurial for git
970 developers <https://docs.python.org/devguide/gitdevs.html>`_ that
971 documents a few differences between git and hg.
972
973
974 Copyright
975 =========
976
977 This document has been placed in the public domain.
978
979
980 \f
981 ..
982    Local Variables:
983    mode: indented-text
984    indent-tabs-mode: nil
985    sentence-end-double-space: t
986    fill-column: 70
987    coding: utf-8
988    End:
989    vim: set fenc=us-ascii tw=70 :