]> git.phdru.name Git - git-wiki.git/blob - pep-git.txt
Add an example for ``git check-attr``
[git-wiki.git] / pep-git.txt
1 PEP: XXX
2 Title: Collecting information about git
3 Version: $Revision$
4 Last-Modified: $Date$
5 Author: Oleg Broytman <phd@phdru.name>
6 Status: Draft
7 Type: Informational
8 Content-Type: text/x-rst
9 Created: 01-Jun-2015
10 Post-History: 
11
12 Abstract
13 ========
14
15 This Informational PEP collects information about git. There is, of
16 course, a lot of documentation for git, so the PEP concentrates on
17 more complex issues, scenarios and topics.
18
19 The plan is to extend the PEP in the future collecting information
20 about equivalence of Mercurial and git scenarios to help migrating
21 Python development from Mercurial to git.
22
23 The author of the PEP doesn't currently plan to write a Process PEP on
24 migration from Mercurial to git.
25
26
27 Documentation
28 =============
29
30 Git is accompanied with a lot of documentation, both online and
31 offline.
32
33 Documentation for starters
34 --------------------------
35
36 Git Tutorial: `part 1
37 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial.html>`_,
38 `part 2
39 <https://www.kernel.org/pub/software/scm/git/docs/gittutorial-2.html>`_.
40
41 `Git User's manual
42 <https://www.kernel.org/pub/software/scm/git/docs/user-manual.html>`_.
43 `Everyday GIT With 20 Commands Or So
44 <https://www.kernel.org/pub/software/scm/git/docs/everyday.html>`_.
45 `Git workflows
46 <https://www.kernel.org/pub/software/scm/git/docs/gitworkflows.html>`_.
47
48 Advanced documentation
49 ----------------------
50
51 `Git Magic
52 <http://www-cs-students.stanford.edu/~blynn/gitmagic/index.html>`_,
53 also with a number of translations.
54
55 `Pro Git <https://git-scm.com/book>`_. The Book about git. Buy it at
56 Amazon or download in PDF, mobi, or ePub form. Has translations to
57 many different languages. Download Russian translation from `GArik
58 <https://github.com/GArik/progit/wiki>`_.
59
60 `Git Wiki <https://git.wiki.kernel.org/index.php/Main_Page>`_.
61
62 Offline documentation
63 ---------------------
64
65 Git has builtin help: run ``git help $TOPIC``. For example, run
66 ``git help git`` or ``git help help``.
67
68
69 Quick start
70 ===========
71
72 Download and installation
73 -------------------------
74
75 Unix users: download and install using your package manager.
76
77 Microsoft Windows: download `git-for-windows
78 <https://github.com/git-for-windows/git/releases>`_ or `msysGit
79 <https://github.com/msysgit/msysgit/releases>`_.
80
81 MacOS X: use git installed with `XCode
82 <https://developer.apple.com/xcode/downloads/>`_ or download from
83 `MacPorts <https://www.macports.org/ports.php?by=name&substr=git>`_ or
84 `git-osx-installer
85 <http://sourceforge.net/projects/git-osx-installer/files/>`_ or
86 install git with `Homebrew <http://brew.sh/>`_: ``brew install git``.
87
88 `git-cola <https://git-cola.github.io/index.html>`_ is a Git GUI
89 written in Python and GPL licensed. Linux, Windows, MacOS X.
90
91 `TortoiseGit <https://tortoisegit.org/>`_ is a Windows Shell Interface
92 to Git based on TortoiseSVN; open source.
93
94 Initial configuration
95 ---------------------
96
97 This simple code is often appears in documentation, but it is
98 important so let repeat it here. Git stores author and committer
99 names/emails in every commit, so configure your real name and
100 preferred email::
101
102     $ git config --global user.name "User Name"
103     $ git config --global user.email user.name@example.org
104
105
106 Examples in this PEP
107 ====================
108
109 Examples of git commands in this PEP use the following approach. It is
110 supposed that you, the user, works with a local repository named
111 ``python`` that has an upstream remote repo named ``origin``. Your
112 local repo has two branches ``v1`` and ``v2``. For most examples the
113 currently checked out branch is ``v2``. That is, it's assumed you have
114 done something like that::
115
116     $ git clone -b v2 http://git.python.org/python.git
117     $ cd python
118     $ git branch v1 origin/v1
119
120 The first command clones remote repository into local directory
121 `python``, creates a new local branch v2, sets remotes/origin/v2 as
122 its upstream remote-tracking branch and checks it out into the working
123 directory.
124
125 The last command creates a new local branch v1 and sets
126 remotes/origin/v1 as its upstream remote-tracking branch.
127
128 The same result can be achieved with commands::
129
130     $ git clone -b v1 http://git.python.org/python.git
131     $ cd python
132     $ git checkout --track origin/v2
133
134 The last command creates a new local branch v2, sets remotes/origin/v2
135 as its upstream remote-tracking branch and checks it out into the
136 working directory.
137
138
139 Branches and branches
140 =====================
141
142 Git terminology can be a bit misleading. Take, for example, the term
143 "branch". In git it has two meanings. A branch is a directed line of
144 commits (possibly with merges). And a branch is a label or a pointer
145 assigned to a line of commits. It is important to distinguish when you
146 talk about commits and when about their labels. Lines of commits are
147 by itself unnamed and are usually only lengthening and merging.
148 Labels, on the other hand, can be created, moved, renamed and deleted
149 freely.
150
151
152 Remote repositories and remote branches
153 =======================================
154
155 Remote-tracking branches are branches (pointers to commits) in your
156 local repository. They are there for you to remember what branches and
157 commits have been pulled from and pushed to what remote repos (you can
158 pull from and push to many remotes). Remote-tracking branches live
159 under ``remotes/$REMOTE`` namespaces, e.g. ``remotes/origin/v2``.
160
161 To see the status of remote-tracking branches run::
162
163     $ git branch -rv
164
165 To see local and remote-tracking branches (and tags) pointing to
166 commits::
167
168     $ git log --decorate
169
170 You never do your own development on remote-tracking branches. You
171 create a local branch that has a remote branch as upstream and do
172 development on that local branch. On push git pushes commits to the
173 remote repo and updates remote-tracking branches, on pull git fetches
174 commits from the remote repo, updates remote-tracking branches and
175 fast-forwards, merges or rebases local branches.
176
177 When you do an initial clone like this::
178
179     $ git clone -b v1 http://git.python.org/python.git
180
181 git clones remote repository ``http://git.python.org/python.git`` to
182 directory ``python``, creates remote-tracking branches, creates a
183 local branch ``v1``, configure it to track upstream remotes/origin/v1
184 branch and checks out ``v1`` into the working directory.
185
186 Updating local and remote-tracking branches
187 -------------------------------------------
188
189 There is a major difference between
190
191 ::
192
193     $ git fetch $REMOTE $BRANCH
194
195 and
196
197 ::
198
199     $ git fetch $REMOTE $BRANCH:$BRANCH
200
201 The first command fetches commits from the named $BRANCH in the
202 $REMOTE repository that are not in your repository, updates
203 remote-tracking branch and leaves the id (the hash) of the head commit
204 in file .git/FETCH_HEAD.
205
206 The second command fetches commits from the named $BRANCH in the
207 $REMOTE repository that are not in your repository and updates both
208 the local branch $BRANCH and its upstream remote-tracking branch. But
209 it refuses to update branches in case of non-fast-forward. And it
210 refuses to update the current branch.
211
212 The first command is used internally by ``git pull``.
213
214 ::
215
216     $ git pull $REMOTE $BRANCH
217
218 is equivalent to
219
220 ::
221
222     $ git fetch $REMOTE $BRANCH
223     $ git merge FETCH_HEAD
224
225 Certainly, $BRANCH in that case should be your current branch. If you
226 want to merge a different branch into your current branch first update
227 that non-current branch and then merge::
228
229     $ git fetch origin v1:v1  # Update v1
230     $ git pull --rebase origin v2  # Update the current branch v2 using
231                                    # rebase instead of merge
232     $ git merge v1
233
234 If you have not yet pushed commits on ``v1``, though, the scenario has
235 to become a bit more complex. Git refuses to update
236 non-fast-forwardable branch, and you don't want to do force-pull
237 because that would remove your non-pushed commits and you would need
238 to recover. So you want to rebase ``v1`` but you cannot rebase
239 non-current branch. Hence, checkout ``v1`` and rebase it before
240 merging::
241
242     $ git checkout v1
243     $ git pull --rebase origin v1
244     $ git checkout v2
245     $ git pull --rebase origin v2
246     $ git merge v1
247
248 It is possible to configure git to make it fetch/pull a few branches
249 or all branches at once, so you can simply run
250
251 ::
252
253     $ git pull origin
254
255 or even
256
257 ::
258
259     $ git pull
260
261 Default remote repository for fetching/pulling is origin. Default set
262 of references to fetch is calculated using matching algorithm: git
263 fetches all branches having the same name on both ends.
264
265 Push
266 ''''
267
268 Pushing is a bit simpler. There is only one command ``push``. When you
269 run
270
271 ::
272
273     $ git push origin v1 v2
274
275 git pushes local v1 to remote v1 and local v2 to remote v2. The same
276 as::
277
278     $ git push origin v1:v1 v2:v2
279
280 Git pushes commits to the remote repo and updates remote-tracking
281 branches. Git refuses to push commits that aren't fast-forwardable.
282 You can force-push anyway, but please remember - you can force-push to
283 your own repositories but don't force-push to public or shared repos.
284 If you find git refuses to push commits that aren't fast-forwardable,
285 better fetch and merge commits from the remote repo (or rebase your
286 commits on top of the fetched commits), then push. Only force-push if
287 you know what you do and why you do it. See the section `Commit
288 editing and caveats`_ below.
289
290 It is possible to configure git to make it push a few branches or all
291 branches at once, so you can simply run
292
293 ::
294
295     $ git push origin
296
297 or even
298
299 ::
300
301     $ git push
302
303 Default remote repository for pushing is origin. Default set
304 of references to push in git before 2.0 is calculated using matching
305 algorithm: git pushes all branches having the same name on both ends.
306 Default set of references to push in git 2.0+ is calculated using
307 simple algorithm: git pushes the current branch back to its
308 @{upstream}.
309
310 To configure git before 2.0 to the new behaviour run::
311
312 $ git config push.default simple
313
314 To configure git 2.0+ to the old behaviour run::
315
316 $ git config push.default matching
317
318 Git refuses to push a branch if it's the current branch in the remote
319 non-bare repository: git refuses to update remote working directory.
320 You really should push only to bare repositories. For non-bare
321 repositories git prefers pull-based workflow.
322
323 When you want to deploy code on a remote host and can only use push
324 (because your workstation is behind a firewall and you cannot pull
325 from it) you do that in two steps using two repositories: you push
326 from the workstation to a bare repo on the remote host, ssh to the
327 remote host and pull from the bare repo to a non-bare deployment repo.
328
329 That changed in git 2.3, but see `the blog post
330 <https://github.com/blog/1957-git-2-3-has-been-released#push-to-deploy>`_
331 for caveats; in 2.4 the push-to-deploy feature was `further improved
332 <https://github.com/blog/1994-git-2-4-atomic-pushes-push-to-deploy-and-more#push-to-deploy-improvements>`_.
333
334 Tags
335 ''''
336
337 Git automatically fetches tags that point to commits being fetched
338 during fetch/pull. To fetch all tags (and commits they point to) run
339 ``git fetch --tags origin``. To fetch some specific tags fetch them
340 explicitly::
341
342     $ git fetch origin tag $TAG1 tag $TAG2...
343
344 For example::
345
346     $ git fetch origin tag 1.4.2
347     $ git fetch origin v1:v1 tag 2.1.7
348
349 Git doesn't automatically pushes tags. That allows you to have private
350 tags (lightweight tags are also private for a repo, they cannot be
351 pushed). To push tags list them explicitly::
352
353     $ git push origin tag 1.4.2
354     $ git push origin v1 v2 tag 2.1.7
355
356 Don't move tags with ``git tag -f`` or remove tags with ``git tag -d``
357 after they have been published.
358
359
360 Commit editing and caveats
361 ==========================
362
363 A warning not to edit published (pushed) commits also appears in
364 documentation but it's repeated here anyway as it's very important.
365
366 It is possible to recover from forced push but it's PITA for the
367 entire team. Please avoid it.
368
369 To see what commits have not been published yet compare the head of the
370 branch with its upstream remote-tracking branch::
371
372     $ git log origin/v2..
373     $ git log origin/v1..v1
374
375 For every branch that has an upstream remote-tracking branch git
376 maintains an alias @{upstream} (short version @{u}), so the commands
377 above can be given as::
378
379     $ git log @{u}..
380     $ git log v1@{u}..v1
381
382 To see the status of all branches::
383
384     $ git branch -avv
385
386 To compare the status of local branches with a remote repo::
387
388     $ git remote show origin
389
390 Read `how to recover from upstream rebase
391 <https://git-scm.com/docs/git-rebase#_recovering_from_upstream_rebase>`_.
392 It is in ``git help rebase``.
393
394 On the other hand don't be too afraid about commit editing. You can
395 safely edit, remove, reorder, combine and split commits that haven't
396 been pushed yet. You can even push commits to your own (backup) repo,
397 edit them later and force-push edited commits to replace what have
398 already been pushed. Not a problem until commits are in a public
399 or shared repository.
400
401
402 Undo
403 ====
404
405 Whatever you do, don't panic. Almost anything in git can be undone.
406
407 git checkout: restore file's content
408 ------------------------------------
409
410 ``git checkout``, for example, can be used to restore the content of
411 file(s) to that one of a commit. Like this::
412
413     git checkout HEAD~ README
414
415 The commands restores the contents of README file to the last but one
416 commit in the current branch. By default the commit ID is simply HEAD;
417 i.e. ``git checkout README`` restores README to the latest commit.
418
419 (Do not use ``git checkout`` to view a content of a file in a commit,
420 use ``git cat-file -p``; e.g. ``git cat-file -p HEAD~:path/to/README``).
421
422 git reset: remove (non-pushed) commits
423 --------------------------------------
424
425 ``git reset`` moves the head of the current branch. The head can be
426 moved to point to any commit but it's often used to remove a commit or
427 a few (preferably, non-pushed ones) from the top of the branch - that
428 is, to move the branch backward in order to undo a few (non-pushed)
429 commits.
430
431 ``git reset`` has three modes of operation - soft, hard and mixed.
432 Default is mixed. ProGit `explains
433 <https://git-scm.com/book/en/Git-Tools-Reset-Demystified>`_ the
434 difference very clearly. Bare repositories don't have indices or
435 working trees so in a bare repo only soft reset is possible.
436
437 Unstaging
438 '''''''''
439
440 Mixed mode reset with a path or paths can be used to unstage changes -
441 that is, to remove from index changes added with ``git add`` for
442 committing. See `The Book
443 <https://git-scm.com/book/en/Git-Basics-Undoing-Things>`_ for details
444 about unstaging and other undo tricks.
445
446 git reflog: reference log
447 -------------------------
448
449 Removing commits with ``git reset`` or moving the head of a branch
450 sounds dangerous and it is. But there is a way to undo: another
451 reset back to the original commit. Git doesn't remove commits
452 immediately; unreferenced commits (in git terminology they are called
453 "dangling commits") stay in the database for some time (default is two
454 weeks) so you can reset back to it or create a new branch pointing to
455 the original commit.
456
457 For every move of a branch's head - with ``git commit``, ``git
458 checkout``, ``git fetch``, ``git pull``, ``git rebase``, ``git reset``
459 and so on - git stores a reference log (reflog for short). For every
460 move git stores where the head was. Command ``git reflog`` can be used
461 to view (and manipulate) the log.
462
463 In addition to the moves of the head of every branch git stores the
464 moves of the HEAD - a symbolic reference that (usually) names the
465 current branch. HEAD is changed with ``git checkout $BRANCH``.
466
467 By default ``git reflog`` shows the moves of the HEAD, i.e. the
468 command is equivalent to ``git reflog HEAD``. To show the moves of the
469 head of a branch use the command ``git reflog $BRANCH``.
470
471 So to undo a ``git reset`` lookup the original commit in ``git
472 reflog``, verify it with ``git show`` or ``git log`` and run ``git
473 reset $COMMIT_ID``. Git stores the move of the branch's head in
474 reflog, so you can undo that undo later again.
475
476 In a more complex situation you'd want to move some commits along with
477 resetting the head of the branch. Cherry-pick them to the new branch.
478 For example, if you want to reset the branch ``v2`` back to the
479 original commit but preserve two commits created in the current branch
480 do something like::
481
482     $ git branch save-v2 # create a new branch saving v2
483     $ git reflog # find the original place of v2
484     $ git reset $COMMIT_ID
485     $ git cherry-pick save-v2~ save-v2
486     $ git branch -D save-v2 # remove temporary branch
487
488 git revert: revert a commit
489 ---------------------------
490
491 ``git revert`` reverts a commit or commits, that is, it creates a new
492 commit or commits that revert(s) the effects of the given commits.
493 It's the only way to undo published commits (``git commit --amend``,
494 ``git rebase`` and ``git reset`` change the branch in
495 non-fast-forwardable ways so they should only be used for non-pushed
496 commits.)
497
498 There is a problem with reverting a merge commit. ``git revert`` can
499 undo the code created by the merge commit but it cannot undo the fact
500 of merge. See the discussion `How to revert a faulty merge
501 <https://www.kernel.org/pub/software/scm/git/docs/howto/revert-a-faulty-merge.html>`_.
502
503 One thing that cannot be undone
504 -------------------------------
505
506 Whatever you undo, there is one thing that cannot be undone -
507 overwritten uncommitted changes. Uncommitted changes don't belong to
508 git so git cannot help preserving them.
509
510 Most of the time git warns you when you're going to execute a command
511 that overwrites uncommitted changes. Git warns you when you try to
512 switch branches with ``git checkout``. It warns you when you're going
513 to rebase with non-clean working tree. It refuses to pull new commits
514 over non-committed files.
515
516 But there are commands that do exactly that - overwrite files in the
517 working tree. Commands like ``git checkout $PATHs`` or ``git reset
518 --hard`` silently overwrite files including your uncommitted changes.
519
520 With that in mind you can understand the stance "commit early, commit
521 often". Commit as often as possible. Commit on every save in your
522 editor or IDE. You can edit your commits before pushing - change,
523 reorder, combine, remove. But save your changes in git database,
524 either commit changes or at least stash them with ``git stash``.
525
526
527 Merge or rebase?
528 ================
529
530 Internet is full of heated discussions on the topic: "merge or
531 rebase?" Most of them are meaningless. When a DVCS is being used in a
532 big team with a big and complex project with many branches there is
533 simply no way to avoid merges. So the question's diminished to
534 "whether to use rebase, and if yes - when to use rebase?" Considering
535 that it is very much recommended not to rebase published commits the
536 question's diminished even further: "whether to use rebase on
537 non-pushed commits?"
538
539 That small question is for the team to decide. The author of the PEP
540 recommends to use rebase when pulling, i.e. always do ``git pull
541 --rebase`` or even configure automatic setup of rebase for every new
542 branch::
543
544     $ git config branch.autosetuprebase always
545
546 and configure rebase for existing branches::
547
548     $ git config branch.$NAME.rebase true
549
550 For example::
551
552     $ git config branch.v1.rebase true
553     $ git config branch.v2.rebase true
554
555 After that ``git pull origin v2`` becomes equivalent to ``git pull
556 --rebase origin v2``.
557
558 In case when merge is preferred it is recommended to create new
559 commits in a separate feature or topic branch while using rebase to
560 update the mainline branch. When the topic branch is ready merge it
561 into mainline. To avoid a tedious task of resolving large number of
562 conflicts at once you can merge the topic branch to the mainline from
563 time to time and switch back to the topic branch to continue working
564 on it. The entire workflow would be something like::
565
566     $ git checkout -b issue-42  # create a new issue branch and switch to it
567         ...edit/test/commit...
568     $ git checkout v2
569     $ git pull --rebase origin v2  # update v2 from the upstream
570     $ git merge issue-42
571     $ git branch -d issue-42  # delete the topic branch
572     $ git push origin v2
573
574 When the topic branch is deleted only the label is removed, commits
575 are stayed in the database, they are now merged into v2::
576
577     o--o--o--o--o--M--< v2 - the mainline branch
578         \         /
579          --*--*--*         - the topic branch, now unnamed
580
581 The topic branch is deleted to avoid cluttering branch namespace with
582 small topic branches. Information on what issue was fixed or what
583 feature was implemented should be in the commit messages.
584
585
586 Null-merges
587 ===========
588
589 Git has a builtin merge strategy for what Python core developers call
590 "null-merge"::
591
592     $ git merge -s ours v1  # null-merge v1 into v2
593
594
595 Advanced configuration
596 ======================
597
598 Line endings
599 ------------
600
601 Git has builtin mechanisms to handle line endings between platforms
602 with different EOL styles. To allow git to do CRLF conversion assign
603 ``text`` attribute to files using `.gitattributes
604 <https://www.kernel.org/pub/software/scm/git/docs/gitattributes.html>`_.
605 For files that have to have specific line ending assign ``eol``
606 attribute. For binary files the attribute is, naturally, ``binary``.
607
608 For example::
609
610     $ cat .gitattributes
611     *.py text
612     *.txt text
613     *.png binary
614     /readme.txt eol=CRLF
615
616 To check what attributes git uses for files use ``git check-attr``
617 command. For example::
618
619 $ git check-attr -a -- \*.py
620
621
622 Advanced topics
623 ===============
624
625 Staging area
626 ------------
627
628 Staging area aka index is a distinguishing feature of git. See
629 `WhatIsTheIndex
630 <https://git.wiki.kernel.org/index.php/WhatIsTheIndex>`_ and
631 `IndexCommandQuickref
632 <https://git.wiki.kernel.org/index.php/IndexCommandQuickref>`_ in Git
633 Wiki.
634
635
636 ReReRe
637 ======
638
639 https://git-scm.com/book/en/Git-Tools-Rerere
640
641
642 Database maintenance
643 ====================
644
645 TODO: dangling objects, git gc, git repack.
646
647 https://gcc.gnu.org/ml/gcc/2007-12/msg00165.html
648
649 http://vcscompare.blogspot.ru/2008/06/git-repack-parameters.html
650
651
652 Tips and tricks
653 ===============
654
655 TODO: sticky options; example: git grep -O.
656
657 TODO: tricky options; example: git log -p3.
658
659 TODO: bash/zsh completion, bash/zsh prompt.
660 https://git.kernel.org/cgit/git/git.git/tree/contrib/completion
661
662
663 git on server
664 =============
665
666 TODO: anonymous access; git over ssh; gitolite; gitweb; cgit; gitlab.
667
668 http://gitolite.com/gitolite/index.html
669
670 https://git.kernel.org/cgit/git/git.git/tree/gitweb
671
672 http://git.zx2c4.com/cgit/
673
674 From Mercurial to git
675 =====================
676
677 Mercurial for Git users https://mercurial.selenic.com/wiki/GitConcepts
678
679 https://github.com/felipec/git-remote-hg
680
681 https://hg-git.github.io/
682
683
684 References
685 ==========
686
687 .. [] 
688
689
690 Copyright
691 =========
692
693 This document has been placed in the public domain.
694
695
696 \f
697 ..
698    Local Variables:
699    mode: indented-text
700    indent-tabs-mode: nil
701    sentence-end-double-space: t
702    fill-column: 70
703    coding: utf-8
704    End:
705    vim: set fenc=us-ascii tw=70 :