]> git.sur5r.net Git - i3/i3/blob - docs/hacking-howto
73ae96335991d5312e1b61b5a0c265be8a16926f
[i3/i3] / docs / hacking-howto
1 Hacking i3: How To
2 ==================
3 Michael Stapelberg <michael+i3@stapelberg.de>
4 July 2011
5
6 This document is intended to be the first thing you read before looking and/or
7 touching i3’s source code. It should contain all important information to help
8 you understand why things are like they are. If it does not mention something
9 you find necessary, please do not hesitate to contact me.
10
11 == Window Managers
12
13 A window manager is not necessarily needed to run X, but it is usually used in
14 combination with X to facilitate some things. The window manager's job is to
15 take care of the placement of windows, to provide the user with some mechanisms
16 to change the position/size of windows and to communicate with clients to a
17 certain extent (for example handle fullscreen requests of clients such as
18 MPlayer).
19
20 There are no different contexts in which X11 clients run, so a window manager
21 is just another client, like all other X11 applications. However, it handles
22 some events which normal clients usually don’t handle.
23
24 In the case of i3, the tasks (and order of them) are the following:
25
26 . Grab the key bindings (events will be sent upon keypress/keyrelease)
27 . Iterate through all existing windows (if the window manager is not started as
28   the first client of X) and manage them (reparent them, create window
29   decorations, etc.)
30 . When new windows are created, manage them
31 . Handle the client’s `_WM_STATE` property, but only the `_WM_STATE_FULLSCREEN`
32 . Handle the client’s `WM_NAME` property
33 . Handle the client’s size hints to display them proportionally
34 . Handle the client’s urgency hint
35 . Handle enter notifications (focus follows mouse)
36 . Handle button (as in mouse buttons) presses for focus/raise on click
37 . Handle expose events to re-draw own windows such as decorations
38 . React to the user’s commands: Change focus, Move windows, Switch workspaces,
39   Change the layout mode of a container (default/stacking/tabbed), start a new
40   application, restart the window manager
41
42 In the following chapters, each of these tasks and their implementation details
43 will be discussed.
44
45 === Tiling window managers
46
47 Traditionally, there are two approaches to managing windows: The most common
48 one nowadays is floating, which means the user can freely move/resize the
49 windows. The other approach is called tiling, which means that your window
50 manager distributes windows to use as much space as possible while not
51 overlapping each other.
52
53 The idea behind tiling is that you should not need to waste your time
54 moving/resizing windows while you usually want to get some work done. After
55 all, most users sooner or later tend to lay out their windows in a way which
56 corresponds to tiling or stacking mode in i3. Therefore, why not let i3 do this
57 for you? Certainly, it’s faster than you could ever do it.
58
59 The problem with most tiling window managers is that they are too unflexible.
60 In my opinion, a window manager is just another tool, and similar to vim which
61 can edit all kinds of text files (like source code, HTML, …) and is not limited
62 to a specific file type, a window manager should not limit itself to a certain
63 layout (like dwm, awesome, …) but provide mechanisms for you to easily create
64 the layout you need at the moment.
65
66 === The layout tree
67
68 The data structure which i3 uses to keep track of your windows is a tree. Every
69 node in the tree is a container (type +Con+). Some containers represent actual
70 windows (every container with a +window != NULL+), some represent split
71 containers and a few have special purposes: they represent workspaces, outputs
72 (like VGA1, LVDS1, …) or the X11 root window.
73
74 So, when you open a terminal and immediately open another one, they reside in
75 the same split container, which uses the default layout. In case of an empty
76 workspace, the split container we are talking about is the workspace.
77
78 To get an impression of how different layouts are represented, just play around
79 and look at the data structures -- they are exposed as a JSON hash. See
80 http://i3wm.org/docs/ipc.html#_get_tree_reply for documentation on that and an
81 example.
82
83 == Files
84
85 include/atoms.xmacro::
86 A file containing all X11 atoms which i3 uses. This file will be included
87 various times (for defining, requesting and receiving the atoms), each time
88 with a different definition of xmacro().
89
90 include/data.h::
91 Contains data definitions used by nearly all files. You really need to read
92 this first.
93
94 include/*.h::
95 Contains forward definitions for all public functions, as well as
96 doxygen-compatible comments (so if you want to get a bit more of the big
97 picture, either browse all header files or use doxygen if you prefer that).
98
99 src/cfgparse.l::
100 Contains the lexer for i3’s configuration file, written for +flex(1)+.
101
102 src/cfgparse.y::
103 Contains the parser for i3’s configuration file, written for +bison(1)+.
104
105 src/click.c::
106 Contains all functions which handle mouse button clicks (right mouse button
107 clicks initiate resizing and thus are relatively complex).
108
109 src/cmdparse.l::
110 Contains the lexer for i3 commands, written for +flex(1)+.
111
112 src/cmdparse.y::
113 Contains the parser for i3 commands, written for +bison(1)+.
114
115 src/con.c::
116 Contains all functions which deal with containers directly (creating
117 containers, searching containers, getting specific properties from containers,
118 …).
119
120 src/config.c::
121 Contains all functions handling the configuration file (calling the parser
122 (src/cfgparse.y) with the correct path, switching key bindings mode).
123
124 src/debug.c::
125 Contains debugging functions to print unhandled X events.
126
127 src/ewmh.c::
128 Functions to get/set certain EWMH properties easily.
129
130 src/floating.c::
131 Contains functions for floating mode (mostly resizing/dragging).
132
133 src/handlers.c::
134 Contains all handlers for all kinds of X events (new window title, new hints,
135 unmapping, key presses, button presses, …).
136
137 src/ipc.c::
138 Contains code for the IPC interface.
139
140 src/load_layout.c::
141 Contains code for loading layouts from JSON files.
142
143 src/log.c::
144 Handles the setting of loglevels, contains the logging functions.
145
146 src/main.c::
147 Initializes the window manager.
148
149 src/manage.c::
150 Looks at existing or new windows and decides whether to manage them. If so, it
151 reparents the window and inserts it into our data structures.
152
153 src/match.c::
154 A "match" is a data structure which acts like a mask or expression to match
155 certain windows or not. For example, when using commands, you can specify a
156 command like this: [title="*Firefox*"] kill. The title member of the match
157 data structure will then be filled and i3 will check each window using
158 match_matches_window() to find the windows affected by this command.
159
160 src/move.c::
161 Contains code to move a container in a specific direction.
162
163 src/output.c::
164 Functions to handle CT_OUTPUT cons.
165
166 src/randr.c::
167 The RandR API is used to get (and re-query) the configured outputs (monitors,
168 …).
169
170 src/render.c::
171 Renders the tree data structure by assigning coordinates to every node. These
172 values will later be pushed to X11 in +src/x.c+.
173
174 src/resize.c::
175 Contains the functions to resize containers.
176
177 src/sighandler.c::
178 Handles +SIGSEGV+, +SIGABRT+ and +SIGFPE+ by showing a dialog that i3 crashed.
179 You can chose to let it dump core, to restart it in-place or to restart it
180 in-place but forget about the layout.
181
182 src/tree.c::
183 Contains functions which open or close containers in the tree, change focus or
184 cleanup ("flatten") the tree. See also +src/move.c+ for another similar
185 function, which was moved into its own file because it is so long.
186
187 src/util.c::
188 Contains useful functions which are not really dependant on anything.
189
190 src/window.c::
191 Handlers to update X11 window properties like +WM_CLASS+, +_NET_WM_NAME+,
192 +CLIENT_LEADER+, etc.
193
194 src/workspace.c::
195 Contains all functions related to workspaces (displaying, hiding, renaming…)
196
197 src/x.c::
198 Transfers our in-memory tree (see +src/render.c+) to X11.
199
200 src/xcb.c::
201 Contains wrappers to use xcb more easily.
202
203 src/xcursor.c::
204 XCursor functions (for cursor themes).
205
206 src/xinerama.c::
207 Legacy support for Xinerama. See +src/randr.c+ for the preferred API.
208
209 == Data structures
210
211
212 See include/data.h for documented data structures. The most important ones are
213 explained right here.
214
215 /////////////////////////////////////////////////////////////////////////////////
216 // TODO: update image
217
218 image:bigpicture.png[The Big Picture]
219
220 /////////////////////////////////////////////////////////////////////////////////
221
222 So, the hierarchy is:
223
224 . *X11 root window*, the root container
225 . *Output container* (LVDS1 in this example)
226 . *Content container* (there are also containers for dock windows)
227 . *Workspaces* (Workspace 1 in this example, with horizontal orientation)
228 . *Split container* (vertically split)
229 . *X11 window containers*
230
231 The data type is +Con+, in all cases.
232
233 === X11 root window
234
235 The X11 root window is a single window per X11 display (a display is identified
236 by +:0+ or +:1+ etc.). The root window is what you draw your background image
237 on. It spans all the available outputs, e.g. +VGA1+ is a specific part of the
238 root window and +LVDS1+ is a specific part of the root window.
239
240 === Output container
241
242 Every active output obtained through RandR is represented by one output
243 container. Outputs are considered active when a mode is configured (meaning
244 something is actually displayed on the output) and the output is not a clone.
245
246 For example, if your notebook has a screen resolution of 1280x800 px and you
247 connect a video projector with a resolution of 1024x768 px, set it up in clone
248 mode (+xrandr \--output VGA1 \--mode 1024x768 \--same-as LVDS1+), i3 will
249 reduce the resolution to the lowest common resolution and disable one of the
250 cloned outputs afterwards.
251
252 However, if you configure it using +xrandr \--output VGA1 \--mode 1024x768
253 \--right-of LVDS1+, i3 will set both outputs active. For each output, a new
254 workspace will be assigned. New workspaces are created on the output you are
255 currently on.
256
257 === Content container
258
259 Each output has multiple children. Two of them are dock containers which hold
260 dock clients. The other one is the content container, which holds the actual
261 content (workspaces) of this output.
262
263 === Workspace
264
265 A workspace is identified by its name. Basically, you could think of
266 workspaces as different desks in your office, if you like the desktop
267 metaphor. They just contain different sets of windows and are completely
268 separate of each other. Other window managers also call this ``Virtual
269 desktops''.
270
271 === Split container
272
273 A split container is a container which holds an arbitrary amount of split
274 containers or X11 window containers. It has an orientation (horizontal or
275 vertical) and a layout.
276
277 Split containers (and X11 window containers, which are a subtype of split
278 containers) can have different border styles.
279
280 === X11 window container
281
282 An X11 window container holds exactly one X11 window. These are the leaf nodes
283 of the layout tree, they cannot have any children.
284
285 == List/queue macros
286
287 i3 makes heavy use of the list macros defined in BSD operating systems. To
288 ensure that the operating system on which i3 is compiled has all the expected
289 features, i3 comes with `include/queue.h`. On BSD systems, you can use man
290 `queue(3)`. On Linux, you have to use google (or read the source).
291
292 The lists used are +SLIST+ (single linked lists), +CIRCLEQ+ (circular
293 queues) and +TAILQ+ (tail queues). Usually, only forward traversal is necessary,
294 so an `SLIST` works fine. If inserting elements at arbitrary positions or at
295 the end of a list is necessary, a +TAILQ+ is used instead. However, for the
296 windows inside a container, a +CIRCLEQ+ is necessary to go from the currently
297 selected window to the window above/below.
298
299 == Naming conventions
300
301 There is a row of standard variables used in many events. The following names
302 should be chosen for those:
303
304  * ``conn'' is the xcb_connection_t
305  * ``event'' is the event of the particular type
306  * ``con'' names a container
307  * ``current'' is a loop variable when using +TAILQ_FOREACH+ etc.
308
309 == Startup (src/mainx.c, main())
310
311  * Establish the xcb connection
312  * Check for XKB extension on the separate X connection, load Xcursor
313  * Check for RandR screens (with a fall-back to Xinerama)
314  * Grab the keycodes for which bindings exist
315  * Manage all existing windows
316  * Enter the event loop
317
318 == Keybindings
319
320 === Grabbing the bindings
321
322 Grabbing the bindings is quite straight-forward. You pass X your combination of
323 modifiers and the keycode you want to grab and whether you want to grab them
324 actively or passively. Most bindings (everything except for bindings using
325 Mode_switch) are grabbed passively, that is, just the window manager gets the
326 event and cannot replay it.
327
328 We need to grab bindings that use Mode_switch actively because of a bug in X.
329 When the window manager receives the keypress/keyrelease event for an actively
330 grabbed keycode, it has to decide what to do with this event: It can either
331 replay it so that other applications get it or it can prevent other
332 applications from receiving it.
333
334 So, why do we need to grab keycodes actively? Because X does not set the
335 state-property of keypress/keyrelease events properly. The Mode_switch bit is
336 not set and we need to get it using XkbGetState. This means we cannot pass X
337 our combination of modifiers containing Mode_switch when grabbing the key and
338 therefore need to grab the keycode itself without any modifiers. This means,
339 if you bind Mode_switch + keycode 38 ("a"), i3 will grab keycode 38 ("a") and
340 check on each press of "a" if the Mode_switch bit is set using XKB. If yes, it
341 will handle the event, if not, it will replay the event.
342
343 === Handling a keypress
344
345 As mentioned in "Grabbing the bindings", upon a keypress event, i3 first gets
346 the correct state.
347
348 Then, it looks through all bindings and gets the one which matches the received
349 event.
350
351 The bound command is parsed by the cmdparse lexer/parser, see +parse_cmd+ in
352 +src/cmdparse.y+.
353
354 == Manage windows (src/main.c, manage_window() and reparent_window())
355
356 `manage_window()` does some checks to decide whether the window should be
357 managed at all:
358
359  * Windows have to be mapped, that is, visible on screen
360  * The override_redirect must not be set. Windows with override_redirect shall
361    not be managed by a window manager
362
363 Afterwards, i3 gets the intial geometry and reparents the window (see
364 `reparent_window()`) if it wasn’t already managed.
365
366 Reparenting means that for each window which is reparented, a new window,
367 slightly larger than the original one, is created. The original window is then
368 reparented to the bigger one (called "frame").
369
370 After reparenting, the window type (`_NET_WM_WINDOW_TYPE`) is checked to see
371 whether this window is a dock (`_NET_WM_WINDOW_TYPE_DOCK`), like dzen2 for
372 example. Docks are handled differently, they don’t have decorations and are not
373 assigned to a specific container. Instead, they are positioned at the bottom
374 or top of the screen (in the appropriate dock area containers). To get the
375 height which needs to be reserved for the window, the `_NET_WM_STRUT_PARTIAL`
376 property is used.
377
378 Furthermore, the list of assignments (to other workspaces, which may be on
379 other screens) is checked. If the window matches one of the user’s criteria,
380 it may either be put in floating mode or moved to a different workspace. If the
381 target workspace is not visible, the window will not be mapped.
382
383 == What happens when an application is started?
384
385 i3 does not care for applications. All it notices is when new windows are
386 mapped (see `src/handlers.c`, `handle_map_request()`). The window is then
387 reparented (see section "Manage windows").
388
389 After reparenting the window, `render_tree()` is called which renders the
390 internal layout table. The new window has been placed in the currently focused
391 container and therefore the new window and the old windows (if any) need to be
392 moved/resized so that the currently active layout (default/stacking/tabbed mode)
393 is rendered correctly. To move/resize windows, a window is ``configured'' in
394 X11-speak.
395
396 Some applications, such as MPlayer obviously assume the window manager is
397 stupid and try to configure their windows by themselves. This generates an
398 event called configurerequest. i3 handles these events and tells the window the
399 size it had before the configurerequest (with the exception of not yet mapped
400 windows, which get configured like they want to, and floating windows, which
401 can reconfigure themselves).
402
403 == _NET_WM_STATE
404
405 Only the _NET_WM_STATE_FULLSCREEN atom is handled. It calls
406 ``toggle_fullscreen()'' for the specific client which just configures the
407 client to use the whole screen on which it currently is. Also, it is set as
408 fullscreen_client for the i3Screen.
409
410 == WM_NAME
411
412 When the WM_NAME property of a window changes, its decoration (containing the
413 title) is re-rendered. Note that WM_NAME is in COMPOUND_TEXT encoding which is
414 totally uncommon and cumbersome. Therefore, the _NET_WM_NAME atom will be used
415 if present.
416
417 == _NET_WM_NAME
418
419 Like WM_NAME, this atom contains the title of a window. However, _NET_WM_NAME
420 is encoded in UTF-8. i3 will recode it to UCS-2 in order to be able to pass it
421 to X. Using an appropriate font (ISO-10646), you can see most special
422 characters (every special character contained in your font).
423
424 == Size hints
425
426 Size hints specify the minimum/maximum size for a given window as well as its
427 aspect ratio.  This is important for clients like mplayer, who only set the
428 aspect ratio and resize their window to be as small as possible (but only with
429 some video outputs, for example in Xv, while when using x11, mplayer does the
430 necessary centering for itself).
431
432 So, when an aspect ratio was specified, i3 adjusts the height of the window
433 until the size maintains the correct aspect ratio. For the code to do this, see
434 src/layout.c, function resize_client().
435
436 == Rendering (src/layout.c, render_layout() and render_container())
437
438 Rendering in i3 version 4 is the step which assigns the correct sizes for
439 borders, decoration windows, child windows and the stacking order of all
440 windows. In a separate step (+x_push_changes()+), these changes are pushed to
441 X11.
442
443 Keep in mind that all these properties (+rect+, +window_rect+ and +deco_rect+)
444 are temporary, meaning they will be overwritten by calling +render_con+.
445 Persistent position/size information is kept in +geometry+.
446
447 The entry point for every rendering operation (except for the case of moving
448 floating windows around) currently is +tree_render()+ which will re-render
449 everything that’s necessary (for every output, only the currently displayed
450 workspace is rendered). This behavior is expected to change in the future,
451 since for a lot of updates, re-rendering everything is not actually necessary.
452 Focus was on getting it working correct, not getting it work very fast.
453
454 What +tree_render()+ actually does is calling +render_con()+ on the root
455 container and then pushing the changes to X11. The following sections talk
456 about the different rendering steps, in the order of "top of the tree" (root
457 container) to the bottom.
458
459 === Rendering the root container
460
461 The i3 root container (`con->type == CT_ROOT`) represents the X11 root window.
462 It contains one child container for every output (like LVDS1, VGA1, …), which
463 is available on your computer.
464
465 Rendering the root will first render all tiling windows and then all floating
466 windows. This is necessary because a floating window can be positioned in such
467 a way that it is visible on two different outputs. Therefore, by first
468 rendering all the tiling windows (of all outputs), we make sure that floating
469 windows can never be obscured by tiling windows.
470
471 Essentially, though, this code path will just call +render_con()+ for every
472 output and +x_raise_con(); render_con()+ for every floating window.
473
474 In the special case of having a "global fullscreen" window (fullscreen mode
475 spanning all outputs), a shortcut is taken and +x_raise_con(); render_con()+ is
476 only called for the global fullscreen window.
477
478 === Rendering an output
479
480 Output containers (`con->layout == L_OUTPUT`) represent a hardware output like
481 LVDS1, VGA1, etc. An output container has three children (at the moment): One
482 content container (having workspaces as children) and the top/bottom dock area
483 containers.
484
485 The rendering happens in the function +render_l_output()+ in the following
486 steps:
487
488 1. Find the content container (`con->type == CT_CON`)
489 2. Get the currently visible workspace (+con_get_fullscreen_con(content,
490    CF_OUTPUT)+).
491 3. If there is a fullscreened window on that workspace, directly render it and
492    return, thus ignoring the dock areas.
493 4. Sum up the space used by all the dock windows (they have a variable height
494    only).
495 5. Set the workspace rects (x/y/width/height) based on the position of the
496    output (stored in `con->rect`) and the usable space
497    (`con->rect.{width,height}` without the space used for dock windows).
498 6. Recursively raise and render the output’s child containers (meaning dock
499    area containers and the content container).
500
501 === Rendering a workspace or split container
502
503 From here on, there really is no difference anymore. All containers are of
504 `con->type == CT_CON` (whether workspace or split container) and some of them
505 have a `con->window`, meaning they represent an actual window instead of a
506 split container.
507
508 ==== Default layout
509
510 In default layout, containers are placed horizontally or vertically next to
511 each other (depending on the `con->orientation`). If a child is a leaf node (as
512 opposed to a split container) and has border style "normal", appropriate space
513 will be reserved for its window decoration.
514
515 ==== Stacked layout
516
517 In stacked layout, only the focused window is actually shown (this is achieved
518 by calling +x_raise_con()+ in reverse focus order at the end of +render_con()+).
519
520 The available space for the focused window is the size of the container minus
521 the height of the window decoration for all windows inside this stacked
522 container.
523
524 If border style is "1pixel" or "none", no window decoration height will be
525 reserved (or displayed later on), unless there is more than one window inside
526 the stacked container.
527
528 ==== Tabbed layout
529
530 Tabbed layout works precisely like stacked layout, but the window decoration
531 position/size is different: They are placed next to each other on a single line
532 (fixed height).
533
534 ==== Dock area layout
535
536 This is a special case. Users cannot chose the dock area layout, but it will be
537 set for the dock area containers. In the dockarea layout (at the moment!),
538 windows will be placed above each other.
539
540 === Rendering a window
541
542 A window’s size and position will be determined in the following way:
543
544 1. Subtract the border if border style is not "none" (but "normal" or "1pixel").
545 2. Subtract the X11 border, if the window has an X11 border > 0.
546 3. Obey the aspect ratio of the window (think MPlayer).
547 4. Obey the height- and width-increments of the window (think terminal emulator
548    which can only be resized in one-line or one-character steps).
549
550 == Pushing updates to X11 / Drawing
551
552 A big problem with i3 before version 4 was that we just sent requests to X11
553 anywhere in the source code. This was bad because nobody could understand the
554 entirety of our interaction with X11, it lead to subtle bugs and a lot of edge
555 cases which we had to consider all over again.
556
557 Therefore, since version 4, we have a single file, +src/x.c+, which is
558 responsible for repeatedly transferring parts of our tree datastructure to X11.
559
560 +src/x.c+ consists of multiple parts:
561
562 1. The state pushing: +x_push_changes()+, which calls +x_push_node()+.
563 2. State modification functions: +x_con_init+, +x_reinit+,
564    +x_reparent_child+, +x_move_win+, +x_con_kill+, +x_raise_con+, +x_set_name+
565    and +x_set_warp_to+.
566 3. Expose event handling (drawing decorations): +x_deco_recurse()+ and
567    +x_draw_decoration()+.
568
569 === Pushing state to X11
570
571 In general, the function +x_push_changes+ should be called to push state
572 changes. Only when the scope of the state change is clearly defined (for
573 example only the title of a window) and its impact is known beforehand, one can
574 optimize this and call +x_push_node+ on the appropriate con directly.
575
576 +x_push_changes+ works in the following steps:
577
578 1. Clear the eventmask for all mapped windows. This leads to not getting
579    useless ConfigureNotify or EnterNotify events which are caused by our
580    requests. In general, we only want to handle user input.
581 2. Stack windows above each other, in reverse stack order (starting with the
582    most obscured/bottom window). This is relevant for floating windows which
583    can overlap each other, but also for tiling windows in stacked or tabbed
584    containers. We also update the +_NET_CLIENT_LIST_STACKING+ hint which is
585    necessary for tab drag and drop in Chromium.
586 3. +x_push_node+ will be called for the root container, recursively calling
587    itself for the container’s children. This function actually pushes the
588    state, see the next paragraph.
589 4. If the pointer needs to be warped to a different position (for example when
590    changing focus to a differnt output), it will be warped now.
591 5. The eventmask is restored for all mapped windows.
592 6. Window decorations will be rendered by calling +x_deco_recurse+ on the root
593    container, which then recursively calls itself for the children.
594 7. If the input focus needs to be changed (because the user focused a different
595    window), it will be updated now.
596 8. +x_push_node_unmaps+ will be called for the root container. This function
597    only pushes UnmapWindow requests. Separating the state pushing is necessary
598    to handle fullscreen windows (and workspace switches) in a smooth fashion:
599    The newly visible windows should be visible before the old windows are
600    unmapped.
601
602 +x_push_node+ works in the following steps:
603
604 1. Update the window’s +WM_NAME+, if changed (the +WM_NAME+ is set on i3
605    containers mainly for debugging purposes).
606 2. Reparents a child window into the i3 container if the container was created
607    for a specific managed window.
608 3. If the size/position of the i3 container changed (due to opening a new
609    window or switching layouts for example), the window will be reconfigured.
610    Also, the pixmap which is used to draw the window decoration/border on is
611    reconfigured (pixmaps are size-dependent).
612 4. Size/position for the child window is adjusted.
613 5. The i3 container is mapped if it should be visible and was not yet mapped.
614    When mapping, +WM_STATE+ is set to +WM_STATE_NORMAL+. Also, the eventmask of
615    the child window is updated and the i3 container’s contents are copied from
616    the pixmap.
617 6. +x_push_node+ is called recursively for all children of the current
618    container.
619
620 +x_push_node_unmaps+ handles the remaining case of an i3 container being
621 unmapped if it should not be visible anymore. +WM_STATE+ will be set to
622 +WM_STATE_WITHDRAWN+.
623
624
625 === Drawing window decorations/borders/backgrounds
626
627 +x_draw_decoration+ draws window decorations. It is run for every leaf
628 container (representing an actual X11 window) and for every non-leaf container
629 which is in a stacked/tabbed container (because stacked/tabbed containers
630 display a window decoration for split containers, which at the moment just says
631 "another container").
632
633 Then, parameters are collected to be able to determine whether this decoration
634 drawing is actually necessary or was already done. This saves a substantial
635 number of redraws (depending on your workload, but far over 50%).
636
637 Assuming that we need to draw this decoration, we start by filling the empty
638 space around the child window (think of MPlayer with a specific aspect ratio)
639 in the user-configured client background color.
640
641 Afterwards, we draw the appropriate border (in case of border styles "normal"
642 and "1pixel") and the top bar (in case of border style "normal").
643
644 The last step is drawing the window title on the top bar.
645
646
647 /////////////////////////////////////////////////////////////////////////////////
648
649 == Resizing containers
650
651 By clicking and dragging the border of a container, you can resize the whole
652 column (respectively row) which this container is in. This is necessary to keep
653 the table layout working and consistent.
654
655 The resizing works similarly to the resizing of floating windows or movement of
656 floating windows:
657
658 * A new, invisible window with the size of the root window is created
659   (+grabwin+)
660 * Another window, 2px width and as high as your screen (or vice versa for
661   horizontal resizing) is created. Its background color is the border color and
662   it is only there to inform the user how big the container will be (it
663   creates the impression of dragging the border out of the container).
664 * The +drag_pointer+ function of +src/floating.c+ is called to grab the pointer
665   and enter its own event loop which will pass all events (expose events) but
666   motion notify events. This function then calls the specified callback
667   (+resize_callback+) which does some boundary checking and moves the helper
668   window. As soon as the mouse button is released, this loop will be
669   terminated.
670 * The new width_factor for each involved column (respectively row) will be
671   calculated.
672
673 /////////////////////////////////////////////////////////////////////////////////
674
675 == User commands (parser-specs/commands.spec)
676
677 In the configuration file and when using i3 interactively (with +i3-msg+, for
678 example), you use commands to make i3 do things, like focus a different window,
679 set a window to fullscreen, and so on. An example command is +floating enable+,
680 which enables floating mode for the currently focused window. See the
681 appropriate section in the link:userguide.html[User’s Guide] for a reference of
682 all commands.
683
684 In earlier versions of i3, interpreting these commands was done using lex and
685 yacc, but experience has shown that lex and yacc are not well suited for our
686 command language. Therefore, starting from version 4.2, we use a custom parser
687 for user commands (not yet for the configuration file).
688 The input specification for this parser can be found in the file
689 +parser-specs/commands.spec+. Should you happen to use Vim as an editor, use
690 :source parser-specs/highlighting.vim to get syntax highlighting for this file
691 (highlighting files for other editors are welcome).
692
693 .Excerpt from commands.spec
694 -----------------------------------------------------------------------
695 state INITIAL:
696   '[' -> call cmd_criteria_init(); CRITERIA
697   'move' -> MOVE
698   'exec' -> EXEC
699   'workspace' -> WORKSPACE
700   'exit' -> call cmd_exit()
701   'restart' -> call cmd_restart()
702   'reload' -> call cmd_reload()
703 -----------------------------------------------------------------------
704
705 The input specification is written in an extremely simple format. The
706 specification is then converted into C code by the Perl script
707 generate-commands-parser.pl (the output file names begin with GENERATED and the
708 files are stored in the +include+ directory). The parser implementation
709 +src/commands_parser.c+ includes the generated C code at compile-time.
710
711 The above excerpt from commands.spec illustrates nearly all features of our
712 specification format: You describe different states and what can happen within
713 each state. State names are all-caps; the state in the above excerpt is called
714 INITIAL. A list of tokens and their actions (separated by an ASCII arrow)
715 follows. In the excerpt, all tokens are literals, that is, simple text strings
716 which will be compared with the input. An action is either the name of a state
717 in which the parser will transition into, or the keyword 'call', followed by
718 the name of a function (and optionally a state).
719
720 === Example: The WORKSPACE state
721
722 Let’s have a look at the WORKSPACE state, which is a good example of all
723 features. This is its definition:
724
725 .WORKSPACE state (commands.spec)
726 ----------------------------------------------------------------
727 # workspace next|prev|next_on_output|prev_on_output
728 # workspace back_and_forth
729 # workspace <name>
730 state WORKSPACE:
731   direction = 'next_on_output', 'prev_on_output', 'next', 'prev'
732       -> call cmd_workspace($direction)
733   'back_and_forth'
734       -> call cmd_workspace_back_and_forth()
735   workspace = string
736       -> call cmd_workspace_name($workspace)
737 ----------------------------------------------------------------
738
739 As you can see from the commands, there are multiple different valid variants
740 of the workspace command:
741
742 workspace <direction>::
743         The word 'workspace' can be followed by any of the tokens 'next',
744         'prev', 'next_on_output' or 'prev_on_output'. This command will
745         switch to the next or previous workspace (optionally on the same
746         output). +
747         There is one function called +cmd_workspace+, which is defined
748         in +src/commands.c+. It will handle this kind of command. To know which
749         direction was specified, the direction token is stored on the stack
750         with the name "direction", which is what the "direction = " means in
751         the beginning. +
752
753 NOTE: Note that you can specify multiple literals in the same line. This has
754         exactly the same effect as if you specified `direction =
755         'next_on_output' -> call cmd_workspace($direction)` and so forth. +
756
757 NOTE: Also note that the order of literals is important here: If 'next' were
758         ordered before 'next_on_output', then 'next_on_output' would never
759         match.
760
761 workspace back_and_forth::
762         This is a very simple case: When the literal 'back_and_forth' is found
763         in the input, the function +cmd_workspace_back_and_forth+ will be
764         called without parameters and the parser will return to the INITIAL
765         state (since no other state was specified).
766 workspace <name>::
767         In this case, the workspace command is followed by an arbitrary string,
768         possibly in quotes, for example "workspace 3" or "workspace bleh". +
769         This is the first time that the token is actually not a literal (not in
770         single quotes), but just called string. Other possible tokens are word
771         (the same as string, but stops matching at a whitespace) and end
772         (matches the end of the input).
773
774 === Introducing a new command
775
776 The following steps have to be taken in order to properly introduce a new
777 command (or possibly extend an existing command):
778
779 1. Define a function beginning with +cmd_+ in the file +src/commands.c+. Copy
780    the prototype of an existing function.
781 2. After adding a comment on what the function does, copy the comment and
782    function definition to +include/commands.h+. Make the comment in the header
783    file use double asterisks to make doxygen pick it up.
784 3. Write a test case (or extend an existing test case) for your feature, see
785    link:testsuite.html[i3 testsuite]. For now, it is sufficient to simply call
786    your command in all the various possible ways.
787 4. Extend the parser specification in +parser-specs/commands.spec+. Run the
788    testsuite and see if your new function gets called with the appropriate
789    arguments for the appropriate input.
790 5. Actually implement the feature.
791 6. Document the feature in the link:userguide.html[User’s Guide].
792
793 == Moving containers
794
795 The movement code is pretty delicate. You need to consider all cases before
796 making any changes or before being able to fully understand how it works.
797
798 === Case 1: Moving inside the same container
799
800 The reference layout for this case is a single workspace in horizontal
801 orientation with two containers on it. Focus is on the left container (1).
802
803
804 [width="15%",cols="^,^"]
805 |========
806 | 1 | 2
807 |========
808
809 When moving the left window to the right (command +move right+), tree_move will
810 look for a container with horizontal orientation and finds the parent of the
811 left container, that is, the workspace. Afterwards, it runs the code branch
812 commented with "the easy case": it calls TAILQ_NEXT to get the container right
813 of the current one and swaps both containers.
814
815 === Case 2: Move a container into a split container
816
817 The reference layout for this case is a horizontal workspace with two
818 containers. The right container is a v-split with two containers. Focus is on
819 the left container (1).
820
821 [width="15%",cols="^,^"]
822 |========
823 1.2+^.^| 1 | 2
824 | 3
825 |========
826
827 When moving to the right (command +move right+), i3 will work like in case 1
828 ("the easy case"). However, as the right container is not a leaf container, but
829 a v-split, the left container (1) will be inserted at the right position (below
830 2, assuming that 2 is focused inside the v-split) by calling +insert_con_into+.
831
832 +insert_con_into+ detaches the container from its parent and inserts it
833 before/after the given target container. Afterwards, the on_remove_child
834 callback is called on the old parent container which will then be closed, if
835 empty.
836
837 Afterwards, +con_focus+ will be called to fix the focus stack and the tree will
838 be flattened.
839
840 === Case 3: Moving to non-existant top/bottom
841
842 Like in case 1, the reference layout for this case is a single workspace in
843 horizontal orientation with two containers on it. Focus is on the left
844 container:
845
846 [width="15%",cols="^,^"]
847 |========
848 | 1 | 2
849 |========
850
851 This time however, the command is +move up+ or +move down+. tree_move will look
852 for a container with vertical orientation. As it will not find any,
853 +same_orientation+ is NULL and therefore i3 will perform a forced orientation
854 change on the workspace by creating a new h-split container, moving the
855 workspace contents into it and then changing the workspace orientation to
856 vertical. Now it will again search for parent containers with vertical
857 orientation and it will find the workspace.
858
859 This time, the easy case code path will not be run as we are not moving inside
860 the same container. Instead, +insert_con_into+ will be called with the focused
861 container and the container above/below the current one (on the level of
862 +same_orientation+).
863
864 Now, +con_focus+ will be called to fix the focus stack and the tree will be
865 flattened.
866
867 === Case 4: Moving to existant top/bottom
868
869 The reference layout for this case is a vertical workspace with two containers.
870 The bottom one is a h-split containing two containers (1 and 2). Focus is on
871 the bottom left container (1).
872
873 [width="15%",cols="^,^"]
874 |========
875 2+| 3
876 | 1 | 2
877 |========
878
879 This case is very much like case 3, only this time the forced workspace
880 orientation change does not need to be performed because the workspace already
881 is in vertical orientation.
882
883 === Case 5: Moving in one-child h-split
884
885 The reference layout for this case is a horizontal workspace with two
886 containers having a v-split on the left side with a one-child h-split on the
887 bottom. Focus is on the bottom left container (2(h)):
888
889 [width="15%",cols="^,^"]
890 |========
891 | 1 1.2+^.^| 3
892 | 2(h)
893 |========
894
895 In this case, +same_orientation+ will be set to the h-split container around
896 the focused container. However, when trying the easy case, the next/previous
897 container +swap+ will be NULL. Therefore, i3 will search again for a
898 +same_orientation+ container, this time starting from the parent of the h-split
899 container.
900
901 After determining a new +same_orientation+ container (if it is NULL, the
902 orientation will be force-changed), this case is equivalent to case 2 or case
903 4.
904
905
906 === Case 6: Floating containers
907
908 The reference layout for this case is a horizontal workspace with two
909 containers plus one floating h-split container. Focus is on the floating
910 container.
911
912 TODO: nice illustration. table not possible?
913
914 When moving up/down, the container needs to leave the floating container and it
915 needs to be placed on the workspace (at workspace level). This is accomplished
916 by calling the function +attach_to_workspace+.
917
918 == Click handling
919
920 Without much ado, here is the list of cases which need to be considered:
921
922 * click to focus (tiling + floating) and raise (floating)
923 * click to focus/raise when in stacked/tabbed mode
924 * floating_modifier + left mouse button to drag a floating con
925 * floating_modifier + right mouse button to resize a floating con
926 * click on decoration in a floating con to either initiate a resize (if there
927   is more than one child in the floating con) or to drag the
928   floating con (if it’s the one at the top).
929 * click on border in a floating con to resize the floating con
930 * floating_modifier + right mouse button to resize a tiling con
931 * click on border/decoration to resize a tiling con
932
933 == Gotchas
934
935 * Forgetting to call `xcb_flush(conn);` after sending a request. This usually
936   leads to code which looks like it works fine but which does not work under
937   certain conditions.
938
939 * Forgetting to call `floating_fix_coordinates(con, old_rect, new_rect)` after
940   moving workspaces across outputs. Coordinates for floating containers are
941   not relative to workspace boundaries, so you must correct their coordinates
942   or those containers will show up in the wrong workspace or not at all.
943
944 == Using git / sending patches
945
946 For a short introduction into using git, see
947 http://www.spheredev.org/wiki/Git_for_the_lazy or, for more documentation, see
948 http://git-scm.com/documentation
949
950 When you want to send a patch because you fixed a bug or implemented a cool
951 feature (please talk to us before working on features to see whether they are
952 maybe already implemented, not possible for some some reason, or don’t fit
953 into the concept), please use git to create a patchfile.
954
955 First of all, update your working copy to the latest version of the master
956 branch:
957
958 --------
959 git pull
960 --------
961
962 Afterwards, make the necessary changes for your bugfix/feature. Then, review
963 the changes using +git diff+ (you might want to enable colors in the diff using
964 +git config diff.color auto+).  When you are definitely done, use +git commit
965 -a+ to commit all changes you’ve made.
966
967 Then, use the following command to generate a patchfile which we can directly
968 apply to the branch, preserving your commit message and name:
969
970 -----------------------
971 git format-patch origin
972 -----------------------
973
974 Just send us the generated file via email.
975
976 == Thought experiments
977
978 In this section, we collect thought experiments, so that we don’t forget our
979 thoughts about specific topics. They are not necessary to get into hacking i3,
980 but if you are interested in one of the topics they cover, you should read them
981 before asking us why things are the way they are or why we don’t implement
982 things.
983
984 === Using cgroups per workspace
985
986 cgroups (control groups) are a linux-only feature which provides the ability to
987 group multiple processes. For each group, you can individually set resource
988 limits, like allowed memory usage. Furthermore, and more importantly for our
989 purposes, they serve as a namespace, a label which you can attach to processes
990 and their children.
991
992 One interesting use for cgroups is having one cgroup per workspace (or
993 container, doesn’t really matter). That way, you could set different priorities
994 and have a workspace for important stuff (say, writing a LaTeX document or
995 programming) and a workspace for unimportant background stuff (say,
996 JDownloader). Both tasks can obviously consume a lot of I/O resources, but in
997 this example it doesn’t really matter if JDownloader unpacks the download a
998 minute earlier or not. However, your compiler should work as fast as possible.
999 Having one cgroup per workspace, you would assign more resources to the
1000 programming workspace.
1001
1002 Another interesting feature is that an inherent problem of the workspace
1003 concept could be solved by using cgroups: When starting an application on
1004 workspace 1, then switching to workspace 2, you will get the application’s
1005 window(s) on workspace 2 instead of the one you started it on. This is because
1006 the window manager does not have any mapping between the process it starts (or
1007 gets started in any way) and the window(s) which appear.
1008
1009 Imagine for example using dmenu: The user starts dmenu by pressing Mod+d, dmenu
1010 gets started with PID 3390. The user then decides to launch Firefox, which
1011 takes a long time. So he enters firefox into dmenu and presses enter. Firefox
1012 gets started with PID 4001. When it finally finishes loading, it creates an X11
1013 window and uses MapWindow to make it visible. This is the first time i3
1014 actually gets in touch with Firefox. It decides to map the window, but it has
1015 no way of knowing that this window (even though it has the _NET_WM_PID property
1016 set to 4001) belongs to the dmenu the user started before.
1017
1018 How do cgroups help with this? Well, when pressing Mod+d to launch dmenu, i3
1019 would create a new cgroup, let’s call it i3-3390-1. It launches dmenu in that
1020 cgroup, which gets PID 3390. As before, the user enters firefox and Firefox
1021 gets launched with PID 4001. This time, though, the Firefox process with PID
1022 4001 is *also* member of the cgroup i3-3390-1 (because fork()ing in a cgroup
1023 retains the cgroup property). Therefore, when mapping the window, i3 can look
1024 up in which cgroup the process is and can establish a mapping between the
1025 workspace and the window.
1026
1027 There are multiple problems with this approach:
1028
1029 . Every application has to properly set +_NET_WM_PID+. This is acceptable and
1030   patches can be written for the few applications which don’t set the hint yet.
1031 . It does only work on Linux, since cgroups are a Linux-only feature. Again,
1032   this is acceptable.
1033 . The main problem is that some applications create X11 windows completely
1034   independent of UNIX processes. An example for this is Chromium (or
1035   gnome-terminal), which, when being started a second time, communicates with
1036   the first process and lets the first process open a new window. Therefore, if
1037   you have a Chromium window on workspace 2 and you are currently working on
1038   workspace 3, starting +chromium+ does not lead to the desired result (the
1039   window will open on workspace 2).
1040
1041 Therefore, my conclusion is that the only proper way of fixing the "window gets
1042 opened on the wrong workspace" problem is in the application itself. Most
1043 modern applications support freedesktop startup-notifications  which can be
1044 used for this.