]> git.sur5r.net Git - i3/i3/blob - docs/testsuite
Merge branch 'master' into next
[i3/i3] / docs / testsuite
1 i3 testsuite
2 ============
3 Michael Stapelberg <michael+i3@stapelberg.de>
4 September 2011
5
6 This document explains how the i3 testsuite works, how to use it and extend it.
7 It is targeted at developers who not necessarily have been doing testing before
8 or have not been testing in Perl before. In general, the testsuite is not of
9 interest for end users.
10
11
12 == Introduction
13
14 The i3 testsuite is a collection of files which contain testcases for various
15 i3 features. Some of them test if a certain workflow works correctly (moving
16 windows, focus behaviour, …). Others are regression tests and contain code
17 which previously made i3 crash or lead to unexpected behaviour. They then check
18 if i3 still runs (meaning it did not crash) and if it handled everything
19 correctly.
20
21 The goal of having these tests is to automatically find problems and to
22 automatically get a feel for whether a change in the source code breaks any
23 existing feature. After every modification of the i3 sourcecode, the developer
24 should run the full testsuite. If one of the tests fails, the corresponding
25 problem should be fixed (or, in some cases, the testcase has to be modified).
26 For every bugreport, a testcase should be written to test the correct
27 behaviour. Initially, it will fail, but after fixing the bug, it will pass.
28 This ensures (or increases the chance) that bugs which have been fixed once
29 will never be found again.
30
31 Also, when implementing a new feature, a testcase might be a good way to be
32 able to easily test if the feature is working correctly. Many developers will
33 test manually if everything works. Having a testcase not only helps you with
34 that, but it will also be useful for every future change.
35
36 == Implementation
37
38 For several reasons, the i3 testsuite has been implemented in Perl:
39
40 1. Perl has a long tradition of testing. Every popular/bigger Perl module which
41    you can find on CPAN will not only come with documentation, but also with
42    tests. Therefore, the available infrastructure for tests is comprehensive.
43    See for example the excellent http://search.cpan.org/perldoc?Test::More
44    and the referenced http://search.cpan.org/perldoc?Test::Tutorial.
45
46 2. Perl is widely available and has a well-working package infrastructure.
47 3. The author is familiar with Perl :).
48
49 Please do not start programming language flamewars at this point.
50
51 === Mechanisms
52
53 ==== Script: complete-run
54
55 The testcases are run by a script called +complete-run.pl+. It runs all
56 testcases by default, but you can be more specific and let it only run one or
57 more testcases. Also, it takes care of starting up a separate instance of i3
58 with an appropriate configuration file and creates a folder for each run
59 containing the appropriate i3 logfile for each testcase.  The latest folder can
60 always be found under the symlink +latest/+. It is recommended that you run the
61 tests on one or more separate X server instances (you can only start one window
62 manager per X session), for example using the provided Xdummy script.
63 +complete-run.pl+ takes one or more X11 display specifications and parallelizes
64 the testcases appropriately:
65
66 .Example invocation of complete-run.pl+
67 ---------------------------------------
68 $ cd ~/i3/testcases
69
70 # start two dummy X11 instances in the background
71 $ ./Xdummy :1 &
72 $ ./Xdummy :2 &
73
74 $ ./complete-run.pl -d :1,:2
75 # output omitted because it is very long
76 All tests successful.
77 Files=78, Tests=734, 27 wallclock secs ( 0.38 usr  0.48 sys + 17.65 cusr  3.21 csys = 21.72 CPU)
78 Result: PASS
79
80 $ ./complete-run.pl -d :1 t/04-floating.t
81 [:3] i3 startup: took 0.07s, status = 1
82 [:3] Running t/04-floating.t with logfile testsuite-2011-09-24-16-06-04-4.0.2-226-g1eb011a/i3-log-for-04-floating.t
83 [:3] t/04-floating.t finished
84 [:3] killing i3
85 output for t/04-floating.t:
86 ok 1 - use X11::XCB::Window;
87 ok 2 - The object isa X11::XCB::Window
88 ok 3 - Window is mapped
89 ok 4 - i3 raised the width to 75
90 ok 5 - i3 raised the height to 50
91 ok 6 - i3 did not map it to (0x0)
92 ok 7 - The object isa X11::XCB::Window
93 ok 8 - i3 let the width at 80
94 ok 9 - i3 let the height at 90
95 ok 10 - i3 mapped it to x=1
96 ok 11 - i3 mapped it to y=18
97 ok 12 - The object isa X11::XCB::Window
98 ok 13 - i3 let the width at 80
99 ok 14 - i3 let the height at 90
100 1..14
101
102 All tests successful.
103 Files=1, Tests=14,  0 wallclock secs ( 0.01 usr  0.00 sys +  0.19 cusr  0.03 csys =  0.23 CPU)
104 Result: PASS
105
106 $ less latest/i3-log-for-04-floating.t
107 ----------------------------------------
108
109 ==== IPC interface
110
111 The testsuite makes extensive use of the IPC (Inter-Process Communication)
112 interface which i3 provides. It is used for the startup process of i3, for
113 terminating it cleanly and (most importantly) for modifying and getting the
114 current state (layout tree).
115
116 See [http://i3wm.org/docs/ipc.html] for documentation on the IPC interface.
117
118 ==== X11::XCB
119
120 In order to open new windows, change attributes, get events, etc., the
121 testsuite uses X11::XCB, a new (and quite specific to i3 at the moment) Perl
122 module which uses the XCB protocol description to generate Perl bindings to
123 X11. They work in a very similar way to libxcb (which i3 uses) and provide
124 relatively high-level interfaces (objects such as +X11::XCB::Window+) aswell as
125 access to the low-level interface, which is very useful when testing a window
126 manager.
127
128 === Filesystem structure
129
130 In the git root of i3, the testcases live in the folder +testcases+. This
131 folder contains the +complete-run.pl+ and +Xdummy+ scripts and a base
132 configuration file which will be used for the tests. The different testcases
133 (their file extension is .t, not .pl) themselves can be found in the
134 conventionally named subfolder +t+:
135
136 .Filesystem structure
137 --------------------------------------------
138 ├── testcases
139 │   ├── complete-run.pl
140 │   ├── i3-test.config
141 │   ├── t
142 │   │   ├── 00-load.t
143 │   │   ├── 01-tile.t
144 │   │   ├── 02-fullscreen.t
145 │   │   ├── ...
146 │   │   ├── omitted for brevity
147 │   │   ├── ...
148 │   │   ├── 74-regress-focus-toggle.t
149 │   │   └── lib
150 │   │       └── i3test.pm
151 │   └── Xdummy
152 --------------------------------------------
153
154 == Anatomy of a testcase
155
156 Learning by example is definitely a good strategy when you are wondering how to
157 write a testcase. Let's take +t/11-goto.t+ as an easy example and go through it
158 step by step:
159
160 .t/11-goto.t: Boilerplate
161 ----------------------
162 #!perl
163 # vim:ts=4:sw=4:expandtab
164
165 use i3test;
166 use File::Temp;
167
168 my $x = X11::XCB::Connection->new;
169 -----------------------
170
171 This is what we call boilerplate. It exists at the top of every test file (to
172 some extent). The first line is the shebang, which specifies that this file is
173 a Perl script. The second line contains VIM specific settings on how to
174 edit/format this file (use spaces instead of tabs, indent using 4 spaces).
175 Afterwards, the +i3test+ module is used. This module contains i3 testsuite
176 specific functions which you are strongly encouraged to use. They make writing
177 testcases a lot easier and will make it easier for other people to read your
178 tests.
179
180 The next line uses the +File::Temp+ module. This is specific to this testcase,
181 because it needs to generate a temporary name during the test. Many testcases
182 use only the +i3test+ module.
183
184 The last line opens a connection to X11. You might or might not need this in
185 your testcase, depending on whether you are going to open windows (etc.) or
186 only use i3 commands.
187
188 .t/11-goto.t: Setup
189 ----------------------
190 my $tmp = fresh_workspace;
191
192 cmd 'split h';
193 ----------------------
194
195 The first line calls i3test's +fresh_workspace+ function which looks for a
196 currently unused workspace, switches to it, and returns its name. The variable
197 +$tmp+ will end up having a value such as +"/tmp/87kBVcHbA9"+. Note that this
198 is not (necessarily) a valid path, it's just a random workspace name.
199
200 So, now that we are on a new workspace, we ensure that the workspace uses
201 horizontal orientation by issuing the +split h+ command (see the i3 User's
202 Guide for a list of commands). This is not strictly necessary, but good style.
203 In general, the +cmd+ function executes the specified i3 command by using the
204 IPC interface and returns once i3 acknowledged the command.
205
206 .t/11-goto.t: Setup
207 ----------------------
208 #####################################################################
209 # Create two windows and make sure focus switching works
210 #####################################################################
211
212 my $top = open_window($x);
213 my $mid = open_window($x);
214 my $bottom = open_window($x);
215 ----------------------
216
217 In every major section of a testcase, you should put a comment like the one
218 above. This makes it immediately clear how the file is structured.
219
220 The +open_window+ function opens a standard window, which will then be put into
221 tiling mode by i3. If you want a floating window, use the
222 +open_floating_window+ function. These functions accept the same parameters as
223 +X11::XCB::Window->new+, see the i3test documentation at TODO.
224
225 .t/11-goto.t: Helper function
226 ----------------------
227 #
228 # Returns the input focus after sending the given command to i3 via IPC
229 # and syncing with i3
230 #
231 sub focus_after {
232     my $msg = shift;
233
234     cmd $msg;
235     sync_with_i3 $x;
236     return $x->input_focus;
237 }
238 ----------------------
239
240 This section defines a helper function which will be used over and over in this
241 testcase. If you have code which gets executed more than once or twice
242 (depending on the length of your test, use your best judgement), please put it
243 in a function. Tests should be short, concise and clear.
244
245 The +focus_after+ function executes a command and returns the X11 focus after
246 the command was executed. The +sync_with_i3+ command makes sure that i3 could
247 push its state to X11. See <<i3_sync>> to learn how this works exactly.
248
249 .t/11-goto.t: Test assumptions
250 ----------------------
251 $focus = $x->input_focus;
252 is($focus, $bottom->id, "Latest window focused");
253
254 $focus = focus_after('focus left');
255 is($focus, $mid->id, "Middle window focused");
256 ----------------------
257
258 Now, we run the first two real tests. They use +Test::More+'s +is+ function,
259 which compares two values and prints the differences if they are not the same.
260 After the arguments, we supply a short comment to indicate what we are testing
261 here. This makes it vastly more easy for the developer to spot which testcase
262 is the problem in case one fails.
263
264 The first test checks that the most recently opened window is focused.
265 Afterwards, the command +focus left+ is issued and it is verified that the
266 middle window now has focus.
267
268 Note that this is not a comprehensive test of the +focus+ command -- we would
269 have to test wrapping, focus when using a more complex layout, focusing the
270 parent/child containers, etc. But that is not the point of this testcase.
271 Instead, we just want to know if +$x->input_focus+ corresponds with what we are
272 expecting. If not, something is completely wrong with the test environment and
273 this trivial test will fail.
274
275 .t/11-goto.t: Test that the feature does not work (yet)
276 ----------------------
277 #####################################################################
278 # Now goto a mark which does not exist
279 #####################################################################
280
281 my $random_mark = mktemp('mark.XXXXXX');
282
283 $focus = focus_after(qq|[con_mark="$random_mark"] focus|);
284 is($focus, $mid->id, "focus unchanged");
285 ----------------------
286
287 Syntax hint: The qq keyword is the interpolating quote operator. It lets you
288 chose a quote character (in this case the +|+ character, a pipe). This makes
289 having double quotes in our string easy.
290
291 In this new major section, a random mark (mark is an identifier for a window,
292 see "VIM-like marks" in the i3 User’s Guide) will be generated. Afterwards, we
293 test that trying to focus that mark will not do anything. This is important: Do
294 not only test that using a feature has the expected outcome, but also test that
295 using it without properly initializing it does no harm. This command could for
296 example have changed focus anyways (a bug) or crash i3 (obviously a bug).
297
298 .t/11-goto.t: Test that the feature does work
299 ----------------------
300 cmd "mark $random_mark";
301
302 $focus = focus_after('focus left');
303 is($focus, $top->id, "Top window focused");
304
305 $focus = focus_after(qq|[con_mark="$random_mark"] focus|);
306 is($focus, $mid->id, "goto worked");
307 ----------------------
308
309 Remember: Focus was on the middle window (we verified that earlier in "Test
310 assumptions"). We now mark the middle window with our randomly generated mark.
311 Afterwards, we switch focus away from the middle window to be able to tell if
312 focusing it via its mark will work. If the test works, the goto command seems
313 to be working.
314
315 .t/11-goto.t: Test corner case
316 ----------------------
317 # check that we can specify multiple criteria
318
319 $focus = focus_after('focus left');
320 is($focus, $top->id, "Top window focused");
321
322 $focus = focus_after(qq|[con_mark="$random_mark" con_mark="$random_mark"] focus|);
323 is($focus, $mid->id, "goto worked");
324 ----------------------
325
326 Now we test the same feature, but specifying the mark twice in the command.
327 This should have no effect, but let’s be sure: test it and see if things go
328 wrong.
329
330 .t/11-goto.t: Test second code path
331 ----------------------
332 #####################################################################
333 # Check whether the focus command will switch to a different
334 # workspace if necessary
335 #####################################################################
336
337 my $tmp2 = fresh_workspace;
338
339 is(focused_ws(), $tmp2, 'tmp2 now focused');
340
341 cmd qq|[con_mark="$random_mark"] focus|;
342
343 is(focused_ws(), $tmp, 'tmp now focused');
344 ----------------------
345
346 This part of the test checks that focusing windows by mark works across
347 workspaces. It uses i3test's +focused_ws+ function to get the current
348 workspace.
349
350 .t/11-goto.t: Test second code path
351 ----------------------
352 done_testing;
353 ----------------------
354
355 The end of every testcase has to contain the +done_testing+ line. This tells
356 +complete-run.pl+ that the test was finished successfully. If it does not
357 occur, the test might have crashed during execution -- some of the reasons why
358 that could happen are bugs in the used modules, bugs in the testcase itself or
359 an i3 crash resulting in the testcase being unable to communicate with i3 via
360 IPC anymore.
361
362 [[i3_sync]]
363 == Appendix A: The i3 sync protocol
364
365 Consider the following situation: You open two windows in your testcase, then
366 you use +focus left+ and want to verify that the X11 focus has been updated
367 properly. Sounds simple, right? Let’s assume you use this straight-forward
368 implementation:
369
370 .Racey focus testcase
371 -----------
372 my $left = open_window($x);
373 my $right = open_window($x);
374 cmd 'focus left';
375 is($x->input_focus, $left->id, 'left window focused');
376 ----------
377
378 However, the test fails. Sometimes. Apparantly, there is a race condition in
379 your test. If you think about it, this is because you are using two different
380 pieces of software: You tell i3 to update focus, i3 confirms that, and then you
381 ask X11 to give you the current focus. There is a certain time i3 needs to
382 update the X11 state. If the testcase gets CPU time before X11 processed i3's
383 requests, the test will fail.
384
385 image::i3-sync.png["Diagram of the race condition", title="Diagram of the race condition"]
386
387 One way to "solve" this would be to add +sleep 0.5;+ after the +cmd+ call.
388 After 0.5 seconds it should be safe to assume that focus has been updated,
389 right?
390
391 In practice, this usually works. However, it has several problems:
392
393 1. This is obviously not a clean solution, but a workaround. Ugly.
394 2. On very slow machines, this might not work. Unlikely, but in different
395    situations (a delay to wait for i3 to startup) the necessary time is much
396    harder to guess, even for fast machines.
397 3. This *wastes a lot of time*. Usually, your computer is much faster than 0.5s
398    to update the status. However, sometimes, it might take 0.4s, so we can’t
399    make it +sleep 0.1+.
400
401 To illustrate how grave the problem with wasting time actually is: Before
402 removing all sleeps from the testsuite, a typical run using 4 separate X
403 servers took around 50 seconds on my machine. After removing all the sleeps,
404 we achieved times of about 25 seconds. This is very significant and influences
405 the way you think about tests -- the faster they are, the more likely you are
406 to check whether everything still works quite often (which you should).
407
408 What I am trying to say is: Delays adds up quickly and make the test suite
409 less robust.
410
411 The real solution for this problem is a mechanism which I call "the i3 sync
412 protocol". The idea is to send a request (which does not modify state) via X11
413 to i3 which will then be answered. Due to the request's position in the event
414 queue (*after* all previous events), you can be sure that by the time you
415 receive the reply, all other events have been dealt with by i3 (and, more
416 importantly, X11).
417
418 image::i3-sync-working.png["Diagram of the i3 sync solution", title="Diagram of the i3 sync solution"]
419
420 === Implementation details
421
422 The client which wants to sync with i3 initiates the protocol by sending a
423 ClientMessage to the X11 root window:
424
425 .Send ClientMessage
426 -------------------
427 # Generate a ClientMessage, see xcb_client_message_t
428 my $msg = pack "CCSLLLLLLL",
429     CLIENT_MESSAGE, # response_type
430     32,     # format
431     0,      # sequence
432     $root,  # destination window
433     $x->atom(name => 'I3_SYNC')->id,
434
435     $_sync_window->id,    # data[0]: our own window id
436     $myrnd, # data[1]: a random value to identify the request
437     0,
438     0,
439     0;
440
441 # Send it to the root window -- since i3 uses the SubstructureRedirect
442 # event mask, it will get the ClientMessage.
443 $x->send_event(0, $root, EVENT_MASK_SUBSTRUCTURE_REDIRECT, $msg);
444 -------------------
445
446 i3 will then reply with the same ClientMessage, sent to the window specified in
447 +data[0]+. In the reply, +data[0]+ and +data[1]+ are exactly the same as in the
448 request. You should use a random value in +data[1]+ and check that you received
449 the same one when getting the reply.
450
451 == Appendix B: Socket activation