]> git.sur5r.net Git - i3/i3/blob - docs/testsuite
docs/testsuite: add pointers to additional docs
[i3/i3] / docs / testsuite
1 i3 testsuite
2 ============
3 Michael Stapelberg <michael@i3wm.org>
4 September 2012
5
6 This document explains how the i3 testsuite works, how to use it and extend it.
7 It is targeted at developers who not necessarily have been doing testing before
8 or have not been testing in Perl before. In general, the testsuite is not of
9 interest for end users.
10
11
12 == Introduction
13
14 The i3 testsuite is a collection of files which contain testcases for various
15 i3 features. Some of them test if a certain workflow works correctly (moving
16 windows, focus behaviour, …). Others are regression tests and contain code
17 which previously made i3 crash or lead to unexpected behaviour. They then check
18 if i3 still runs (meaning it did not crash) and if it handled everything
19 correctly.
20
21 The goal of having these tests is to automatically find problems and to
22 automatically get a feel for whether a change in the source code breaks any
23 existing feature. After every modification of the i3 sourcecode, the developer
24 should run the full testsuite. If one of the tests fails, the corresponding
25 problem should be fixed (or, in some cases, the testcase has to be modified).
26 For every bugreport, a testcase should be written to test the correct
27 behaviour. Initially, it will fail, but after fixing the bug, it will pass.
28 This ensures (or increases the chance) that bugs which have been fixed once
29 will never be found again.
30
31 Also, when implementing a new feature, a testcase might be a good way to be
32 able to easily test if the feature is working correctly. Many developers will
33 test manually if everything works. Having a testcase not only helps you with
34 that, but it will also be useful for every future change.
35
36 == Relevant documentation
37
38 Apart from this document, you should also have a look at:
39
40 1. The "Modern Perl" book, which can be found at
41    http://onyxneon.com/books/modern_perl/modern_perl_a4.pdf
42 2. The latest Perl documentation of the "i3test" (general testcase setup) and
43    "i3test::Test" (additional test instructions) modules:
44    http://build.i3wm.org/docs/lib-i3test.html respectively
45    http://build.i3wm.org/docs/lib-i3test-test.html
46 3. The latest documentation on i3’s IPC interface:
47    http://build.i3wm.org/docs/ipc.html
48
49 == Implementation
50
51 For several reasons, the i3 testsuite has been implemented in Perl:
52
53 1. Perl has a long tradition of testing. Every popular/bigger Perl module which
54    you can find on CPAN will not only come with documentation, but also with
55    tests. Therefore, the available infrastructure for tests is comprehensive.
56    See for example the excellent http://search.cpan.org/perldoc?Test::More
57    and the referenced http://search.cpan.org/perldoc?Test::Tutorial.
58
59 2. Perl is widely available and has a well-working package infrastructure.
60 3. The author is familiar with Perl :).
61 4. It is a good idea to use a different language for the tests than the
62    implementation itself.
63
64 Please do not start programming language flamewars at this point.
65
66 === Mechanisms
67
68 ==== Script: complete-run
69
70 The testcases are run by a script called +complete-run.pl+. It runs all
71 testcases by default, but you can be more specific and let it only run one or
72 more testcases. Also, it takes care of starting up a separate instance of i3
73 with an appropriate configuration file and creates a folder for each run
74 containing the appropriate i3 logfile for each testcase. The latest folder can
75 always be found under the symlink +latest/+. Unless told differently, it will
76 run the tests on a separate X server instance (using the Xdummy script).
77
78 .Example invocation of complete-run.pl+
79 ---------------------------------------
80 $ cd ~/i3/testcases
81
82 $ ./complete-run.pl
83 # output omitted because it is very long
84 All tests successful.
85 Files=78, Tests=734, 27 wallclock secs ( 0.38 usr  0.48 sys + 17.65 cusr  3.21 csys = 21.72 CPU)
86 Result: PASS
87
88 $ ./complete-run.pl t/04-floating.t
89 [:3] i3 startup: took 0.07s, status = 1
90 [:3] Running t/04-floating.t with logfile testsuite-2011-09-24-16-06-04-4.0.2-226-g1eb011a/i3-log-for-04-floating.t
91 [:3] t/04-floating.t finished
92 [:3] killing i3
93 output for t/04-floating.t:
94 ok 1 - use X11::XCB::Window;
95 ok 2 - The object isa X11::XCB::Window
96 ok 3 - Window is mapped
97 ok 4 - i3 raised the width to 75
98 ok 5 - i3 raised the height to 50
99 ok 6 - i3 did not map it to (0x0)
100 ok 7 - The object isa X11::XCB::Window
101 ok 8 - i3 let the width at 80
102 ok 9 - i3 let the height at 90
103 ok 10 - i3 mapped it to x=1
104 ok 11 - i3 mapped it to y=18
105 ok 12 - The object isa X11::XCB::Window
106 ok 13 - i3 let the width at 80
107 ok 14 - i3 let the height at 90
108 1..14
109
110 All tests successful.
111 Files=1, Tests=14,  0 wallclock secs ( 0.01 usr  0.00 sys +  0.19 cusr  0.03 csys =  0.23 CPU)
112 Result: PASS
113
114 $ less latest/i3-log-for-04-floating.t
115 ----------------------------------------
116
117 ==== IPC interface
118
119 The testsuite makes extensive use of the IPC (Inter-Process Communication)
120 interface which i3 provides. It is used for the startup process of i3, for
121 terminating it cleanly and (most importantly) for modifying and getting the
122 current state (layout tree).
123
124 See [http://i3wm.org/docs/ipc.html] for documentation on the IPC interface.
125
126 ==== X11::XCB
127
128 In order to open new windows, change attributes, get events, etc., the
129 testsuite uses X11::XCB, a new (and quite specific to i3 at the moment) Perl
130 module which uses the XCB protocol description to generate Perl bindings to
131 X11. They work in a very similar way to libxcb (which i3 uses) and provide
132 relatively high-level interfaces (objects such as +X11::XCB::Window+) aswell as
133 access to the low-level interface, which is very useful when testing a window
134 manager.
135
136 === Filesystem structure
137
138 In the git root of i3, the testcases live in the folder +testcases+. This
139 folder contains the +complete-run.pl+ and +Xdummy+ scripts and a base
140 configuration file which will be used for the tests. The different testcases
141 (their file extension is .t, not .pl) themselves can be found in the
142 conventionally named subfolder +t+:
143
144 .Filesystem structure
145 --------------------------------------------
146 ├── testcases
147 │   ├── complete-run.pl
148 │   ├── i3-test.config
149 │   ├── lib
150 │   │   ├── i3test.pm
151 │   │   ├── SocketActivation.pm
152 │   │   └── StartXDummy.pm
153 │   ├── t
154 │   │   ├── 00-load.t
155 │   │   ├── 01-tile.t
156 │   │   ├── 02-fullscreen.t
157 │   │   ├── ...
158 │   │   ├── omitted for brevity
159 │   │   ├── ...
160 │   │   └── 74-regress-focus-toggle.t
161 │   └── Xdummy
162 --------------------------------------------
163
164 == Anatomy of a testcase
165
166 Learning by example is definitely a good strategy when you are wondering how to
167 write a testcase. Let's take +t/11-goto.t+ as an easy example and go through it
168 step by step:
169
170 .t/11-goto.t: Boilerplate
171 ----------------------
172 #!perl
173 # vim:ts=4:sw=4:expandtab
174
175 use i3test;
176 use File::Temp;
177
178 my $x = X11::XCB::Connection->new;
179 -----------------------
180
181 This is what we call boilerplate. It exists at the top of every test file (to
182 some extent). The first line is the shebang, which specifies that this file is
183 a Perl script. The second line contains VIM specific settings on how to
184 edit/format this file (use spaces instead of tabs, indent using 4 spaces).
185 Afterwards, the +i3test+ module is used. This module contains i3 testsuite
186 specific functions which you are strongly encouraged to use. They make writing
187 testcases a lot easier and will make it easier for other people to read your
188 tests.
189
190 The next line uses the +File::Temp+ module. This is specific to this testcase,
191 because it needs to generate a temporary name during the test. Many testcases
192 use only the +i3test+ module.
193
194 The last line opens a connection to X11. You might or might not need this in
195 your testcase, depending on whether you are going to open windows (etc.) or
196 only use i3 commands.
197
198 .t/11-goto.t: Setup
199 ----------------------
200 my $tmp = fresh_workspace;
201
202 cmd 'split h';
203 ----------------------
204
205 The first line calls i3test's +fresh_workspace+ function which looks for a
206 currently unused workspace, switches to it, and returns its name. The variable
207 +$tmp+ will end up having a value such as +"/tmp/87kBVcHbA9"+. Note that this
208 is not (necessarily) a valid path, it's just a random workspace name.
209
210 So, now that we are on a new workspace, we ensure that the workspace uses
211 horizontal orientation by issuing the +split h+ command (see the i3 User's
212 Guide for a list of commands). This is not strictly necessary, but good style.
213 In general, the +cmd+ function executes the specified i3 command by using the
214 IPC interface and returns once i3 acknowledged the command.
215
216 .t/11-goto.t: Setup
217 ----------------------
218 #####################################################################
219 # Create two windows and make sure focus switching works
220 #####################################################################
221
222 my $top = open_window($x);
223 my $mid = open_window($x);
224 my $bottom = open_window($x);
225 ----------------------
226
227 In every major section of a testcase, you should put a comment like the one
228 above. This makes it immediately clear how the file is structured.
229
230 The +open_window+ function opens a standard window, which will then be put into
231 tiling mode by i3. If you want a floating window, use the
232 +open_floating_window+ function. These functions accept the same parameters as
233 +X11::XCB::Window->new+, see the i3test documentation at TODO.
234
235 .t/11-goto.t: Helper function
236 ----------------------
237 #
238 # Returns the input focus after sending the given command to i3 via IPC
239 # and syncing with i3
240 #
241 sub focus_after {
242     my $msg = shift;
243
244     cmd $msg;
245     sync_with_i3 $x;
246     return $x->input_focus;
247 }
248 ----------------------
249
250 This section defines a helper function which will be used over and over in this
251 testcase. If you have code which gets executed more than once or twice
252 (depending on the length of your test, use your best judgement), please put it
253 in a function. Tests should be short, concise and clear.
254
255 The +focus_after+ function executes a command and returns the X11 focus after
256 the command was executed. The +sync_with_i3+ command makes sure that i3 could
257 push its state to X11. See <<i3_sync>> to learn how this works exactly.
258
259 .t/11-goto.t: Test assumptions
260 ----------------------
261 $focus = $x->input_focus;
262 is($focus, $bottom->id, "Latest window focused");
263
264 $focus = focus_after('focus left');
265 is($focus, $mid->id, "Middle window focused");
266 ----------------------
267
268 Now, we run the first two real tests. They use +Test::More+'s +is+ function,
269 which compares two values and prints the differences if they are not the same.
270 After the arguments, we supply a short comment to indicate what we are testing
271 here. This makes it vastly more easy for the developer to spot which testcase
272 is the problem in case one fails.
273
274 The first test checks that the most recently opened window is focused.
275 Afterwards, the command +focus left+ is issued and it is verified that the
276 middle window now has focus.
277
278 Note that this is not a comprehensive test of the +focus+ command -- we would
279 have to test wrapping, focus when using a more complex layout, focusing the
280 parent/child containers, etc. But that is not the point of this testcase.
281 Instead, we just want to know if +$x->input_focus+ corresponds with what we are
282 expecting. If not, something is completely wrong with the test environment and
283 this trivial test will fail.
284
285 .t/11-goto.t: Test that the feature does not work (yet)
286 ----------------------
287 #####################################################################
288 # Now goto a mark which does not exist
289 #####################################################################
290
291 my $random_mark = mktemp('mark.XXXXXX');
292
293 $focus = focus_after(qq|[con_mark="$random_mark"] focus|);
294 is($focus, $mid->id, "focus unchanged");
295 ----------------------
296
297 Syntax hint: The qq keyword is the interpolating quote operator. It lets you
298 chose a quote character (in this case the +|+ character, a pipe). This makes
299 having double quotes in our string easy.
300
301 In this new major section, a random mark (mark is an identifier for a window,
302 see "VIM-like marks" in the i3 User’s Guide) will be generated. Afterwards, we
303 test that trying to focus that mark will not do anything. This is important: Do
304 not only test that using a feature has the expected outcome, but also test that
305 using it without properly initializing it does no harm. This command could for
306 example have changed focus anyways (a bug) or crash i3 (obviously a bug).
307
308 .t/11-goto.t: Test that the feature does work
309 ----------------------
310 cmd "mark $random_mark";
311
312 $focus = focus_after('focus left');
313 is($focus, $top->id, "Top window focused");
314
315 $focus = focus_after(qq|[con_mark="$random_mark"] focus|);
316 is($focus, $mid->id, "goto worked");
317 ----------------------
318
319 Remember: Focus was on the middle window (we verified that earlier in "Test
320 assumptions"). We now mark the middle window with our randomly generated mark.
321 Afterwards, we switch focus away from the middle window to be able to tell if
322 focusing it via its mark will work. If the test works, the goto command seems
323 to be working.
324
325 .t/11-goto.t: Test corner case
326 ----------------------
327 # check that we can specify multiple criteria
328
329 $focus = focus_after('focus left');
330 is($focus, $top->id, "Top window focused");
331
332 $focus = focus_after(qq|[con_mark="$random_mark" con_mark="$random_mark"] focus|);
333 is($focus, $mid->id, "goto worked");
334 ----------------------
335
336 Now we test the same feature, but specifying the mark twice in the command.
337 This should have no effect, but let’s be sure: test it and see if things go
338 wrong.
339
340 .t/11-goto.t: Test second code path
341 ----------------------
342 #####################################################################
343 # Check whether the focus command will switch to a different
344 # workspace if necessary
345 #####################################################################
346
347 my $tmp2 = fresh_workspace;
348
349 is(focused_ws(), $tmp2, 'tmp2 now focused');
350
351 cmd qq|[con_mark="$random_mark"] focus|;
352
353 is(focused_ws(), $tmp, 'tmp now focused');
354 ----------------------
355
356 This part of the test checks that focusing windows by mark works across
357 workspaces. It uses i3test's +focused_ws+ function to get the current
358 workspace.
359
360 .t/11-goto.t: Test second code path
361 ----------------------
362 done_testing;
363 ----------------------
364
365 The end of every testcase has to contain the +done_testing+ line. This tells
366 +complete-run.pl+ that the test was finished successfully. If it does not
367 occur, the test might have crashed during execution -- some of the reasons why
368 that could happen are bugs in the used modules, bugs in the testcase itself or
369 an i3 crash resulting in the testcase being unable to communicate with i3 via
370 IPC anymore.
371
372 [[i3_sync]]
373 == Appendix A: The i3 sync protocol
374
375 Consider the following situation: You open two windows in your testcase, then
376 you use +focus left+ and want to verify that the X11 focus has been updated
377 properly. Sounds simple, right? Let’s assume you use this straight-forward
378 implementation:
379
380 .Racey focus testcase
381 -----------
382 my $left = open_window($x);
383 my $right = open_window($x);
384 cmd 'focus left';
385 is($x->input_focus, $left->id, 'left window focused');
386 ----------
387
388 However, the test fails. Sometimes. Apparantly, there is a race condition in
389 your test. If you think about it, this is because you are using two different
390 pieces of software: You tell i3 to update focus, i3 confirms that, and then you
391 ask X11 to give you the current focus. There is a certain time i3 needs to
392 update the X11 state. If the testcase gets CPU time before X11 processed i3's
393 requests, the test will fail.
394
395 image::i3-sync.png["Diagram of the race condition", title="Diagram of the race condition"]
396
397 One way to "solve" this would be to add +sleep 0.5;+ after the +cmd+ call.
398 After 0.5 seconds it should be safe to assume that focus has been updated,
399 right?
400
401 In practice, this usually works. However, it has several problems:
402
403 1. This is obviously not a clean solution, but a workaround. Ugly.
404 2. On very slow machines, this might not work. Unlikely, but in different
405    situations (a delay to wait for i3 to startup) the necessary time is much
406    harder to guess, even for fast machines.
407 3. This *wastes a lot of time*. Usually, your computer is much faster than 0.5s
408    to update the status. However, sometimes, it might take 0.4s, so we can’t
409    make it +sleep 0.1+.
410
411 To illustrate how grave the problem with wasting time actually is: Before
412 removing all sleeps from the testsuite, a typical run using 4 separate X
413 servers took around 50 seconds on my machine. After removing all the sleeps,
414 we achieved times of about 25 seconds. This is very significant and influences
415 the way you think about tests -- the faster they are, the more likely you are
416 to check whether everything still works quite often (which you should).
417
418 What I am trying to say is: Delays adds up quickly and make the test suite
419 less robust.
420
421 The real solution for this problem is a mechanism which I call "the i3 sync
422 protocol". The idea is to send a request (which does not modify state) via X11
423 to i3 which will then be answered. Due to the request's position in the event
424 queue (*after* all previous events), you can be sure that by the time you
425 receive the reply, all other events have been dealt with by i3 (and, more
426 importantly, X11).
427
428 image::i3-sync-working.png["Diagram of the i3 sync solution", title="Diagram of the i3 sync solution"]
429
430 === Implementation details
431
432 The client which wants to sync with i3 initiates the protocol by sending a
433 ClientMessage to the X11 root window:
434
435 .Send ClientMessage
436 -------------------
437 # Generate a ClientMessage, see xcb_client_message_t
438 my $msg = pack "CCSLLLLLLL",
439     CLIENT_MESSAGE, # response_type
440     32,     # format
441     0,      # sequence
442     $root,  # destination window
443     $x->atom(name => 'I3_SYNC')->id,
444
445     $_sync_window->id,    # data[0]: our own window id
446     $myrnd, # data[1]: a random value to identify the request
447     0,
448     0,
449     0;
450
451 # Send it to the root window -- since i3 uses the SubstructureRedirect
452 # event mask, it will get the ClientMessage.
453 $x->send_event(0, $root, EVENT_MASK_SUBSTRUCTURE_REDIRECT, $msg);
454 -------------------
455
456 i3 will then reply with the same ClientMessage, sent to the window specified in
457 +data[0]+. In the reply, +data[0]+ and +data[1]+ are exactly the same as in the
458 request. You should use a random value in +data[1]+ and check that you received
459 the same one when getting the reply.
460
461 == Appendix B: Socket activation
462
463 Socket activation is a mechanism which was made popular by systemd, an init
464 replacement. It basically describes creating a listening socket before starting
465 a program.  systemd will invoke the program only when an actual connection to
466 the socket is made, hence the term socket activation.
467
468 The interesting part of this (in the i3 context) is that you can very precisely
469 detect when the program is ready (finished its initialization).
470
471 === Preparing the listening socket
472
473 +complete-run.pl+ will create a listening UNIX socket which it will then pass
474 to i3. This socket will be used by i3 as an additional IPC socket, just like
475 the one it will create on its own. Passing the socket happens implicitly
476 because children will inherit the parent’s sockets when fork()ing and sockets
477 will continue to exist after an exec() call (unless CLOEXEC is set of course).
478
479 The only explicit things +complete-run.pl+ has to do is setting the +LISTEN_FDS+
480 environment variable to the number of sockets which exist (1 in our case) and
481 setting the +LISTEN_PID+ environment variable to the current process ID. Both
482 variables are necessary so that the program (i3) knows how many sockets it
483 should use and if the environment variable is actually intended for it. i3 will
484 then start looking for sockets at file descriptor 3 (since 0, 1 and 2 are used
485 for stdin, stdout and stderr, respectively).
486
487 The actual Perl code which sets up the socket, fork()s, makes sure the socket
488 has file descriptor 3 and sets up the environment variables follows (shortened
489 a bit):
490
491
492 .Setup socket and environment
493 -----------------------------
494 my $socket = IO::Socket::UNIX->new(
495     Listen => 1,
496     Local => $args{unix_socket_path},
497 );
498
499 my $pid = fork;
500 if ($pid == 0) {
501     $ENV{LISTEN_PID} = $$;
502     $ENV{LISTEN_FDS} = 1;
503
504     # Only pass file descriptors 0 (stdin), 1 (stdout),
505     # 2 (stderr) and 3 (socket) to the child.
506     $^F = 3;
507
508     # If the socket does not use file descriptor 3 by chance
509     # already, we close fd 3 and dup2() the socket to 3.
510     if (fileno($socket) != 3) {
511         POSIX::close(3);
512         POSIX::dup2(fileno($socket), 3);
513     }
514
515     exec "/usr/bin/i3";
516 }
517 -----------------------------
518
519 === Waiting for a reply
520
521 In the parent process, we want to know when i3 is ready to answer our IPC
522 requests and handle our windows. Therefore, after forking, we immediately close
523 the listening socket (i3 will handle this side of the socket) and connect to it
524 (remember, we are talking about a named UNIX socket) as a client. This connect
525 call will immediately succeed because the kernel buffers it. Then, we send a
526 request (of type GET_TREE, but that is not really relevant). Writing data to
527 the socket will also succeed immediately because, again, the kernel buffers it
528 (only up to a certain amount of data of course).
529
530 Afterwards, we just blockingly wait until we get an answer. In the child
531 process, i3 will setup the listening socket in its event loop. Immediately
532 after actually starting the event loop, it will notice a new client connecting
533 (the parent process) and handle its request. Since all initialization has been
534 completed successfully by the time the event loop is entered, we can now assume
535 that i3 is ready.
536
537 === Timing and conclusion
538
539 A beautiful feature of this mechanism is that it does not depend on timing. It
540 does not matter when the child process gets CPU time or when the parent process
541 gets CPU time. On heavily loaded machines (or machines with multiple CPUs,
542 cores or unreliable schedulers), this makes waiting for i3 much more robust.
543
544 Before using socket activation, we typically used a +sleep(1)+ and hoped that
545 i3 was initialized by that time. Of course, this breaks on some (slow)
546 computers and wastes a lot of time on faster computers. By using socket
547 activation, we decreased the total amount of time necessary to run all tests
548 (72 files at the time of writing) from > 100 seconds to 16 seconds. This makes
549 it significantly more attractive to run the test suite more often (or at all)
550 during development.
551
552 An alternative approach to using socket activation is polling for the existance
553 of the IPC socket and connecting to it. While this might be slightly easier to
554 implement, it wastes CPU time and is considerably uglier than this solution
555 :). After all, +lib/SocketActivation.pm+ contains only 54 SLOC.