]> git.sur5r.net Git - cc65/blob - doc/cc65.sgml
Rewrote the paragraph about compiler limits and standard compliance.
[cc65] / doc / cc65.sgml
1 <!doctype linuxdoc system>
2
3 <article>
4 <title>cc65 Users Guide
5 <author>Ullrich von Bassewitz, <htmlurl url="mailto:uz@cc65.org" name="uz@cc65.org">
6 <date>03.09.2000, 02.10.2001, 2005-8-1
7
8 <abstract>
9 cc65 is a C compiler for 6502 targets. It supports several 6502 based home
10 computers like the Commodore and Atari machines, but it is easily retargetable.
11 </abstract>
12
13 <!-- Table of contents -->
14 <toc>
15
16 <!-- Begin the document -->
17
18
19 <sect>Overview<p>
20
21 cc65 was originally a C compiler for the Atari 8-bit machines written by
22 John R. Dunning. In prior releases I've described the compiler by listing
23 up the changes made by me. I have made many more changes in the meantime
24 (and rewritten major parts of the compiler), so I will no longer do that,
25 since the list would be too large and of no use to anyone. Instead I will
26 describe the compiler in respect to the ANSI/ISO C standard. In fact, I'm
27 planning a complete rewrite (that is, a complete new compiler) for the
28 next release, since there are too many limitations in the current code,
29 and removing these limitations would mean a rewrite of many more parts of
30 the compiler.
31
32 There are separate documents named <url url="library.html"> and <url
33 url="funcref.html"> that cover the library that is available for the compiler.
34 If you know C, and are interested in doing actual programming, the library
35 documentation is probably of much more use than this document.
36
37 If you need some hints for getting the best code out of the compiler, you
38 may have a look at <url url="coding.html"> which covers some code generation
39 issues.
40
41
42
43 <sect>Usage<p>
44
45 The compiler translates C files into files containing assembly code that
46 may be translated by the ca65 macroassembler (for more information about
47 the assembler, have a look at <url url="ca65.html">).
48
49
50 <sect1>Command line option overview<p>
51
52 The compiler may be called as follows:
53
54 <tscreen><verb>
55 ---------------------------------------------------------------------------
56 Usage: cc65 [options] file
57 Short options:
58   -Cl                   Make local variables static
59   -Dsym[=defn]          Define a symbol
60   -I dir                Set an include directory search path
61   -O                    Optimize code
62   -Oi                   Optimize code, inline more code
63   -Or                   Enable register variables
64   -Os                   Inline some known functions
65   -T                    Include source as comment
66   -V                    Print the compiler version number
67   -W                    Suppress warnings
68   -d                    Debug mode
69   -g                    Add debug info to object file
70   -h                    Help (this text)
71   -j                    Default characters are signed
72   -o name               Name the output file
73   -r                    Enable register variables
74   -t sys                Set the target system
75   -v                    Increase verbosity
76
77 Long options:
78   --add-source          Include source as comment
79   --bss-name seg        Set the name of the BSS segment
80   --check-stack         Generate stack overflow checks
81   --code-name seg       Set the name of the CODE segment
82   --codesize x          Accept larger code by factor x
83   --cpu type            Set cpu type
84   --create-dep          Create a make dependency file
85   --data-name seg       Set the name of the DATA segment
86   --debug               Debug mode
87   --debug-info          Add debug info to object file
88   --forget-inc-paths    Forget include search paths
89   --help                Help (this text)
90   --include-dir dir     Set an include directory search path
91   --register-space b    Set space available for register variables
92   --register-vars       Enable register variables
93   --rodata-name seg     Set the name of the RODATA segment
94   --signed-chars        Default characters are signed
95   --standard std        Language standard (c89, c99, cc65)
96   --static-locals       Make local variables static
97   --target sys          Set the target system
98   --verbose             Increase verbosity
99   --version             Print the compiler version number
100   --writable-strings    Make string literals writable
101 ---------------------------------------------------------------------------
102 </verb></tscreen>
103
104
105 <sect1>Command line options in detail<p>
106
107 Here is a description of all the command line options:
108
109 <descrip>
110
111   <tag><tt>--bss-name seg</tt></tag>
112
113   Set the name of the bss segment.
114
115
116   <tag><tt>--check-stack</tt></tag>
117
118   Tells the compiler to generate code that checks for stack overflows. See
119   <tt><ref id="pragma-checkstack" name="#pragma&nbsp;checkstack"></tt> for an
120   explanation of this feature.
121
122
123   <tag><tt>--code-name seg</tt></tag>
124
125   Set the name of the code segment.
126
127
128   <label id="option-codesize">
129   <tag><tt>--codesize x</tt></tag>
130
131   This options allows finer control about speed vs. size decisions in the code
132   generation and optimization phases. It gives the allowed size increase
133   factor (in percent). The default is 100 when not using <tt/-Oi/ and 200 when
134   using <tt/-Oi/ (<tt/-Oi/ is the same as <tt/--codesize&nbsp;200/).
135
136
137   <tag><tt>--cpu CPU</tt></tag>
138
139   A new, still experimental option. You may specify "6502" or "65C02" as
140   the CPU. 6502 is the default, so this will not change anything.
141   Specifying 65C02 will use a few 65C02 instructions when generating code.
142   Don't expect too much from this option: It is still new (and may have
143   bugs), and the additional instructions for the 65C02 are not that
144   overwhelming.
145
146
147   <tag><tt>--create-dep</tt></tag>
148
149   Tells the compiler to generate a file containing the dependency list for
150   the compiled module in makefile syntax. The file is named as the C input
151   file with the extension replaced by <tt/.u/.
152
153
154   <tag><tt>-d, --debug</tt></tag>
155
156   Enables debug mode, something that should not be needed for mere
157   mortals:-)
158
159
160   <tag><tt>-D sym[=definition]</tt></tag>
161
162   Define a macro on the command line. If no definition is given, the macro
163   is defined to the value "1".
164
165
166   <tag><tt>--forget-inc-paths</tt></tag>
167
168   Forget the builtin include paths. This is most useful when building
169   customized C or runtime libraries, in which case the standard header
170   files should be ignored.
171
172
173   <tag><tt>-g, --debug-info</tt></tag>
174
175   This will cause the compiler to insert a <tt/.DEBUGINFO/ command into the
176   generated assembler code. This will cause the assembler to include all
177   symbols in a special section in the object file.
178
179
180   <tag><tt>-h, --help</tt></tag>
181
182   Print the short option summary shown above.
183
184
185   <tag><tt>-o name</tt></tag>
186
187   Specify the name of the output file. If you don't specify a name, the
188   name of the C input file is used, with the extension replaced by ".s".
189
190
191   <tag><tt>-r, --register-vars</tt></tag>
192
193   <tt/-r/ will make the compiler honor the <tt/register/ keyword. Local
194   variables may be placed in registers (which are actually zero page
195   locations). There is some overhead involved with register variables, since
196   the old contents of the registers must be saved and restored. Since register
197   variables are of limited use without the optimizer, there is also a combined
198   switch: <tt/-Or/ will enable both, the optimizer and register variables.
199
200   For more information about register variables see <ref id="regvars"
201   name="register variables">.
202
203   The compiler setting can also be changed within the source file by using
204   <tt><ref id="pragma-regvars" name="#pragma&nbsp;regvars"></tt>.
205
206
207   <tag><tt>--register-space</tt></tag>
208
209   This option takes a numeric parameter and is used to specify, how much
210   zero page register space is available. Please note that just giving this
211   option will not increase or decrease by itself, it will just tell the
212   compiler about the available space. You will have to allocate that space
213   yourself using an assembler module with the necessary allocations, and a
214   linker configuration that matches the assembler module. The default value
215   for this option is 6 (bytes).
216
217   If you don't know what all this means, please don't use this option.
218
219
220   <tag><tt>--rodata-name seg</tt></tag>
221
222   Set the name of the rodata segment (the segment used for readonly data).
223
224
225   <tag><tt>-j, --signed-chars</tt></tag>
226
227   Using this option, you can make the default characters signed. Since the
228   6502 has no provisions for sign extending characters (which is needed on
229   almost any load operation), this will make the code larger and slower. A
230   better way is to declare characters explicitly as "signed" if needed. You
231   can also use <tt><ref id="pragma-signedchars"
232   name="#pragma&nbsp;signedchars"></tt> for better control of this option.
233
234
235   <label id="option--standard">
236   <tag><tt>--standard std</tt></tag>
237
238   This option allows to set the language standard supported. The argument is
239   one of
240   <itemize>
241   <item>c89
242   <item>c99
243   <item>cc65
244   </itemize>
245
246
247   <tag><tt>-t target, --target target</tt></tag>
248
249   This option is used to set the target system. The target system
250   determines things like the character set that is used for strings and
251   character constants. The following target systems are supported:
252
253   <itemize>
254   <item>none
255   <item>apple2
256   <item>apple2enh
257   <item>atari
258   <item>atmos
259   <item>c16 (works also for the c116 with memory up to 32K)
260   <item>c64
261   <item>c128
262   <item>cbm510 (CBM-II series with 40 column video)
263   <item>cbm610 (all CBM-II II computers with 80 column video)
264   <item>geos
265   <item>lunix
266   <item>lynx
267   <item>nes
268   <item>pet (all CBM PET systems except the 2001)
269   <item>plus4
270   <item>supervision
271   <item>vic20
272   </itemize>
273
274   <tag><tt>-v, --verbose</tt></tag>
275
276   Using this option, the compiler will be somewhat more verbose if errors
277   or warnings are encountered.
278
279
280   <tag><tt>--writable-strings</tt></tag>
281
282   Make string literals writable by placing them into the data segment instead
283   of the rodata segment.
284
285
286   <tag><tt>-Cl, --static-locals</tt></tag>
287
288   Use static storage for local variables instead of storage on the stack.
289   Since the stack is emulated in software, this gives shorter and usually
290   faster code, but the code is no longer reentrant. The difference between
291   <tt/-Cl/ and declaring local variables as static yourself is, that
292   initializer code is executed each time, the function is entered. So when
293   using
294
295   <tscreen><verb>
296         void f (void)
297         {
298             unsigned a = 1;
299             ...
300         }
301   </verb></tscreen>
302
303   the variable <tt/a/ will always have the value <tt/1/ when entering the
304   function and using <tt/-Cl/, while in
305
306   <tscreen><verb>
307         void f (void)
308         {
309             static unsigned a = 1;
310             ....
311         }
312   </verb></tscreen>
313
314   the variable <tt/a/ will have the value <tt/1/ only the first time that the
315   function is entered, and will keep the old value from one call of the
316   function to the next.
317
318   You may also use <tt><ref id="pragma-staticlocals"
319   name="#pragma&nbsp;staticlocals"></tt> to change this setting in your
320   sources.
321
322
323   <tag><tt>-I dir, --include-dir dir</tt></tag>
324
325   Set a directory where the compiler searches for include files. You may
326   use this option multiple times to add more than one directory to the
327   search list.
328
329
330   <label id="option-O">
331   <tag><tt>-O, -Oi, -Or, -Os</tt></tag>
332
333   Enable an optimizer run over the produced code.
334
335   Using <tt/-Oi/, the code generator will inline some code where otherwise a
336   runtime functions would have been called, even if the generated code is
337   larger. This will not only remove the overhead for a function call, but will
338   make the code visible for the optimizer. <tt/-Oi/ is an alias for
339   <tt/--codesize&nbsp;200/.
340
341   <tt/-Or/ will make the compiler honor the <tt/register/ keyword. Local
342   variables may be placed in registers (which are actually zero page
343   locations). There is some overhead involved with register variables, since
344   the old contents of the registers must be saved and restored. In addition,
345   the current implementation does not make good use of register variables, so
346   using <tt/-Or/ may make your program even slower and larger. Use with care!
347
348   Using <tt/-Os/ will force the compiler to inline some known functions from
349   the C library like strlen. Note: This has two consequences:
350   <p>
351   <itemize>
352   <item>You may not use names of standard C functions in your own code. If you
353         do that, your program is not standard compliant anyway, but using
354         <tt/-Os/ will actually break things.
355         <p>
356   <item>The inlined string and memory functions will not handle strings or
357         memory areas larger than 255 bytes. Similarly, the inlined <tt/is..()/
358         functions will not work with values outside the char. range (such as
359         <tt/EOF/).
360         <p>
361   </itemize>
362   <p>
363   It is possible to concatenate the modifiers for <tt/-O/. For example, to
364   enable register variables and inlining of known functions, you may use
365   <tt/-Ors/.
366
367
368   <tag><tt>-T, --add-source</tt></tag>
369
370   This include the source code as comments in the generated code. This is
371   normally not needed.
372
373
374   <tag><tt>-V, --version</tt></tag>
375
376   Print the version number of the compiler. When submitting a bug report,
377   please include the operating system you're using, and the compiler
378   version.
379
380
381   <label id="option-W">
382   <tag><tt>-W</tt></tag>
383
384   This option will suppress any warnings generated by the compiler. Since
385   any source file may be written in a manner that it will not produce
386   compiler warnings, using this option is usually not a good idea.
387
388 </descrip><p>
389
390
391 <sect>Input and output<p>
392
393 The compiler will accept one C file per invocation and create a file with
394 the same base name, but with the extension replaced by ".s". The output
395 file contains assembler code suitable for the use with the ca65 macro
396 assembler.
397
398 In addition to the paths named in the <tt/-I/ option on the command line, the
399 directory named in the environment variable <tt/CC65_INC/ is added to the
400 search path for include files on startup.
401
402
403
404 <sect>Differences to the ISO standard<p>
405
406 Apart from the things listed below, the compiler does support additional
407 keywords, has several functions in the standard headers with names outside the
408 reserved namespace and a few syntax extensions. All these can be disabled with
409 the <tt><ref id="option--standard" name="--standard"></tt> command line
410 option. Its use for maximum standards compatibility is advised.
411
412 Here is a list of differences between the language, the compiler accepts,
413 and the one defined by the ISO standard:
414
415 <itemize>
416
417 <item>  The datatypes "float" and "double" are not available.
418         <p>
419 <item>  C Functions may not return structs (or unions), and structs may not
420         be passed as parameters by value. However, struct assignment *is*
421         possible.
422         <p>
423 <item>  Part of the C library is available only with fastcall calling
424         conventions (see below).  It means that you must not mix pointers to
425         those functions with pointers to user-written, not-fastcall functions.
426         <p>
427 </itemize>
428
429 There may be some more minor differences I'm currently not aware of. The
430 biggest problem is the missing float data type. With this limitation in
431 mind, you should be able to write fairly portable code.
432
433
434
435 <sect>Extensions<p>
436
437 This cc65 version has some extensions to the ISO C standard.
438
439 <itemize>
440
441 <item>  The compiler allows to insert assembler statements into the output
442         file. The syntax is
443
444         <tscreen><verb>
445         asm (&lt;string literal&gt;[, optional parameters]) ;
446         </verb></tscreen>
447         or
448         <tscreen><verb>
449         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
450         </verb></tscreen>
451
452         The first form is in the user namespace and is disabled if the <tt/-A/
453         switch is given.
454
455         There is a whole section covering inline assembler statements,
456         <ref id="inline-asm" name="see there">.
457         <p>
458
459 <item>  There is a special calling convention named "fastcall".
460         The syntax for a function declaration using fastcall is
461
462         <tscreen><verb>
463         &lt;return type&gt; fastcall &lt;function name&gt; (&lt;parameter list&gt;)
464         </verb></tscreen>
465         or
466         <tscreen><verb>
467         &lt;return type&gt; __fastcall__ &lt;function name&gt; (&lt;parameter list&gt;)
468         </verb></tscreen>
469         An example would be
470         <tscreen><verb>
471         void __fastcall__ f (unsigned char c)
472         </verb></tscreen>
473         The first form of the fastcall keyword is in the user namespace and can
474         therefore be disabled with the <tt><ref id="option--standard"
475         name="--standard"></tt> command line option.
476
477         For functions declared as <tt/fastcall/, the rightmost parameter is not
478         pushed on the stack but left in the primary register when the function
479         is called. This will reduce the cost when calling assembler functions
480         significantly, especially when the function itself is rather small.
481         <p>
482
483 <item>  There are two pseudo variables named <tt/__AX__/ and <tt/__EAX__/.
484         Both refer to the primary register that is used by the compiler to
485         evaluate expressions or return function results. <tt/__AX__/ is of
486         type <tt/unsigned int/ and <tt/__EAX__/ of type <tt/long unsigned int/
487         respectively. The pseudo variables may be used as lvalue and rvalue as
488         every other variable. They are most useful together with short
489         sequences of assembler code. For example, the macro
490
491         <tscreen><verb>
492         #define hi(x)           \
493             (__AX__ = (x),      \
494              asm ("txa"),       \
495              asm ("ldx #$00"),  \
496              __AX__)
497         </verb></tscreen>
498
499         will give the high byte of any unsigned value.
500         <p>
501
502 <item>  Inside a function, the identifier <tt/__func__/ gives the name of the
503         current function as a string. Outside of functions, <tt/__func__/ is
504         undefined.
505         Example:
506
507         <tscreen><verb>
508         #define PRINT_DEBUG(s)  printf ("%s: %s\n", __func__, s);
509         </verb></tscreen>
510
511         The macro will print the name of the current function plus a given
512         string.
513         <p>
514
515 <item>  cc65 allows the initialization of <tt/void/ variables. This may be
516         used to create variable structures that are more compatible with
517         interfaces written for assembler languages. Here is an example:
518
519         <tscreen><verb>
520         void GCmd = {   (char)3, (unsigned)0x2000, (unsigned)0x3000 };
521         </verb></tscreen>
522
523         This will be translated as follows:
524
525         <tscreen><verb>
526         _GCmd:
527                 .byte   3
528                 .word   $2000
529                 .word   $3000
530         </verb></tscreen>
531
532         Since the variable is of type <tt/void/ you may not use it as is.
533         However, taking the address of the variable results in a <tt/void*/
534         which may be passed to any function expecting a pointer.
535
536         See the <url url="geos.html" name="GEOS library document"> for examples
537         on how to use this feature.
538         <p>
539
540 <item>  cc65 implements flexible array struct members as defined in the C99 ISO
541         standard. As an extension, these fields may be initialized. There are
542         several exceptions, however (which is probably the reason why the
543         standard does not define this feature, because it is highly
544         unorthogonal). Flexible array members cannot be initialized ...
545
546         <itemize>
547         <item>... when defining an array of structs with flexible
548                 members.
549         <item>... if such a struct is a member field of another struct
550                 which is not the last field.
551         <item>... if the struct which contains a flexible array member is
552                 declared as <tt/register/, and the size and compiler settings
553                 do allow the compiler actually to place the struct into the
554                 register bank in the zero page.
555         </itemize>
556
557         Please note that -- as defined in the ISO C standard -- the <tt/sizeof/
558         operator returns the struct size with the flexible array member having
559         size zero, even if it is initialized.
560         <p>
561
562 </itemize>
563 <p>
564
565
566 <sect>Predefined macros<p>
567
568 The compiler defines several macros at startup:
569
570 <descrip>
571
572   <tag><tt>__CC65__</tt></tag>
573
574   This macro is always defined. Its value is the version number of the
575   compiler in hex.  For example, version 2.10.1 of the compiler has this macro
576   defined as <tt/0x02A1/.
577
578   <tag><tt>__APPLE2__</tt></tag>
579
580   This macro is defined if the target is the Apple ][ (-t apple2).
581
582   <tag><tt>__APPLE2ENH__</tt></tag>
583
584   This macro is defined if the target is the enhanced Apple //e (-t apple2enh).
585
586   <tag><tt>__ATARI__</tt></tag>
587
588   This macro is defined if the target is one of the Atari computers
589   (400/800/130XL/800XL).
590
591   <tag><tt>__ATMOS__</tt></tag>
592
593   This macro is defined if the target is the Oric Atmos (-t atmos).
594
595   <tag><tt>__CBM__</tt></tag>
596
597   This macro is defined if the target system is one of the CBM targets.
598
599   <tag><tt>__C16__</tt></tag>
600
601   This macro is defined if the target is the c16 (-t c16).
602
603   <tag><tt>__C64__</tt></tag>
604
605   This macro is defined if the target is the c64 (-t c64).
606
607   <tag><tt>__C128__</tt></tag>
608
609   This macro is defined if the target is the c128 (-t c128).
610
611   <tag><tt>__CBM510__</tt></tag>
612
613   This macro is defined if the target is the CBM 500 series of computers.
614
615   <tag><tt>__CBM610__</tt></tag>
616
617   This macro is defined if the target is one of the CBM 600/700 family of
618   computers (called B series in the US).
619
620   <tag><tt>__GEOS__</tt></tag>
621
622   This macro is defined if you are compiling for the GEOS system (-t geos).
623
624   <tag><tt>__LUNIX__</tt></tag>
625
626   This macro is defined if you are compiling for the LUnix system (-t lunix).
627
628   <tag><tt>__LYNX__</tt></tag>
629
630   This macro is defined if the target is the Atari Lynx (-t lynx).
631
632   <tag><tt>__NES__</tt></tag>
633
634   This macro is defined if the target is the NES (-t nes).
635
636   <tag><tt>__PET__</tt></tag>
637
638   This macro is defined if the target is the PET family of computers (-t pet).
639
640   <tag><tt>__PLUS4__</tt></tag>
641
642   This macro is defined if the target is the plus/4 (-t plus4).
643
644   <tag><tt>__SUPERVISION__</tt></tag>
645
646   This macro is defined if the target is the supervision (-t supervision).
647
648   <tag><tt>__VIC20__</tt></tag>
649
650   This macro is defined if the target is the vic20 (-t vic20).
651
652   <tag><tt>__FILE__</tt></tag>
653
654   This macro expands to a string containing the name of the C source file.
655
656   <tag><tt>__LINE__</tt></tag>
657
658   This macro expands to the current line number.
659
660   <tag><tt>__CC65_STD__</tt></tag>
661
662   This macro is defined to one of the following depending on the <tt><ref
663   id="option--standard" name="--standard"></tt> command line option:
664   <itemize>
665   <item><tt/__CC65_STD_C89__/
666   <item><tt/__CC65_STD_C99__/
667   <item><tt/__CC65_STD_CC65__/
668   </itemize>
669
670   <tag><tt>__OPT__</tt></tag>
671
672   Is defined if the compiler was called with the <tt/-O/ command line option.
673
674   <tag><tt>__OPT_i__</tt></tag>
675
676   Is defined if the compiler was called with the <tt/-Oi/ command line option.
677
678   <tag><tt>__OPT_r__</tt></tag>
679
680   Is defined if the compiler was called with the <tt/-Or/ command line option.
681
682   <tag><tt>__OPT_s__</tt></tag>
683
684   Is defined if the compiler was called with the <tt/-Os/ command line option.
685
686 </descrip>
687
688
689 <sect>&num;pragmas<label id="pragmas"><p>
690
691 The compiler understands some pragmas that may be used to change code
692 generation and other stuff. Some of these pragmas understand a special form:
693 If the first parameter is <tt/push/, the old value is saved onto a stack
694 before changing it. The value may later be restored by using the <tt/pop/
695 parameter with the <tt/#pragma/.
696
697 <sect1><tt>#pragma bssseg (&lsqb;push,&rsqb;&lt;name&gt;)</tt><p>
698
699   This pragma changes the name used for the BSS segment (the BSS segment
700   is used to store uninitialized data). The argument is a string enclosed
701   in double quotes.
702
703   Note: The default linker configuration file does only map the standard
704   segments. If you use other segments, you have to create a new linker
705   configuration file.
706
707   Beware: The startup code will zero only the default BSS segment. If you
708   use another BSS segment, you have to do that yourself, otherwise
709   uninitialized variables do not have the value zero.
710
711   The <tt/#pragma/ understands the push and pop parameters as explained above.
712
713   Example:
714   <tscreen><verb>
715         #pragma bssseg ("MyBSS")
716   </verb></tscreen>
717
718
719 <sect1><tt>#pragma charmap (&lt;index&gt;, &lt;code&gt;)</tt><p>
720
721   Each literal string and each literal character in the source is translated
722   by use of a translation table. This translation table is preset when the
723   compiler is started depending on the target system, for example to map
724   ISO-8859-1 characters into PETSCII if the target is a commodore machine.
725
726   This pragma allows to change entries in the translation table, so the
727   translation for individual characters, or even the complete table may be
728   adjusted.
729
730   Both arguments are assumed to be unsigned characters with a valid range of
731   1-255.
732
733   Beware of two pitfalls:
734
735     <itemize>
736     <item>The character index is actually the code of the character in the
737           C source, so character mappings do always depend on the source
738           character set. This means that <tt/#pragma&nbsp;charmap/ is not
739           portable -- it depends on the build environment.
740     <item>While it is possible to use character literals as indices, the
741           result may be somewhat unexpected, since character literals are
742           itself translated. For this reason I would suggest to avoid
743           character literals and use numeric character codes instead.
744     </itemize>
745
746   Example:
747   <tscreen><verb>
748         /* Use a space wherever an 'a' occurs in ISO-8859-1 source */
749         #pragma charmap (0x61, 0x20);
750   </verb></tscreen>
751
752
753 <sect1><tt>#pragma checkstack ([push,]on|off)</tt><label id="pragma-checkstack"><p>
754
755   Tells the compiler to insert calls to a stack checking subroutine to detect
756   stack overflows. The stack checking code will lead to somewhat larger and
757   slower programs, so you may want to use this pragma when debugging your
758   program and switch it off for the release version. If a stack overflow is
759   detected, the program is aborted.
760
761   If the argument is "off", stack checks are disabled (the default), otherwise
762   they're enabled.
763
764   The <tt/#pragma/ understands the push and pop parameters as explained above.
765
766 <sect1><tt>#pragma codeseg ([push,]&lt;name&gt;)</tt><p>
767
768   This pragma changes the name used for the CODE segment (the CODE segment
769   is used to store executable code). The argument is a string enclosed in
770   double quotes.
771
772   Note: The default linker configuration file does only map the standard
773   segments. If you use other segments, you have to create a new linker
774   configuration file.
775
776   The <tt/#pragma/ understands the push and pop parameters as explained above.
777
778   Example:
779   <tscreen><verb>
780         #pragma codeseg ("MyCODE")
781   </verb></tscreen>
782
783
784 <sect1><tt>#pragma codesize ([push,]&lt;int&gt;)</tt><label id="pragma-codesize"><p>
785
786   This pragma allows finer control about speed vs. size decisions in the code
787   generation and optimization phase. It gives the allowed size increase factor
788   (in percent). The default is can be changed by use of the <tt/<ref
789   id="option-codesize" name="--codesize">/ compiler option.
790
791   The <tt/#pragma/ understands the push and pop parameters as explained above.
792
793
794 <sect1><tt>#pragma dataseg ([push,]&lt;name&gt;)</tt><p>
795
796   This pragma changes the name used for the DATA segment (the DATA segment
797   is used to store initialized data). The argument is a string enclosed in
798   double quotes.
799
800   Note: The default linker configuration file does only map the standard
801   segments. If you use other segments, you have to create a new linker
802   configuration file.
803
804   The <tt/#pragma/ understands the push and pop parameters as explained above.
805
806   Example:
807   <tscreen><verb>
808         #pragma dataseg ("MyDATA")
809   </verb></tscreen>
810
811
812 <sect1><tt>#pragma optimize ([push,]on|off)</tt><label id="pragma-optimize"><p>
813
814   Switch optimization on or off. If the argument is "off", optimization is
815   disabled, otherwise it is enabled. Please note that this pragma only effects
816   whole functions. The setting in effect when the function is encountered will
817   determine if the generated code is optimized or not.
818
819   Optimization and code generation is also controlled by the <ref
820   id="pragma-codesize" name="codesize pragma">.
821
822   The default is "off", but may be changed with the <tt/<ref name="-O"
823   id="option-O">/ compiler option.
824
825   The <tt/#pragma/ understands the push and pop parameters as explained above.
826
827
828 <sect1><tt>#pragma rodataseg ([push,]&lt;name&gt;)</tt><p>
829
830   This pragma changes the name used for the RODATA segment (the RODATA
831   segment is used to store readonly data). The argument is a string
832   enclosed in double quotes.
833
834   Note: The default linker configuration file does only map the standard
835   segments. If you use other segments, you have to create a new linker
836   configuration file.
837
838   The <tt/#pragma/ understands the push and pop parameters as explained above.
839
840   Example:
841   <tscreen><verb>
842         #pragma rodataseg ("MyRODATA")
843   </verb></tscreen>
844
845
846 <sect1><tt>#pragma regvaraddr ([push,]on|off)</tt><p>
847
848   The compiler does not allow to take the address of register variables.
849   The regvaraddr pragma changes this. Taking the address of a register
850   variable is allowed after using this pragma with "on" as argument.
851   Using "off" as an argument switches back to the default behaviour.
852
853   Beware: The C standard does not allow taking the address of a variable
854   declared as register. So your programs become non-portable if you use
855   this pragma. In addition, your program may not work. This is usually the
856   case if a subroutine is called with the address of a register variable,
857   and this subroutine (or a subroutine called from there) uses
858   register variables. So be careful with this #pragma.
859
860   The <tt/#pragma/ understands the push and pop parameters as explained above.
861
862   Example:
863   <tscreen><verb>
864         #pragma regvaraddr(on)  /* Allow taking the address
865                                  * of register variables
866                                  */
867   </verb></tscreen>
868
869
870 <sect1><tt>#pragma regvars ([push,]on|off)</tt><label id="pragma-regvars"><p>
871
872   Enables or disables use of register variables. If register variables are
873   disabled (the default), the <tt/register/ keyword is ignored. Register
874   variables are explained in more detail in <ref id="regvars" name="a separate
875   chapter">.
876
877   The <tt/#pragma/ understands the push and pop parameters as explained above.
878
879
880 <sect1><tt>#pragma signedchars ([push,]on|off)</tt><label id="pragma-signedchars"><p>
881
882   Changes the signedness of the default character type. If the argument is
883   "on", default characters are signed, otherwise characters are unsigned.
884   The compiler default is to make characters unsigned since this creates a
885   lot better code. This default may be overridden by the <tt/--signed-chars/
886   command line option.
887
888   The <tt/#pragma/ understands the push and pop parameters as explained above.
889
890
891 <sect1><tt>#pragma staticlocals ([push,]on|off)</tt><label id="pragma-staticlocals"<p>
892
893   Use variables in the bss segment instead of variables on the stack. This
894   pragma changes the default set by the compiler option <tt/-Cl/. If the
895   argument is "on", local variables are allocated in the BSS segment,
896   leading to shorter and in most cases faster, but non-reentrant code.
897
898   The <tt/#pragma/ understands the push and pop parameters as explained above.
899
900
901 <sect1><tt>#pragma warn ([push,]on|off)</tt><label id="pragma-warn"><p>
902
903   Switch compiler warnings on or off. If the argument is "off", warnings are
904   disabled, otherwise they're enabled. The default is "on", but may be changed
905   with the <tt/<ref name="-W" id="option-W">/ compiler option.
906
907   The <tt/#pragma/ understands the push and pop parameters as explained above.
908
909
910 <sect1><tt>#pragma zpsym (&lt;name&gt;)</tt><p>
911
912   Tell the compiler that the -- previously as external declared -- symbol with
913   the given name is a zero page symbol (usually from an assembler file).
914   The compiler will create a matching import declaration for the assembler.
915
916   Example:
917   <tscreen><verb>
918         extern int foo;
919         #pragma zpsym ("foo");  /* foo is in the zeropage */
920   </verb></tscreen>
921
922
923
924
925 <sect>Register variables<label id="regvars"><p>
926
927 The runtime for all supported platforms has 6 bytes of zero page space
928 available for register variables (this could be increased, but I think it's a
929 good value). So you can declare register variables up to a total size of 6 per
930 function. The compiler will allocate register space on a "first come, first
931 served" base and convert any <tt/register/ declarations that exceed the
932 available register space silently to <tt/auto/. Parameters can also be
933 declared as <tt/register/, this will in fact give slightly shorter code than
934 using a register variable.
935
936 Since a function must save the current values of the registers on entry and
937 restore them on exit, there is an overhead associated with register variables,
938 and this overhead is quite high (about 20 bytes per variable). This means that
939 just declaring anything as <tt/register/ is not a good idea.
940
941 The best use for register variables are pointers, especially those that point
942 to structures. The magic number here is about 3 uses of a struct field: If the
943 function contains this number or even more, the generated code will be usually
944 shorter and faster when using a register variable for the struct pointer. The
945 reason for this is that the register variable can in many cases be used as a
946 pointer directly. Having a pointer in an auto variable means that this pointer
947 must first be copied into a zero page location, before it can be dereferenced.
948
949 Second best use for register variables are counters. However, there is not
950 much difference in the code generated for counters, so you will need at least
951 100 operations on this variable (for example in a loop) to make it worth the
952 trouble. The only savings you get here are by the use of a zero page variable
953 instead of one on the stack or in the data segment.
954
955 Register variables must be explicitly enabled by using <tt/-Or/ or <tt/-r/ on
956 the command line. Register variables are only accepted on function top level,
957 register variables declared in interior blocks are silently converted to
958 <tt/auto/. With register variables disabled, all variables declared as
959 <tt/register/ are actually auto variables.
960
961 Please take care when using register variables: While they are helpful and can
962 lead to a tremendous speedup when used correctly, improper usage will cause
963 bloated code and a slowdown.
964
965
966
967 <sect>Inline assembler<label id="inline-asm"><p>
968
969 The compiler allows to insert assembler statements into the output file. The
970 syntax is
971
972 <tscreen><verb>
973         asm (&lt;string literal&gt;[, optional parameters]) ;
974 </verb></tscreen>
975 or
976 <tscreen><verb>
977         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
978 </verb></tscreen>
979 <p>
980
981 The first form is in the user namespace and is disabled by <tt><ref
982 id="option--standard" name="--standard"></tt> if the argument is not <tt/cc65/.
983
984 The asm statement may be used inside a function and on global file level. An
985 inline assembler statement is a primary expression, so it may also be used as
986 part of an expression. Please note however that the result of an expression
987 containing just an inline assembler statement is always of type <tt/void/.
988
989 The contents of the string literal are preparsed by the compiler and inserted
990 into the generated assembly output, so that the can be further processed by
991 the backend and especially the optimizer. For this reason, the compiler does
992 only allow regular 6502 opcodes to be used with the inline assembler. Pseudo
993 instructions (like <tt/.import/, <tt/.byte/ and so on) are <em/not/ allowed,
994 even if the ca65 assembler (which is used to translate the generated assembler
995 code) would accept them. The builtin inline assembler is not a replacement for
996 the full blown macro assembler which comes with the compiler.
997
998 Note: Inline assembler statements are subject to all optimizations done by the
999 compiler. There is currently no way to protect an inline assembler statement
1000 from being moved or removed completely by the optimizer. If in doubt, check
1001 the generated assembler output, or disable optimizations.
1002
1003 The string literal may contain format specifiers from the following list. For
1004 each format specifier, an argument is expected which is inserted instead of
1005 the format specifier before passing the assembly code line to the backend.
1006
1007 <itemize>
1008   <item><tt/%b/ - Numerical 8-bit value
1009   <item><tt/%w/ - Numerical 16-bit value
1010   <item><tt/%l/ - Numerical 32-bit value
1011   <item><tt/%v/ - Assembler name of a (global) variable or function
1012   <item><tt/%o/ - Stack offset of a (local) variable
1013   <item><tt/%g/ - Assembler name of a C label
1014   <item><tt/%s/ - The argument is converted to a string
1015   <item><tt/%%/ - The % sign itself
1016 </itemize><p>
1017
1018 Using these format specifiers, you can access C <tt/#defines/, variables or
1019 similar stuff from the inline assembler. For example, to load the value of
1020 a C <tt/#define/ into the Y register, one would use
1021
1022 <tscreen><verb>
1023         #define OFFS  23
1024         __asm__ ("ldy #%b", OFFS);
1025 </verb></tscreen>
1026
1027 Or, to access a struct member of a static variable:
1028
1029 <tscreen><verb>
1030         typedef struct {
1031             unsigned char x;
1032             unsigned char y;
1033             unsigned char color;
1034         } pixel_t;
1035         static pixel_t pixel;
1036         __asm__ ("ldy #%b", offsetof(pixel_t, color));
1037         __asm__ ("lda %v,y", pixel);
1038 </verb></tscreen>
1039 <p>
1040
1041 Note: Do not embed the assembler labels that are used as names of global
1042 variables or functions into your asm statements. Code like this
1043
1044 <tscreen><verb>
1045         int foo;
1046         int bar () { return 1; }
1047         __asm__ ("lda _foo");           /* DON'T DO THAT! */
1048         ...
1049         __asm__ ("jsr _bar");           /* DON'T DO THAT EITHER! */
1050 </verb></tscreen>
1051 <p>
1052
1053 may stop working if the way, the compiler generates these names is changed in
1054 a future version. Instead use the format specifiers from the table above:
1055
1056 <tscreen><verb>
1057         __asm__ ("lda %v", foo);        /* OK */
1058         ...
1059         __asm__ ("jsr %v", bar);        /* OK */
1060 </verb></tscreen>
1061 <p>
1062
1063
1064 <sect>Bugs/Feedback<p>
1065
1066 If you have problems using the compiler, if you find any bugs, or if you're
1067 doing something interesting with it, I would be glad to hear from you. Feel
1068 free to contact me by email (<htmlurl url="mailto:uz@cc65.org"
1069 name="uz@cc65.org">).
1070
1071
1072
1073 <sect>Copyright<p>
1074
1075 This is the original compiler copyright:
1076
1077 <tscreen><verb>
1078 --------------------------------------------------------------------------
1079   -*- Mode: Text -*-
1080
1081      This is the copyright notice for RA65, LINK65, LIBR65, and other
1082   Atari 8-bit programs.  Said programs are Copyright 1989, by John R.
1083   Dunning.  All rights reserved, with the following exceptions:
1084
1085       Anyone may copy or redistribute these programs, provided that:
1086
1087   1:  You don't charge anything for the copy.  It is permissable to
1088       charge a nominal fee for media, etc.
1089
1090   2:  All source code and documentation for the programs is made
1091       available as part of the distribution.
1092
1093   3:  This copyright notice is preserved verbatim, and included in
1094       the distribution.
1095
1096       You are allowed to modify these programs, and redistribute the
1097   modified versions, provided that the modifications are clearly noted.
1098
1099       There is NO WARRANTY with this software, it comes as is, and is
1100   distributed in the hope that it may be useful.
1101
1102       This copyright notice applies to any program which contains
1103   this text, or the refers to this file.
1104
1105       This copyright notice is based on the one published by the Free
1106   Software Foundation, sometimes known as the GNU project.  The idea
1107   is the same as theirs, ie the software is free, and is intended to
1108   stay that way.  Everybody has the right to copy, modify, and re-
1109   distribute this software.  Nobody has the right to prevent anyone
1110   else from copying, modifying or redistributing it.
1111
1112 --------------------------------------------------------------------------
1113 </verb></tscreen>
1114
1115 Small parts of the compiler (parts of the preprocessor and main parser) are
1116 still covered by this copyright. The main portion is covered by the usual
1117 cc65 license, which reads:
1118
1119 This software is provided 'as-is', without any expressed or implied
1120 warranty.  In no event will the authors be held liable for any damages
1121 arising from the use of this software.
1122
1123 Permission is granted to anyone to use this software for any purpose,
1124 including commercial applications, and to alter it and redistribute it
1125 freely, subject to the following restrictions:
1126
1127 <enum>
1128 <item>  The origin of this software must not be misrepresented; you must not
1129         claim that you wrote the original software. If you use this software
1130         in a product, an acknowledgment in the product documentation would be
1131         appreciated but is not required.
1132 <item>  Altered source versions must be plainly marked as such, and must not
1133         be misrepresented as being the original software.
1134 <item>  This notice may not be removed or altered from any source
1135         distribution.
1136 </enum>
1137
1138 </article>
1139