]> git.sur5r.net Git - cc65/blob - doc/cc65.sgml
Rewrote most of the #pragma parsing code. I'm still not satisfied, but at
[cc65] / doc / cc65.sgml
1 <!doctype linuxdoc system>
2
3 <article>
4 <title>cc65 Users Guide
5 <author>Ullrich von Bassewitz, <htmlurl url="mailto:uz@cc65.org" name="uz@cc65.org">
6 <date>03.09.2000, 02.10.2001, 2005-8-1
7
8 <abstract>
9 cc65 is a C compiler for 6502 targets. It supports several 6502 based home
10 computers like the Commodore and Atari machines, but it is easily retargetable.
11 </abstract>
12
13 <!-- Table of contents -->
14 <toc>
15
16 <!-- Begin the document -->
17
18
19 <sect>Overview<p>
20
21 cc65 was originally a C compiler for the Atari 8-bit machines written by
22 John R. Dunning. In prior releases I've described the compiler by listing
23 up the changes made by me. I have made many more changes in the meantime
24 (and rewritten major parts of the compiler), so I will no longer do that,
25 since the list would be too large and of no use to anyone. Instead I will
26 describe the compiler in respect to the ANSI/ISO C standard. In fact, I'm
27 planning a complete rewrite (that is, a complete new compiler) for the
28 next release, since there are too many limitations in the current code,
29 and removing these limitations would mean a rewrite of many more parts of
30 the compiler.
31
32 There are separate documents named <url url="library.html"> and <url
33 url="funcref.html"> that cover the library that is available for the compiler.
34 If you know C, and are interested in doing actual programming, the library
35 documentation is probably of much more use than this document.
36
37 If you need some hints for getting the best code out of the compiler, you
38 may have a look at <url url="coding.html"> which covers some code generation
39 issues.
40
41
42
43 <sect>Usage<p>
44
45 The compiler translates C files into files containing assembly code that
46 may be translated by the ca65 macroassembler (for more information about
47 the assembler, have a look at <url url="ca65.html">).
48
49
50 <sect1>Command line option overview<p>
51
52 The compiler may be called as follows:
53
54 <tscreen><verb>
55 ---------------------------------------------------------------------------
56 Usage: cc65 [options] file
57 Short options:
58   -Cl                   Make local variables static
59   -Dsym[=defn]          Define a symbol
60   -I dir                Set an include directory search path
61   -O                    Optimize code
62   -Oi                   Optimize code, inline more code
63   -Or                   Enable register variables
64   -Os                   Inline some known functions
65   -T                    Include source as comment
66   -V                    Print the compiler version number
67   -W name[,name]        Enable or disable warnings
68   -d                    Debug mode
69   -g                    Add debug info to object file
70   -h                    Help (this text)
71   -j                    Default characters are signed
72   -o name               Name the output file
73   -r                    Enable register variables
74   -t sys                Set the target system
75   -v                    Increase verbosity
76
77 Long options:
78   --add-source          Include source as comment
79   --bss-name seg        Set the name of the BSS segment
80   --check-stack         Generate stack overflow checks
81   --code-name seg       Set the name of the CODE segment
82   --codesize x          Accept larger code by factor x
83   --cpu type            Set cpu type
84   --create-dep          Create a make dependency file
85   --data-name seg       Set the name of the DATA segment
86   --debug               Debug mode
87   --debug-info          Add debug info to object file
88   --forget-inc-paths    Forget include search paths
89   --help                Help (this text)
90   --include-dir dir     Set an include directory search path
91   --register-space b    Set space available for register variables
92   --register-vars       Enable register variables
93   --rodata-name seg     Set the name of the RODATA segment
94   --signed-chars        Default characters are signed
95   --standard std        Language standard (c89, c99, cc65)
96   --static-locals       Make local variables static
97   --target sys          Set the target system
98   --verbose             Increase verbosity
99   --version             Print the compiler version number
100   --writable-strings    Make string literals writable
101 ---------------------------------------------------------------------------
102 </verb></tscreen>
103
104
105 <sect1>Command line options in detail<p>
106
107 Here is a description of all the command line options:
108
109 <descrip>
110
111   <tag><tt>--bss-name seg</tt></tag>
112
113   Set the name of the bss segment.
114
115
116   <tag><tt>--check-stack</tt></tag>
117
118   Tells the compiler to generate code that checks for stack overflows. See
119   <tt><ref id="pragma-checkstack" name="#pragma&nbsp;checkstack"></tt> for an
120   explanation of this feature.
121
122
123   <tag><tt>--code-name seg</tt></tag>
124
125   Set the name of the code segment.
126
127
128   <label id="option-codesize">
129   <tag><tt>--codesize x</tt></tag>
130
131   This options allows finer control about speed vs. size decisions in the code
132   generation and optimization phases. It gives the allowed size increase
133   factor (in percent). The default is 100 when not using <tt/-Oi/ and 200 when
134   using <tt/-Oi/ (<tt/-Oi/ is the same as <tt/-O --codesize&nbsp;200/).
135
136
137   <tag><tt>--cpu CPU</tt></tag>
138
139   A new, still experimental option. You may specify "6502" or "65C02" as
140   the CPU. 6502 is the default, so this will not change anything.
141   Specifying 65C02 will use a few 65C02 instructions when generating code.
142   Don't expect too much from this option: It is still new (and may have
143   bugs), and the additional instructions for the 65C02 are not that
144   overwhelming.
145
146
147   <tag><tt>--create-dep</tt></tag>
148
149   Tells the compiler to generate a file containing the dependency list for
150   the compiled module in makefile syntax. The file is named as the C input
151   file with the extension replaced by <tt/.u/.
152
153
154   <tag><tt>-d, --debug</tt></tag>
155
156   Enables debug mode, something that should not be needed for mere
157   mortals:-)
158
159
160   <tag><tt>-D sym[=definition]</tt></tag>
161
162   Define a macro on the command line. If no definition is given, the macro
163   is defined to the value "1".
164
165
166   <tag><tt>--forget-inc-paths</tt></tag>
167
168   Forget the builtin include paths. This is most useful when building
169   customized C or runtime libraries, in which case the standard header
170   files should be ignored.
171
172
173   <tag><tt>-g, --debug-info</tt></tag>
174
175   This will cause the compiler to insert a <tt/.DEBUGINFO/ command into the
176   generated assembler code. This will cause the assembler to include all
177   symbols in a special section in the object file.
178
179
180   <tag><tt>-h, --help</tt></tag>
181
182   Print the short option summary shown above.
183
184
185   <tag><tt>-o name</tt></tag>
186
187   Specify the name of the output file. If you don't specify a name, the
188   name of the C input file is used, with the extension replaced by ".s".
189
190
191   <tag><tt>-r, --register-vars</tt></tag>
192
193   <tt/-r/ will make the compiler honor the <tt/register/ keyword. Local
194   variables may be placed in registers (which are actually zero page
195   locations). There is some overhead involved with register variables, since
196   the old contents of the registers must be saved and restored. Since register
197   variables are of limited use without the optimizer, there is also a combined
198   switch: <tt/-Or/ will enable both, the optimizer and register variables.
199
200   For more information about register variables see <ref id="regvars"
201   name="register variables">.
202
203   The compiler setting can also be changed within the source file by using
204   <tt><ref id="pragma-regvars" name="#pragma&nbsp;regvars"></tt>.
205
206
207   <tag><tt>--register-space</tt></tag>
208
209   This option takes a numeric parameter and is used to specify, how much
210   zero page register space is available. Please note that just giving this
211   option will not increase or decrease by itself, it will just tell the
212   compiler about the available space. You will have to allocate that space
213   yourself using an assembler module with the necessary allocations, and a
214   linker configuration that matches the assembler module. The default value
215   for this option is 6 (bytes).
216
217   If you don't know what all this means, please don't use this option.
218
219
220   <tag><tt>--rodata-name seg</tt></tag>
221
222   Set the name of the rodata segment (the segment used for readonly data).
223
224
225   <tag><tt>-j, --signed-chars</tt></tag>
226
227   Using this option, you can make the default characters signed. Since the
228   6502 has no provisions for sign extending characters (which is needed on
229   almost any load operation), this will make the code larger and slower. A
230   better way is to declare characters explicitly as "signed" if needed. You
231   can also use <tt><ref id="pragma-signedchars"
232   name="#pragma&nbsp;signedchars"></tt> for better control of this option.
233
234
235   <label id="option--standard">
236   <tag><tt>--standard std</tt></tag>
237
238   This option allows to set the language standard supported. The argument is
239   one of
240   <itemize>
241   <item>c89
242   <item>c99
243   <item>cc65
244   </itemize>
245
246   Please note that the compiler does not support the c99 standard and never
247   will. c99 mode is actually c89 mode with a few selected c99 extensions
248   (// comments for example).
249
250
251   <tag><tt>-t target, --target target</tt></tag>
252
253   This option is used to set the target system. The target system
254   determines things like the character set that is used for strings and
255   character constants. The following target systems are supported:
256
257   <itemize>
258   <item>none
259   <item>apple2
260   <item>apple2enh
261   <item>atari
262   <item>atmos
263   <item>c16 (works also for the c116 with memory up to 32K)
264   <item>c64
265   <item>c128
266   <item>cbm510 (CBM-II series with 40 column video)
267   <item>cbm610 (all CBM-II II computers with 80 column video)
268   <item>geos
269   <item>lunix
270   <item>lynx
271   <item>nes
272   <item>pet (all CBM PET systems except the 2001)
273   <item>plus4
274   <item>supervision
275   <item>vic20
276   </itemize>
277
278   <tag><tt>-v, --verbose</tt></tag>
279
280   Using this option, the compiler will be somewhat more verbose if errors
281   or warnings are encountered.
282
283
284   <tag><tt>--writable-strings</tt></tag>
285
286   Make string literals writable by placing them into the data segment instead
287   of the rodata segment.
288
289
290   <tag><tt>-Cl, --static-locals</tt></tag>
291
292   Use static storage for local variables instead of storage on the stack.
293   Since the stack is emulated in software, this gives shorter and usually
294   faster code, but the code is no longer reentrant. The difference between
295   <tt/-Cl/ and declaring local variables as static yourself is, that
296   initializer code is executed each time, the function is entered. So when
297   using
298
299   <tscreen><verb>
300         void f (void)
301         {
302             unsigned a = 1;
303             ...
304         }
305   </verb></tscreen>
306
307   the variable <tt/a/ will always have the value <tt/1/ when entering the
308   function and using <tt/-Cl/, while in
309
310   <tscreen><verb>
311         void f (void)
312         {
313             static unsigned a = 1;
314             ....
315         }
316   </verb></tscreen>
317
318   the variable <tt/a/ will have the value <tt/1/ only the first time that the
319   function is entered, and will keep the old value from one call of the
320   function to the next.
321
322   You may also use <tt><ref id="pragma-staticlocals"
323   name="#pragma&nbsp;staticlocals"></tt> to change this setting in your
324   sources.
325
326
327   <tag><tt>-I dir, --include-dir dir</tt></tag>
328
329   Set a directory where the compiler searches for include files. You may
330   use this option multiple times to add more than one directory to the
331   search list.
332
333
334   <label id="option-O">
335   <tag><tt>-O, -Oi, -Or, -Os</tt></tag>
336
337   Enable an optimizer run over the produced code.
338
339   Using <tt/-Oi/, the code generator will inline some code where otherwise a
340   runtime functions would have been called, even if the generated code is
341   larger. This will not only remove the overhead for a function call, but will
342   make the code visible for the optimizer. <tt/-Oi/ is an alias for
343   <tt/-O --codesize&nbsp;200/.
344
345   <tt/-Or/ will make the compiler honor the <tt/register/ keyword. Local
346   variables may be placed in registers (which are actually zero page
347   locations). There is some overhead involved with register variables, since
348   the old contents of the registers must be saved and restored. In addition,
349   the current implementation does not make good use of register variables, so
350   using <tt/-Or/ may make your program even slower and larger. Use with care!
351
352   Using <tt/-Os/ will force the compiler to inline some known functions from
353   the C library like strlen. Note: This has two consequences:
354   <p>
355   <itemize>
356   <item>You may not use names of standard C functions in your own code. If you
357         do that, your program is not standard compliant anyway, but using
358         <tt/-Os/ will actually break things.
359         <p>
360   <item>The inlined string and memory functions will not handle strings or
361         memory areas larger than 255 bytes. Similarly, the inlined <tt/is..()/
362         functions will not work with values outside the char. range (such as
363         <tt/EOF/).
364         <p>
365   </itemize>
366   <p>
367   It is possible to concatenate the modifiers for <tt/-O/. For example, to
368   enable register variables and inlining of known functions, you may use
369   <tt/-Ors/.
370
371
372   <tag><tt>-T, --add-source</tt></tag>
373
374   This include the source code as comments in the generated code. This is
375   normally not needed.
376
377
378   <tag><tt>-V, --version</tt></tag>
379
380   Print the version number of the compiler. When submitting a bug report,
381   please include the operating system you're using, and the compiler
382   version.
383
384
385   <label id="option-W">
386   <tag><tt>-W name[,name]</tt></tag>
387
388   This option allows to control warnings generated by the compiler. It is
389   followed by a comma separated list of warnings that should be enabled or
390   disabled. To disable a warning, its name is prefixed by a minus sign. If
391   no such prefix exists, or the name is prefixed by a plus sign, the warning
392   is enabled.
393
394   The following warning names are currently recognized:
395   <descrip>
396   <tag><tt/error/</tag>
397         Treat all warnings as errors.
398   <tag><tt/unknown-pragma/</tag>
399         Warn about known #pragmas.
400   <tag><tt/unused-label/</tag>
401         Warn about unused labels.
402   <tag><tt/unused-param/</tag>
403         Warn about unused function parameters.
404   <tag><tt/unused-var/</tag>
405         Warn about unused variables.
406   </descrip>
407
408 </descrip><p>
409
410
411 <sect>Input and output<p>
412
413 The compiler will accept one C file per invocation and create a file with
414 the same base name, but with the extension replaced by ".s". The output
415 file contains assembler code suitable for the use with the ca65 macro
416 assembler.
417
418 Include files in single quotes are searched in the following places:
419 <enum>
420 <item>The current directory.
421 <item>The value of the environment variable <tt/CC65_INC/ if it is defined.
422 <item>Any directory added with the <tt/-I/ option on the command line.
423 </enum>
424
425 Include files in angle brackets are searched in the following places:
426 <enum>
427 <item>A compiled in directory which is often <tt>/usr/lib/cc65/include</tt> on
428       Linux systems.
429 <item>The value of the environment variable <tt/CC65_INC/ if it is defined.
430 <item>A subdirectory named <tt/include/ of the directory defined in the
431       environment variable <tt/CC65_HOME/, if it is defined.
432 <item>Any directory added with the <tt/-I/ option on the command line.
433 </enum>
434
435
436
437 <sect>Differences to the ISO standard<p>
438
439 Apart from the things listed below, the compiler does support additional
440 keywords, has several functions in the standard headers with names outside the
441 reserved namespace and a few syntax extensions. All these can be disabled with
442 the <tt><ref id="option--standard" name="--standard"></tt> command line
443 option. Its use for maximum standards compatibility is advised.
444
445 Here is a list of differences between the language, the compiler accepts,
446 and the one defined by the ISO standard:
447
448 <itemize>
449
450 <item>  The datatypes "float" and "double" are not available.
451         <p>
452 <item>  C Functions may not return structs (or unions), and structs may not
453         be passed as parameters by value. However, struct assignment *is*
454         possible.
455         <p>
456 <item>  Part of the C library is available only with fastcall calling
457         conventions (see below).  It means that you must not mix pointers to
458         those functions with pointers to user-written, not-fastcall functions.
459         <p>
460 <item>  The <tt/volatile/ keyword doesn't have an effect. This is not as bad
461         as it sounds, since the 6502 has so few registers that it isn't
462         possible to keep values in registers anyway.
463         <p>
464 </itemize>
465
466 There may be some more minor differences I'm currently not aware of. The
467 biggest problem is the missing float data type. With this limitation in
468 mind, you should be able to write fairly portable code.
469
470
471
472 <sect>Extensions<p>
473
474 This cc65 version has some extensions to the ISO C standard.
475
476 <itemize>
477
478 <item>  The compiler allows to insert assembler statements into the output
479         file. The syntax is
480
481         <tscreen><verb>
482         asm (&lt;string literal&gt;[, optional parameters]) ;
483         </verb></tscreen>
484         or
485         <tscreen><verb>
486         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
487         </verb></tscreen>
488
489         The first form is in the user namespace and is disabled if the <tt/-A/
490         switch is given.
491
492         There is a whole section covering inline assembler statements,
493         <ref id="inline-asm" name="see there">.
494         <p>
495
496 <item>  There is a special calling convention named "fastcall".
497         The syntax for a function declaration using fastcall is
498
499         <tscreen><verb>
500         &lt;return type&gt; fastcall &lt;function name&gt; (&lt;parameter list&gt;)
501         </verb></tscreen>
502         or
503         <tscreen><verb>
504         &lt;return type&gt; __fastcall__ &lt;function name&gt; (&lt;parameter list&gt;)
505         </verb></tscreen>
506         An example would be
507         <tscreen><verb>
508         void __fastcall__ f (unsigned char c)
509         </verb></tscreen>
510         The first form of the fastcall keyword is in the user namespace and can
511         therefore be disabled with the <tt><ref id="option--standard"
512         name="--standard"></tt> command line option.
513
514         For functions declared as <tt/fastcall/, the rightmost parameter is not
515         pushed on the stack but left in the primary register when the function
516         is called. This will reduce the cost when calling assembler functions
517         significantly, especially when the function itself is rather small.
518         <p>
519
520 <item>  There are two pseudo variables named <tt/__AX__/ and <tt/__EAX__/.
521         Both refer to the primary register that is used by the compiler to
522         evaluate expressions or return function results. <tt/__AX__/ is of
523         type <tt/unsigned int/ and <tt/__EAX__/ of type <tt/long unsigned int/
524         respectively. The pseudo variables may be used as lvalue and rvalue as
525         every other variable. They are most useful together with short
526         sequences of assembler code. For example, the macro
527
528         <tscreen><verb>
529         #define hi(x)           \
530             (__AX__ = (x),      \
531              asm ("txa"),       \
532              asm ("ldx #$00"),  \
533              __AX__)
534         </verb></tscreen>
535
536         will give the high byte of any unsigned value.
537         <p>
538
539 <item>  Inside a function, the identifier <tt/__func__/ gives the name of the
540         current function as a string. Outside of functions, <tt/__func__/ is
541         undefined.
542         Example:
543
544         <tscreen><verb>
545         #define PRINT_DEBUG(s)  printf ("%s: %s\n", __func__, s);
546         </verb></tscreen>
547
548         The macro will print the name of the current function plus a given
549         string.
550         <p>
551
552 <item>  cc65 allows the initialization of <tt/void/ variables. This may be
553         used to create variable structures that are more compatible with
554         interfaces written for assembler languages. Here is an example:
555
556         <tscreen><verb>
557         void GCmd = {   (char)3, (unsigned)0x2000, (unsigned)0x3000 };
558         </verb></tscreen>
559
560         This will be translated as follows:
561
562         <tscreen><verb>
563         _GCmd:
564                 .byte   3
565                 .word   $2000
566                 .word   $3000
567         </verb></tscreen>
568
569         Since the variable is of type <tt/void/ you may not use it as is.
570         However, taking the address of the variable results in a <tt/void*/
571         which may be passed to any function expecting a pointer.
572
573         See the <url url="geos.html" name="GEOS library document"> for examples
574         on how to use this feature.
575         <p>
576
577 <item>  cc65 implements flexible array struct members as defined in the C99 ISO
578         standard. As an extension, these fields may be initialized. There are
579         several exceptions, however (which is probably the reason why the
580         standard does not define this feature, because it is highly
581         unorthogonal). Flexible array members cannot be initialized ...
582
583         <itemize>
584         <item>... when defining an array of structs with flexible
585                 members.
586         <item>... if such a struct is a member field of another struct
587                 which is not the last field.
588         <item>... if the struct which contains a flexible array member is
589                 declared as <tt/register/, and the size and compiler settings
590                 do allow the compiler actually to place the struct into the
591                 register bank in the zero page.
592         </itemize>
593
594         Please note that -- as defined in the ISO C standard -- the <tt/sizeof/
595         operator returns the struct size with the flexible array member having
596         size zero, even if it is initialized.
597         <p>
598
599 </itemize>
600 <p>
601
602
603 <sect>Predefined macros<p>
604
605 The compiler defines several macros at startup:
606
607 <descrip>
608
609   <tag><tt>__CC65__</tt></tag>
610
611   This macro is always defined. Its value is the version number of the
612   compiler in hex.  For example, version 2.10.1 of the compiler has this macro
613   defined as <tt/0x02A1/.
614
615   <tag><tt>__APPLE2__</tt></tag>
616
617   This macro is defined if the target is the Apple ][ (-t apple2).
618
619   <tag><tt>__APPLE2ENH__</tt></tag>
620
621   This macro is defined if the target is the enhanced Apple //e (-t apple2enh).
622
623   <tag><tt>__ATARI__</tt></tag>
624
625   This macro is defined if the target is one of the Atari computers
626   (400/800/130XL/800XL).
627
628   <tag><tt>__ATMOS__</tt></tag>
629
630   This macro is defined if the target is the Oric Atmos (-t atmos).
631
632   <tag><tt>__CBM__</tt></tag>
633
634   This macro is defined if the target system is one of the CBM targets.
635
636   <tag><tt>__C16__</tt></tag>
637
638   This macro is defined if the target is the c16 (-t c16).
639
640   <tag><tt>__C64__</tt></tag>
641
642   This macro is defined if the target is the c64 (-t c64).
643
644   <tag><tt>__C128__</tt></tag>
645
646   This macro is defined if the target is the c128 (-t c128).
647
648   <tag><tt>__CBM510__</tt></tag>
649
650   This macro is defined if the target is the CBM 500 series of computers.
651
652   <tag><tt>__CBM610__</tt></tag>
653
654   This macro is defined if the target is one of the CBM 600/700 family of
655   computers (called B series in the US).
656
657   <tag><tt>__GEOS__</tt></tag>
658
659   This macro is defined if you are compiling for the GEOS system (-t geos).
660
661   <tag><tt>__LUNIX__</tt></tag>
662
663   This macro is defined if you are compiling for the LUnix system (-t lunix).
664
665   <tag><tt>__LYNX__</tt></tag>
666
667   This macro is defined if the target is the Atari Lynx (-t lynx).
668
669   <tag><tt>__NES__</tt></tag>
670
671   This macro is defined if the target is the NES (-t nes).
672
673   <tag><tt>__PET__</tt></tag>
674
675   This macro is defined if the target is the PET family of computers (-t pet).
676
677   <tag><tt>__PLUS4__</tt></tag>
678
679   This macro is defined if the target is the plus/4 (-t plus4).
680
681   <tag><tt>__SUPERVISION__</tt></tag>
682
683   This macro is defined if the target is the supervision (-t supervision).
684
685   <tag><tt>__VIC20__</tt></tag>
686
687   This macro is defined if the target is the vic20 (-t vic20).
688
689   <tag><tt>__FILE__</tt></tag>
690
691   This macro expands to a string containing the name of the C source file.
692
693   <tag><tt>__LINE__</tt></tag>
694
695   This macro expands to the current line number.
696
697   <tag><tt>__CC65_STD__</tt></tag>
698
699   This macro is defined to one of the following depending on the <tt><ref
700   id="option--standard" name="--standard"></tt> command line option:
701   <itemize>
702   <item><tt/__CC65_STD_C89__/
703   <item><tt/__CC65_STD_C99__/
704   <item><tt/__CC65_STD_CC65__/
705   </itemize>
706
707   <tag><tt>__OPT__</tt></tag>
708
709   Is defined if the compiler was called with the <tt/-O/ command line option.
710
711   <tag><tt>__OPT_i__</tt></tag>
712
713   Is defined if the compiler was called with the <tt/-Oi/ command line option.
714
715   <tag><tt>__OPT_r__</tt></tag>
716
717   Is defined if the compiler was called with the <tt/-Or/ command line option.
718
719   <tag><tt>__OPT_s__</tt></tag>
720
721   Is defined if the compiler was called with the <tt/-Os/ command line option.
722
723 </descrip>
724
725
726 <sect>&num;pragmas<label id="pragmas"><p>
727
728 The compiler understands some pragmas that may be used to change code
729 generation and other stuff. Some of these pragmas understand a special form:
730 If the first parameter is <tt/push/, the old value is saved onto a stack
731 before changing it. The value may later be restored by using the <tt/pop/
732 parameter with the <tt/#pragma/.
733
734 <sect1><tt>#pragma bssseg (&lsqb;push,&rsqb; &lt;name&gt;)</tt><p>
735
736   This pragma changes the name used for the BSS segment (the BSS segment
737   is used to store uninitialized data). The argument is a string enclosed
738   in double quotes.
739
740   Note: The default linker configuration file does only map the standard
741   segments. If you use other segments, you have to create a new linker
742   configuration file.
743
744   Beware: The startup code will zero only the default BSS segment. If you
745   use another BSS segment, you have to do that yourself, otherwise
746   uninitialized variables do not have the value zero.
747
748   The <tt/#pragma/ understands the push and pop parameters as explained above.
749
750   Example:
751   <tscreen><verb>
752         #pragma bssseg ("MyBSS")
753   </verb></tscreen>
754
755
756 <sect1><tt>#pragma charmap (&lt;index&gt;, &lt;code&gt;)</tt><p>
757
758   Each literal string and each literal character in the source is translated
759   by use of a translation table. This translation table is preset when the
760   compiler is started depending on the target system, for example to map
761   ISO-8859-1 characters into PETSCII if the target is a commodore machine.
762
763   This pragma allows to change entries in the translation table, so the
764   translation for individual characters, or even the complete table may be
765   adjusted.
766
767   Both arguments are assumed to be unsigned characters with a valid range of
768   1-255.
769
770   Beware of two pitfalls:
771
772     <itemize>
773     <item>The character index is actually the code of the character in the
774           C source, so character mappings do always depend on the source
775           character set. This means that <tt/#pragma&nbsp;charmap/ is not
776           portable -- it depends on the build environment.
777     <item>While it is possible to use character literals as indices, the
778           result may be somewhat unexpected, since character literals are
779           itself translated. For this reason I would suggest to avoid
780           character literals and use numeric character codes instead.
781     </itemize>
782
783   Example:
784   <tscreen><verb>
785         /* Use a space wherever an 'a' occurs in ISO-8859-1 source */
786         #pragma charmap (0x61, 0x20);
787   </verb></tscreen>
788
789
790 <sect1><tt>#pragma checkstack ([push,] on|off)</tt><label id="pragma-checkstack"><p>
791
792   Tells the compiler to insert calls to a stack checking subroutine to detect
793   stack overflows. The stack checking code will lead to somewhat larger and
794   slower programs, so you may want to use this pragma when debugging your
795   program and switch it off for the release version. If a stack overflow is
796   detected, the program is aborted.
797
798   If the argument is "off", stack checks are disabled (the default), otherwise
799   they're enabled.
800
801   The <tt/#pragma/ understands the push and pop parameters as explained above.
802
803 <sect1><tt>#pragma codeseg ([push,] &lt;name&gt;)</tt><p>
804
805   This pragma changes the name used for the CODE segment (the CODE segment
806   is used to store executable code). The argument is a string enclosed in
807   double quotes.
808
809   Note: The default linker configuration file does only map the standard
810   segments. If you use other segments, you have to create a new linker
811   configuration file.
812
813   The <tt/#pragma/ understands the push and pop parameters as explained above.
814
815   Example:
816   <tscreen><verb>
817         #pragma codeseg ("MyCODE")
818   </verb></tscreen>
819
820
821 <sect1><tt>#pragma codesize ([push,] &lt;int&gt;)</tt><label id="pragma-codesize"><p>
822
823   This pragma allows finer control about speed vs. size decisions in the code
824   generation and optimization phase. It gives the allowed size increase factor
825   (in percent). The default is can be changed by use of the <tt/<ref
826   id="option-codesize" name="--codesize">/ compiler option.
827
828   The <tt/#pragma/ understands the push and pop parameters as explained above.
829
830
831 <sect1><tt>#pragma dataseg ([push,] &lt;name&gt;)</tt><p>
832
833   This pragma changes the name used for the DATA segment (the DATA segment
834   is used to store initialized data). The argument is a string enclosed in
835   double quotes.
836
837   Note: The default linker configuration file does only map the standard
838   segments. If you use other segments, you have to create a new linker
839   configuration file.
840
841   The <tt/#pragma/ understands the push and pop parameters as explained above.
842
843   Example:
844   <tscreen><verb>
845         #pragma dataseg ("MyDATA")
846   </verb></tscreen>
847
848
849 <sect1><tt>#pragma optimize ([push,] on|off)</tt><label id="pragma-optimize"><p>
850
851   Switch optimization on or off. If the argument is "off", optimization is
852   disabled, otherwise it is enabled. Please note that this pragma only effects
853   whole functions. The setting in effect when the function is encountered will
854   determine if the generated code is optimized or not.
855
856   Optimization and code generation is also controlled by the <ref
857   id="pragma-codesize" name="codesize pragma">.
858
859   The default is "off", but may be changed with the <tt/<ref name="-O"
860   id="option-O">/ compiler option.
861
862   The <tt/#pragma/ understands the push and pop parameters as explained above.
863
864
865 <sect1><tt>#pragma rodataseg ([push,] &lt;name&gt;)</tt><p>
866
867   This pragma changes the name used for the RODATA segment (the RODATA
868   segment is used to store readonly data). The argument is a string
869   enclosed in double quotes.
870
871   Note: The default linker configuration file does only map the standard
872   segments. If you use other segments, you have to create a new linker
873   configuration file.
874
875   The <tt/#pragma/ understands the push and pop parameters as explained above.
876
877   Example:
878   <tscreen><verb>
879         #pragma rodataseg ("MyRODATA")
880   </verb></tscreen>
881
882
883 <sect1><tt>#pragma regvaraddr ([push,] on|off)</tt><p>
884
885   The compiler does not allow to take the address of register variables.
886   The regvaraddr pragma changes this. Taking the address of a register
887   variable is allowed after using this pragma with "on" as argument.
888   Using "off" as an argument switches back to the default behaviour.
889
890   Beware: The C standard does not allow taking the address of a variable
891   declared as register. So your programs become non-portable if you use
892   this pragma. In addition, your program may not work. This is usually the
893   case if a subroutine is called with the address of a register variable,
894   and this subroutine (or a subroutine called from there) uses
895   register variables. So be careful with this #pragma.
896
897   The <tt/#pragma/ understands the push and pop parameters as explained above.
898
899   Example:
900   <tscreen><verb>
901         #pragma regvaraddr(on)  /* Allow taking the address
902                                  * of register variables
903                                  */
904   </verb></tscreen>
905
906
907 <sect1><tt>#pragma regvars ([push,] on|off)</tt><label id="pragma-regvars"><p>
908
909   Enables or disables use of register variables. If register variables are
910   disabled (the default), the <tt/register/ keyword is ignored. Register
911   variables are explained in more detail in <ref id="regvars" name="a separate
912   chapter">.
913
914   The <tt/#pragma/ understands the push and pop parameters as explained above.
915
916
917 <sect1><tt>#pragma signedchars ([push,] on|off)</tt><label id="pragma-signedchars"><p>
918
919   Changes the signedness of the default character type. If the argument is
920   "on", default characters are signed, otherwise characters are unsigned.
921   The compiler default is to make characters unsigned since this creates a
922   lot better code. This default may be overridden by the <tt/--signed-chars/
923   command line option.
924
925   The <tt/#pragma/ understands the push and pop parameters as explained above.
926
927
928 <sect1><tt>#pragma staticlocals ([push,] on|off)</tt><label id="pragma-staticlocals"<p>
929
930   Use variables in the bss segment instead of variables on the stack. This
931   pragma changes the default set by the compiler option <tt/-Cl/. If the
932   argument is "on", local variables are allocated in the BSS segment,
933   leading to shorter and in most cases faster, but non-reentrant code.
934
935   The <tt/#pragma/ understands the push and pop parameters as explained above.
936
937
938 <sect1><tt>#pragma warn (name, [push,] on|off)</tt><label id="pragma-warn"><p>
939
940   Switch compiler warnings on or off. "name" is the name of a warning (see the
941   <tt/<ref name="-W" id="option-W">/ compiler option for a list). The name is
942   either followed by "pop", which restores the last pushed state, or by "on" or
943   "off", optionally preceeded by "push" to push the current state before
944   changing it.
945
946
947 <sect1><tt>#pragma zpsym (&lt;name&gt;)</tt><p>
948
949   Tell the compiler that the -- previously as external declared -- symbol with
950   the given name is a zero page symbol (usually from an assembler file).
951   The compiler will create a matching import declaration for the assembler.
952
953   Example:
954   <tscreen><verb>
955         extern int foo;
956         #pragma zpsym ("foo");  /* foo is in the zeropage */
957   </verb></tscreen>
958
959
960
961
962 <sect>Register variables<label id="regvars"><p>
963
964 The runtime for all supported platforms has 6 bytes of zero page space
965 available for register variables (this could be increased, but I think it's a
966 good value). So you can declare register variables up to a total size of 6 per
967 function. The compiler will allocate register space on a "first come, first
968 served" base and convert any <tt/register/ declarations that exceed the
969 available register space silently to <tt/auto/. Parameters can also be
970 declared as <tt/register/, this will in fact give slightly shorter code than
971 using a register variable.
972
973 Since a function must save the current values of the registers on entry and
974 restore them on exit, there is an overhead associated with register variables,
975 and this overhead is quite high (about 20 bytes per variable). This means that
976 just declaring anything as <tt/register/ is not a good idea.
977
978 The best use for register variables are pointers, especially those that point
979 to structures. The magic number here is about 3 uses of a struct field: If the
980 function contains this number or even more, the generated code will be usually
981 shorter and faster when using a register variable for the struct pointer. The
982 reason for this is that the register variable can in many cases be used as a
983 pointer directly. Having a pointer in an auto variable means that this pointer
984 must first be copied into a zero page location, before it can be dereferenced.
985
986 Second best use for register variables are counters. However, there is not
987 much difference in the code generated for counters, so you will need at least
988 100 operations on this variable (for example in a loop) to make it worth the
989 trouble. The only savings you get here are by the use of a zero page variable
990 instead of one on the stack or in the data segment.
991
992 Register variables must be explicitly enabled by using <tt/-Or/ or <tt/-r/ on
993 the command line. Register variables are only accepted on function top level,
994 register variables declared in interior blocks are silently converted to
995 <tt/auto/. With register variables disabled, all variables declared as
996 <tt/register/ are actually auto variables.
997
998 Please take care when using register variables: While they are helpful and can
999 lead to a tremendous speedup when used correctly, improper usage will cause
1000 bloated code and a slowdown.
1001
1002
1003
1004 <sect>Inline assembler<label id="inline-asm"><p>
1005
1006 The compiler allows to insert assembler statements into the output file. The
1007 syntax is
1008
1009 <tscreen><verb>
1010         asm (&lt;string literal&gt;[, optional parameters]) ;
1011 </verb></tscreen>
1012 or
1013 <tscreen><verb>
1014         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
1015 </verb></tscreen>
1016 <p>
1017
1018 The first form is in the user namespace and is disabled by <tt><ref
1019 id="option--standard" name="--standard"></tt> if the argument is not <tt/cc65/.
1020
1021 The asm statement may be used inside a function and on global file level. An
1022 inline assembler statement is a primary expression, so it may also be used as
1023 part of an expression. Please note however that the result of an expression
1024 containing just an inline assembler statement is always of type <tt/void/.
1025
1026 The contents of the string literal are preparsed by the compiler and inserted
1027 into the generated assembly output, so that the can be further processed by
1028 the backend and especially the optimizer. For this reason, the compiler does
1029 only allow regular 6502 opcodes to be used with the inline assembler. Pseudo
1030 instructions (like <tt/.import/, <tt/.byte/ and so on) are <em/not/ allowed,
1031 even if the ca65 assembler (which is used to translate the generated assembler
1032 code) would accept them. The builtin inline assembler is not a replacement for
1033 the full blown macro assembler which comes with the compiler.
1034
1035 Note: Inline assembler statements are subject to all optimizations done by the
1036 compiler. There is currently no way to protect an inline assembler statement
1037 from being moved or removed completely by the optimizer. If in doubt, check
1038 the generated assembler output, or disable optimizations.
1039
1040 The string literal may contain format specifiers from the following list. For
1041 each format specifier, an argument is expected which is inserted instead of
1042 the format specifier before passing the assembly code line to the backend.
1043
1044 <itemize>
1045   <item><tt/%b/ - Numerical 8-bit value
1046   <item><tt/%w/ - Numerical 16-bit value
1047   <item><tt/%l/ - Numerical 32-bit value
1048   <item><tt/%v/ - Assembler name of a (global) variable or function
1049   <item><tt/%o/ - Stack offset of a (local) variable
1050   <item><tt/%g/ - Assembler name of a C label
1051   <item><tt/%s/ - The argument is converted to a string
1052   <item><tt/%%/ - The % sign itself
1053 </itemize><p>
1054
1055 Using these format specifiers, you can access C <tt/#defines/, variables or
1056 similar stuff from the inline assembler. For example, to load the value of
1057 a C <tt/#define/ into the Y register, one would use
1058
1059 <tscreen><verb>
1060         #define OFFS  23
1061         __asm__ ("ldy #%b", OFFS);
1062 </verb></tscreen>
1063
1064 Or, to access a struct member of a static variable:
1065
1066 <tscreen><verb>
1067         typedef struct {
1068             unsigned char x;
1069             unsigned char y;
1070             unsigned char color;
1071         } pixel_t;
1072         static pixel_t pixel;
1073         __asm__ ("ldy #%b", offsetof(pixel_t, color));
1074         __asm__ ("lda %v,y", pixel);
1075 </verb></tscreen>
1076 <p>
1077
1078 Note: Do not embed the assembler labels that are used as names of global
1079 variables or functions into your asm statements. Code like this
1080
1081 <tscreen><verb>
1082         int foo;
1083         int bar () { return 1; }
1084         __asm__ ("lda _foo");           /* DON'T DO THAT! */
1085         ...
1086         __asm__ ("jsr _bar");           /* DON'T DO THAT EITHER! */
1087 </verb></tscreen>
1088 <p>
1089
1090 may stop working if the way, the compiler generates these names is changed in
1091 a future version. Instead use the format specifiers from the table above:
1092
1093 <tscreen><verb>
1094         __asm__ ("lda %v", foo);        /* OK */
1095         ...
1096         __asm__ ("jsr %v", bar);        /* OK */
1097 </verb></tscreen>
1098 <p>
1099
1100
1101 <sect>Implementation-defined behavior<p>
1102
1103 This section describes the behavior of cc65 when the standard describes the
1104 behavior as implementation-defined.
1105
1106 (to be done)
1107
1108 <sect>Bugs/Feedback<p>
1109
1110 If you have problems using the compiler, if you find any bugs, or if you're
1111 doing something interesting with it, I would be glad to hear from you. Feel
1112 free to contact me by email (<htmlurl url="mailto:uz@cc65.org"
1113 name="uz@cc65.org">).
1114
1115
1116
1117 <sect>Copyright<p>
1118
1119 This is the original compiler copyright:
1120
1121 <tscreen><verb>
1122 --------------------------------------------------------------------------
1123   -*- Mode: Text -*-
1124
1125      This is the copyright notice for RA65, LINK65, LIBR65, and other
1126   Atari 8-bit programs.  Said programs are Copyright 1989, by John R.
1127   Dunning.  All rights reserved, with the following exceptions:
1128
1129       Anyone may copy or redistribute these programs, provided that:
1130
1131   1:  You don't charge anything for the copy.  It is permissable to
1132       charge a nominal fee for media, etc.
1133
1134   2:  All source code and documentation for the programs is made
1135       available as part of the distribution.
1136
1137   3:  This copyright notice is preserved verbatim, and included in
1138       the distribution.
1139
1140       You are allowed to modify these programs, and redistribute the
1141   modified versions, provided that the modifications are clearly noted.
1142
1143       There is NO WARRANTY with this software, it comes as is, and is
1144   distributed in the hope that it may be useful.
1145
1146       This copyright notice applies to any program which contains
1147   this text, or the refers to this file.
1148
1149       This copyright notice is based on the one published by the Free
1150   Software Foundation, sometimes known as the GNU project.  The idea
1151   is the same as theirs, ie the software is free, and is intended to
1152   stay that way.  Everybody has the right to copy, modify, and re-
1153   distribute this software.  Nobody has the right to prevent anyone
1154   else from copying, modifying or redistributing it.
1155
1156 --------------------------------------------------------------------------
1157 </verb></tscreen>
1158
1159 Small parts of the compiler (parts of the preprocessor and main parser) are
1160 still covered by this copyright. The main portion is covered by the usual
1161 cc65 license, which reads:
1162
1163 This software is provided 'as-is', without any expressed or implied
1164 warranty.  In no event will the authors be held liable for any damages
1165 arising from the use of this software.
1166
1167 Permission is granted to anyone to use this software for any purpose,
1168 including commercial applications, and to alter it and redistribute it
1169 freely, subject to the following restrictions:
1170
1171 <enum>
1172 <item>  The origin of this software must not be misrepresented; you must not
1173         claim that you wrote the original software. If you use this software
1174         in a product, an acknowledgment in the product documentation would be
1175         appreciated but is not required.
1176 <item>  Altered source versions must be plainly marked as such, and must not
1177         be misrepresented as being the original software.
1178 <item>  This notice may not be removed or altered from any source
1179         distribution.
1180 </enum>
1181
1182 </article>
1183