]> git.sur5r.net Git - cc65/blob - doc/cc65.sgml
Few small changes. Started a new section about implementation-defined
[cc65] / doc / cc65.sgml
1 <!doctype linuxdoc system>
2
3 <article>
4 <title>cc65 Users Guide
5 <author>Ullrich von Bassewitz, <htmlurl url="mailto:uz@cc65.org" name="uz@cc65.org">
6 <date>03.09.2000, 02.10.2001, 2005-8-1
7
8 <abstract>
9 cc65 is a C compiler for 6502 targets. It supports several 6502 based home
10 computers like the Commodore and Atari machines, but it is easily retargetable.
11 </abstract>
12
13 <!-- Table of contents -->
14 <toc>
15
16 <!-- Begin the document -->
17
18
19 <sect>Overview<p>
20
21 cc65 was originally a C compiler for the Atari 8-bit machines written by
22 John R. Dunning. In prior releases I've described the compiler by listing
23 up the changes made by me. I have made many more changes in the meantime
24 (and rewritten major parts of the compiler), so I will no longer do that,
25 since the list would be too large and of no use to anyone. Instead I will
26 describe the compiler in respect to the ANSI/ISO C standard. In fact, I'm
27 planning a complete rewrite (that is, a complete new compiler) for the
28 next release, since there are too many limitations in the current code,
29 and removing these limitations would mean a rewrite of many more parts of
30 the compiler.
31
32 There are separate documents named <url url="library.html"> and <url
33 url="funcref.html"> that cover the library that is available for the compiler.
34 If you know C, and are interested in doing actual programming, the library
35 documentation is probably of much more use than this document.
36
37 If you need some hints for getting the best code out of the compiler, you
38 may have a look at <url url="coding.html"> which covers some code generation
39 issues.
40
41
42
43 <sect>Usage<p>
44
45 The compiler translates C files into files containing assembly code that
46 may be translated by the ca65 macroassembler (for more information about
47 the assembler, have a look at <url url="ca65.html">).
48
49
50 <sect1>Command line option overview<p>
51
52 The compiler may be called as follows:
53
54 <tscreen><verb>
55 ---------------------------------------------------------------------------
56 Usage: cc65 [options] file
57 Short options:
58   -Cl                   Make local variables static
59   -Dsym[=defn]          Define a symbol
60   -I dir                Set an include directory search path
61   -O                    Optimize code
62   -Oi                   Optimize code, inline more code
63   -Or                   Enable register variables
64   -Os                   Inline some known functions
65   -T                    Include source as comment
66   -V                    Print the compiler version number
67   -W                    Suppress warnings
68   -d                    Debug mode
69   -g                    Add debug info to object file
70   -h                    Help (this text)
71   -j                    Default characters are signed
72   -o name               Name the output file
73   -r                    Enable register variables
74   -t sys                Set the target system
75   -v                    Increase verbosity
76
77 Long options:
78   --add-source          Include source as comment
79   --bss-name seg        Set the name of the BSS segment
80   --check-stack         Generate stack overflow checks
81   --code-name seg       Set the name of the CODE segment
82   --codesize x          Accept larger code by factor x
83   --cpu type            Set cpu type
84   --create-dep          Create a make dependency file
85   --data-name seg       Set the name of the DATA segment
86   --debug               Debug mode
87   --debug-info          Add debug info to object file
88   --forget-inc-paths    Forget include search paths
89   --help                Help (this text)
90   --include-dir dir     Set an include directory search path
91   --register-space b    Set space available for register variables
92   --register-vars       Enable register variables
93   --rodata-name seg     Set the name of the RODATA segment
94   --signed-chars        Default characters are signed
95   --standard std        Language standard (c89, c99, cc65)
96   --static-locals       Make local variables static
97   --target sys          Set the target system
98   --verbose             Increase verbosity
99   --version             Print the compiler version number
100   --writable-strings    Make string literals writable
101 ---------------------------------------------------------------------------
102 </verb></tscreen>
103
104
105 <sect1>Command line options in detail<p>
106
107 Here is a description of all the command line options:
108
109 <descrip>
110
111   <tag><tt>--bss-name seg</tt></tag>
112
113   Set the name of the bss segment.
114
115
116   <tag><tt>--check-stack</tt></tag>
117
118   Tells the compiler to generate code that checks for stack overflows. See
119   <tt><ref id="pragma-checkstack" name="#pragma&nbsp;checkstack"></tt> for an
120   explanation of this feature.
121
122
123   <tag><tt>--code-name seg</tt></tag>
124
125   Set the name of the code segment.
126
127
128   <label id="option-codesize">
129   <tag><tt>--codesize x</tt></tag>
130
131   This options allows finer control about speed vs. size decisions in the code
132   generation and optimization phases. It gives the allowed size increase
133   factor (in percent). The default is 100 when not using <tt/-Oi/ and 200 when
134   using <tt/-Oi/ (<tt/-Oi/ is the same as <tt/--codesize&nbsp;200/).
135
136
137   <tag><tt>--cpu CPU</tt></tag>
138
139   A new, still experimental option. You may specify "6502" or "65C02" as
140   the CPU. 6502 is the default, so this will not change anything.
141   Specifying 65C02 will use a few 65C02 instructions when generating code.
142   Don't expect too much from this option: It is still new (and may have
143   bugs), and the additional instructions for the 65C02 are not that
144   overwhelming.
145
146
147   <tag><tt>--create-dep</tt></tag>
148
149   Tells the compiler to generate a file containing the dependency list for
150   the compiled module in makefile syntax. The file is named as the C input
151   file with the extension replaced by <tt/.u/.
152
153
154   <tag><tt>-d, --debug</tt></tag>
155
156   Enables debug mode, something that should not be needed for mere
157   mortals:-)
158
159
160   <tag><tt>-D sym[=definition]</tt></tag>
161
162   Define a macro on the command line. If no definition is given, the macro
163   is defined to the value "1".
164
165
166   <tag><tt>--forget-inc-paths</tt></tag>
167
168   Forget the builtin include paths. This is most useful when building
169   customized C or runtime libraries, in which case the standard header
170   files should be ignored.
171
172
173   <tag><tt>-g, --debug-info</tt></tag>
174
175   This will cause the compiler to insert a <tt/.DEBUGINFO/ command into the
176   generated assembler code. This will cause the assembler to include all
177   symbols in a special section in the object file.
178
179
180   <tag><tt>-h, --help</tt></tag>
181
182   Print the short option summary shown above.
183
184
185   <tag><tt>-o name</tt></tag>
186
187   Specify the name of the output file. If you don't specify a name, the
188   name of the C input file is used, with the extension replaced by ".s".
189
190
191   <tag><tt>-r, --register-vars</tt></tag>
192
193   <tt/-r/ will make the compiler honor the <tt/register/ keyword. Local
194   variables may be placed in registers (which are actually zero page
195   locations). There is some overhead involved with register variables, since
196   the old contents of the registers must be saved and restored. Since register
197   variables are of limited use without the optimizer, there is also a combined
198   switch: <tt/-Or/ will enable both, the optimizer and register variables.
199
200   For more information about register variables see <ref id="regvars"
201   name="register variables">.
202
203   The compiler setting can also be changed within the source file by using
204   <tt><ref id="pragma-regvars" name="#pragma&nbsp;regvars"></tt>.
205
206
207   <tag><tt>--register-space</tt></tag>
208
209   This option takes a numeric parameter and is used to specify, how much
210   zero page register space is available. Please note that just giving this
211   option will not increase or decrease by itself, it will just tell the
212   compiler about the available space. You will have to allocate that space
213   yourself using an assembler module with the necessary allocations, and a
214   linker configuration that matches the assembler module. The default value
215   for this option is 6 (bytes).
216
217   If you don't know what all this means, please don't use this option.
218
219
220   <tag><tt>--rodata-name seg</tt></tag>
221
222   Set the name of the rodata segment (the segment used for readonly data).
223
224
225   <tag><tt>-j, --signed-chars</tt></tag>
226
227   Using this option, you can make the default characters signed. Since the
228   6502 has no provisions for sign extending characters (which is needed on
229   almost any load operation), this will make the code larger and slower. A
230   better way is to declare characters explicitly as "signed" if needed. You
231   can also use <tt><ref id="pragma-signedchars"
232   name="#pragma&nbsp;signedchars"></tt> for better control of this option.
233
234
235   <label id="option--standard">
236   <tag><tt>--standard std</tt></tag>
237
238   This option allows to set the language standard supported. The argument is
239   one of
240   <itemize>
241   <item>c89
242   <item>c99
243   <item>cc65
244   </itemize>
245
246   Please note that the compiler does not support the c99 standard and never
247   will. c99 mode is actually c89 mode with a few selected c99 extensions
248   (// comments for example).
249
250
251   <tag><tt>-t target, --target target</tt></tag>
252
253   This option is used to set the target system. The target system
254   determines things like the character set that is used for strings and
255   character constants. The following target systems are supported:
256
257   <itemize>
258   <item>none
259   <item>apple2
260   <item>apple2enh
261   <item>atari
262   <item>atmos
263   <item>c16 (works also for the c116 with memory up to 32K)
264   <item>c64
265   <item>c128
266   <item>cbm510 (CBM-II series with 40 column video)
267   <item>cbm610 (all CBM-II II computers with 80 column video)
268   <item>geos
269   <item>lunix
270   <item>lynx
271   <item>nes
272   <item>pet (all CBM PET systems except the 2001)
273   <item>plus4
274   <item>supervision
275   <item>vic20
276   </itemize>
277
278   <tag><tt>-v, --verbose</tt></tag>
279
280   Using this option, the compiler will be somewhat more verbose if errors
281   or warnings are encountered.
282
283
284   <tag><tt>--writable-strings</tt></tag>
285
286   Make string literals writable by placing them into the data segment instead
287   of the rodata segment.
288
289
290   <tag><tt>-Cl, --static-locals</tt></tag>
291
292   Use static storage for local variables instead of storage on the stack.
293   Since the stack is emulated in software, this gives shorter and usually
294   faster code, but the code is no longer reentrant. The difference between
295   <tt/-Cl/ and declaring local variables as static yourself is, that
296   initializer code is executed each time, the function is entered. So when
297   using
298
299   <tscreen><verb>
300         void f (void)
301         {
302             unsigned a = 1;
303             ...
304         }
305   </verb></tscreen>
306
307   the variable <tt/a/ will always have the value <tt/1/ when entering the
308   function and using <tt/-Cl/, while in
309
310   <tscreen><verb>
311         void f (void)
312         {
313             static unsigned a = 1;
314             ....
315         }
316   </verb></tscreen>
317
318   the variable <tt/a/ will have the value <tt/1/ only the first time that the
319   function is entered, and will keep the old value from one call of the
320   function to the next.
321
322   You may also use <tt><ref id="pragma-staticlocals"
323   name="#pragma&nbsp;staticlocals"></tt> to change this setting in your
324   sources.
325
326
327   <tag><tt>-I dir, --include-dir dir</tt></tag>
328
329   Set a directory where the compiler searches for include files. You may
330   use this option multiple times to add more than one directory to the
331   search list.
332
333
334   <label id="option-O">
335   <tag><tt>-O, -Oi, -Or, -Os</tt></tag>
336
337   Enable an optimizer run over the produced code.
338
339   Using <tt/-Oi/, the code generator will inline some code where otherwise a
340   runtime functions would have been called, even if the generated code is
341   larger. This will not only remove the overhead for a function call, but will
342   make the code visible for the optimizer. <tt/-Oi/ is an alias for
343   <tt/--codesize&nbsp;200/.
344
345   <tt/-Or/ will make the compiler honor the <tt/register/ keyword. Local
346   variables may be placed in registers (which are actually zero page
347   locations). There is some overhead involved with register variables, since
348   the old contents of the registers must be saved and restored. In addition,
349   the current implementation does not make good use of register variables, so
350   using <tt/-Or/ may make your program even slower and larger. Use with care!
351
352   Using <tt/-Os/ will force the compiler to inline some known functions from
353   the C library like strlen. Note: This has two consequences:
354   <p>
355   <itemize>
356   <item>You may not use names of standard C functions in your own code. If you
357         do that, your program is not standard compliant anyway, but using
358         <tt/-Os/ will actually break things.
359         <p>
360   <item>The inlined string and memory functions will not handle strings or
361         memory areas larger than 255 bytes. Similarly, the inlined <tt/is..()/
362         functions will not work with values outside the char. range (such as
363         <tt/EOF/).
364         <p>
365   </itemize>
366   <p>
367   It is possible to concatenate the modifiers for <tt/-O/. For example, to
368   enable register variables and inlining of known functions, you may use
369   <tt/-Ors/.
370
371
372   <tag><tt>-T, --add-source</tt></tag>
373
374   This include the source code as comments in the generated code. This is
375   normally not needed.
376
377
378   <tag><tt>-V, --version</tt></tag>
379
380   Print the version number of the compiler. When submitting a bug report,
381   please include the operating system you're using, and the compiler
382   version.
383
384
385   <label id="option-W">
386   <tag><tt>-W</tt></tag>
387
388   This option will suppress any warnings generated by the compiler. Since
389   any source file may be written in a manner that it will not produce
390   compiler warnings, using this option is usually not a good idea.
391
392 </descrip><p>
393
394
395 <sect>Input and output<p>
396
397 The compiler will accept one C file per invocation and create a file with
398 the same base name, but with the extension replaced by ".s". The output
399 file contains assembler code suitable for the use with the ca65 macro
400 assembler.
401
402 In addition to the paths named in the <tt/-I/ option on the command line, the
403 directory named in the environment variable <tt/CC65_INC/ is added to the
404 search path for include files on startup.
405
406
407
408 <sect>Differences to the ISO standard<p>
409
410 Apart from the things listed below, the compiler does support additional
411 keywords, has several functions in the standard headers with names outside the
412 reserved namespace and a few syntax extensions. All these can be disabled with
413 the <tt><ref id="option--standard" name="--standard"></tt> command line
414 option. Its use for maximum standards compatibility is advised.
415
416 Here is a list of differences between the language, the compiler accepts,
417 and the one defined by the ISO standard:
418
419 <itemize>
420
421 <item>  The datatypes "float" and "double" are not available.
422         <p>
423 <item>  C Functions may not return structs (or unions), and structs may not
424         be passed as parameters by value. However, struct assignment *is*
425         possible.
426         <p>
427 <item>  Part of the C library is available only with fastcall calling
428         conventions (see below).  It means that you must not mix pointers to
429         those functions with pointers to user-written, not-fastcall functions.
430         <p>
431 </itemize>
432
433 There may be some more minor differences I'm currently not aware of. The
434 biggest problem is the missing float data type. With this limitation in
435 mind, you should be able to write fairly portable code.
436
437
438
439 <sect>Extensions<p>
440
441 This cc65 version has some extensions to the ISO C standard.
442
443 <itemize>
444
445 <item>  The compiler allows to insert assembler statements into the output
446         file. The syntax is
447
448         <tscreen><verb>
449         asm (&lt;string literal&gt;[, optional parameters]) ;
450         </verb></tscreen>
451         or
452         <tscreen><verb>
453         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
454         </verb></tscreen>
455
456         The first form is in the user namespace and is disabled if the <tt/-A/
457         switch is given.
458
459         There is a whole section covering inline assembler statements,
460         <ref id="inline-asm" name="see there">.
461         <p>
462
463 <item>  There is a special calling convention named "fastcall".
464         The syntax for a function declaration using fastcall is
465
466         <tscreen><verb>
467         &lt;return type&gt; fastcall &lt;function name&gt; (&lt;parameter list&gt;)
468         </verb></tscreen>
469         or
470         <tscreen><verb>
471         &lt;return type&gt; __fastcall__ &lt;function name&gt; (&lt;parameter list&gt;)
472         </verb></tscreen>
473         An example would be
474         <tscreen><verb>
475         void __fastcall__ f (unsigned char c)
476         </verb></tscreen>
477         The first form of the fastcall keyword is in the user namespace and can
478         therefore be disabled with the <tt><ref id="option--standard"
479         name="--standard"></tt> command line option.
480
481         For functions declared as <tt/fastcall/, the rightmost parameter is not
482         pushed on the stack but left in the primary register when the function
483         is called. This will reduce the cost when calling assembler functions
484         significantly, especially when the function itself is rather small.
485         <p>
486
487 <item>  There are two pseudo variables named <tt/__AX__/ and <tt/__EAX__/.
488         Both refer to the primary register that is used by the compiler to
489         evaluate expressions or return function results. <tt/__AX__/ is of
490         type <tt/unsigned int/ and <tt/__EAX__/ of type <tt/long unsigned int/
491         respectively. The pseudo variables may be used as lvalue and rvalue as
492         every other variable. They are most useful together with short
493         sequences of assembler code. For example, the macro
494
495         <tscreen><verb>
496         #define hi(x)           \
497             (__AX__ = (x),      \
498              asm ("txa"),       \
499              asm ("ldx #$00"),  \
500              __AX__)
501         </verb></tscreen>
502
503         will give the high byte of any unsigned value.
504         <p>
505
506 <item>  Inside a function, the identifier <tt/__func__/ gives the name of the
507         current function as a string. Outside of functions, <tt/__func__/ is
508         undefined.
509         Example:
510
511         <tscreen><verb>
512         #define PRINT_DEBUG(s)  printf ("%s: %s\n", __func__, s);
513         </verb></tscreen>
514
515         The macro will print the name of the current function plus a given
516         string.
517         <p>
518
519 <item>  cc65 allows the initialization of <tt/void/ variables. This may be
520         used to create variable structures that are more compatible with
521         interfaces written for assembler languages. Here is an example:
522
523         <tscreen><verb>
524         void GCmd = {   (char)3, (unsigned)0x2000, (unsigned)0x3000 };
525         </verb></tscreen>
526
527         This will be translated as follows:
528
529         <tscreen><verb>
530         _GCmd:
531                 .byte   3
532                 .word   $2000
533                 .word   $3000
534         </verb></tscreen>
535
536         Since the variable is of type <tt/void/ you may not use it as is.
537         However, taking the address of the variable results in a <tt/void*/
538         which may be passed to any function expecting a pointer.
539
540         See the <url url="geos.html" name="GEOS library document"> for examples
541         on how to use this feature.
542         <p>
543
544 <item>  cc65 implements flexible array struct members as defined in the C99 ISO
545         standard. As an extension, these fields may be initialized. There are
546         several exceptions, however (which is probably the reason why the
547         standard does not define this feature, because it is highly
548         unorthogonal). Flexible array members cannot be initialized ...
549
550         <itemize>
551         <item>... when defining an array of structs with flexible
552                 members.
553         <item>... if such a struct is a member field of another struct
554                 which is not the last field.
555         <item>... if the struct which contains a flexible array member is
556                 declared as <tt/register/, and the size and compiler settings
557                 do allow the compiler actually to place the struct into the
558                 register bank in the zero page.
559         </itemize>
560
561         Please note that -- as defined in the ISO C standard -- the <tt/sizeof/
562         operator returns the struct size with the flexible array member having
563         size zero, even if it is initialized.
564         <p>
565
566 </itemize>
567 <p>
568
569
570 <sect>Predefined macros<p>
571
572 The compiler defines several macros at startup:
573
574 <descrip>
575
576   <tag><tt>__CC65__</tt></tag>
577
578   This macro is always defined. Its value is the version number of the
579   compiler in hex.  For example, version 2.10.1 of the compiler has this macro
580   defined as <tt/0x02A1/.
581
582   <tag><tt>__APPLE2__</tt></tag>
583
584   This macro is defined if the target is the Apple ][ (-t apple2).
585
586   <tag><tt>__APPLE2ENH__</tt></tag>
587
588   This macro is defined if the target is the enhanced Apple //e (-t apple2enh).
589
590   <tag><tt>__ATARI__</tt></tag>
591
592   This macro is defined if the target is one of the Atari computers
593   (400/800/130XL/800XL).
594
595   <tag><tt>__ATMOS__</tt></tag>
596
597   This macro is defined if the target is the Oric Atmos (-t atmos).
598
599   <tag><tt>__CBM__</tt></tag>
600
601   This macro is defined if the target system is one of the CBM targets.
602
603   <tag><tt>__C16__</tt></tag>
604
605   This macro is defined if the target is the c16 (-t c16).
606
607   <tag><tt>__C64__</tt></tag>
608
609   This macro is defined if the target is the c64 (-t c64).
610
611   <tag><tt>__C128__</tt></tag>
612
613   This macro is defined if the target is the c128 (-t c128).
614
615   <tag><tt>__CBM510__</tt></tag>
616
617   This macro is defined if the target is the CBM 500 series of computers.
618
619   <tag><tt>__CBM610__</tt></tag>
620
621   This macro is defined if the target is one of the CBM 600/700 family of
622   computers (called B series in the US).
623
624   <tag><tt>__GEOS__</tt></tag>
625
626   This macro is defined if you are compiling for the GEOS system (-t geos).
627
628   <tag><tt>__LUNIX__</tt></tag>
629
630   This macro is defined if you are compiling for the LUnix system (-t lunix).
631
632   <tag><tt>__LYNX__</tt></tag>
633
634   This macro is defined if the target is the Atari Lynx (-t lynx).
635
636   <tag><tt>__NES__</tt></tag>
637
638   This macro is defined if the target is the NES (-t nes).
639
640   <tag><tt>__PET__</tt></tag>
641
642   This macro is defined if the target is the PET family of computers (-t pet).
643
644   <tag><tt>__PLUS4__</tt></tag>
645
646   This macro is defined if the target is the plus/4 (-t plus4).
647
648   <tag><tt>__SUPERVISION__</tt></tag>
649
650   This macro is defined if the target is the supervision (-t supervision).
651
652   <tag><tt>__VIC20__</tt></tag>
653
654   This macro is defined if the target is the vic20 (-t vic20).
655
656   <tag><tt>__FILE__</tt></tag>
657
658   This macro expands to a string containing the name of the C source file.
659
660   <tag><tt>__LINE__</tt></tag>
661
662   This macro expands to the current line number.
663
664   <tag><tt>__CC65_STD__</tt></tag>
665
666   This macro is defined to one of the following depending on the <tt><ref
667   id="option--standard" name="--standard"></tt> command line option:
668   <itemize>
669   <item><tt/__CC65_STD_C89__/
670   <item><tt/__CC65_STD_C99__/
671   <item><tt/__CC65_STD_CC65__/
672   </itemize>
673
674   <tag><tt>__OPT__</tt></tag>
675
676   Is defined if the compiler was called with the <tt/-O/ command line option.
677
678   <tag><tt>__OPT_i__</tt></tag>
679
680   Is defined if the compiler was called with the <tt/-Oi/ command line option.
681
682   <tag><tt>__OPT_r__</tt></tag>
683
684   Is defined if the compiler was called with the <tt/-Or/ command line option.
685
686   <tag><tt>__OPT_s__</tt></tag>
687
688   Is defined if the compiler was called with the <tt/-Os/ command line option.
689
690 </descrip>
691
692
693 <sect>&num;pragmas<label id="pragmas"><p>
694
695 The compiler understands some pragmas that may be used to change code
696 generation and other stuff. Some of these pragmas understand a special form:
697 If the first parameter is <tt/push/, the old value is saved onto a stack
698 before changing it. The value may later be restored by using the <tt/pop/
699 parameter with the <tt/#pragma/.
700
701 <sect1><tt>#pragma bssseg (&lsqb;push,&rsqb;&lt;name&gt;)</tt><p>
702
703   This pragma changes the name used for the BSS segment (the BSS segment
704   is used to store uninitialized data). The argument is a string enclosed
705   in double quotes.
706
707   Note: The default linker configuration file does only map the standard
708   segments. If you use other segments, you have to create a new linker
709   configuration file.
710
711   Beware: The startup code will zero only the default BSS segment. If you
712   use another BSS segment, you have to do that yourself, otherwise
713   uninitialized variables do not have the value zero.
714
715   The <tt/#pragma/ understands the push and pop parameters as explained above.
716
717   Example:
718   <tscreen><verb>
719         #pragma bssseg ("MyBSS")
720   </verb></tscreen>
721
722
723 <sect1><tt>#pragma charmap (&lt;index&gt;, &lt;code&gt;)</tt><p>
724
725   Each literal string and each literal character in the source is translated
726   by use of a translation table. This translation table is preset when the
727   compiler is started depending on the target system, for example to map
728   ISO-8859-1 characters into PETSCII if the target is a commodore machine.
729
730   This pragma allows to change entries in the translation table, so the
731   translation for individual characters, or even the complete table may be
732   adjusted.
733
734   Both arguments are assumed to be unsigned characters with a valid range of
735   1-255.
736
737   Beware of two pitfalls:
738
739     <itemize>
740     <item>The character index is actually the code of the character in the
741           C source, so character mappings do always depend on the source
742           character set. This means that <tt/#pragma&nbsp;charmap/ is not
743           portable -- it depends on the build environment.
744     <item>While it is possible to use character literals as indices, the
745           result may be somewhat unexpected, since character literals are
746           itself translated. For this reason I would suggest to avoid
747           character literals and use numeric character codes instead.
748     </itemize>
749
750   Example:
751   <tscreen><verb>
752         /* Use a space wherever an 'a' occurs in ISO-8859-1 source */
753         #pragma charmap (0x61, 0x20);
754   </verb></tscreen>
755
756
757 <sect1><tt>#pragma checkstack ([push,]on|off)</tt><label id="pragma-checkstack"><p>
758
759   Tells the compiler to insert calls to a stack checking subroutine to detect
760   stack overflows. The stack checking code will lead to somewhat larger and
761   slower programs, so you may want to use this pragma when debugging your
762   program and switch it off for the release version. If a stack overflow is
763   detected, the program is aborted.
764
765   If the argument is "off", stack checks are disabled (the default), otherwise
766   they're enabled.
767
768   The <tt/#pragma/ understands the push and pop parameters as explained above.
769
770 <sect1><tt>#pragma codeseg ([push,]&lt;name&gt;)</tt><p>
771
772   This pragma changes the name used for the CODE segment (the CODE segment
773   is used to store executable code). The argument is a string enclosed in
774   double quotes.
775
776   Note: The default linker configuration file does only map the standard
777   segments. If you use other segments, you have to create a new linker
778   configuration file.
779
780   The <tt/#pragma/ understands the push and pop parameters as explained above.
781
782   Example:
783   <tscreen><verb>
784         #pragma codeseg ("MyCODE")
785   </verb></tscreen>
786
787
788 <sect1><tt>#pragma codesize ([push,]&lt;int&gt;)</tt><label id="pragma-codesize"><p>
789
790   This pragma allows finer control about speed vs. size decisions in the code
791   generation and optimization phase. It gives the allowed size increase factor
792   (in percent). The default is can be changed by use of the <tt/<ref
793   id="option-codesize" name="--codesize">/ compiler option.
794
795   The <tt/#pragma/ understands the push and pop parameters as explained above.
796
797
798 <sect1><tt>#pragma dataseg ([push,]&lt;name&gt;)</tt><p>
799
800   This pragma changes the name used for the DATA segment (the DATA segment
801   is used to store initialized data). The argument is a string enclosed in
802   double quotes.
803
804   Note: The default linker configuration file does only map the standard
805   segments. If you use other segments, you have to create a new linker
806   configuration file.
807
808   The <tt/#pragma/ understands the push and pop parameters as explained above.
809
810   Example:
811   <tscreen><verb>
812         #pragma dataseg ("MyDATA")
813   </verb></tscreen>
814
815
816 <sect1><tt>#pragma optimize ([push,]on|off)</tt><label id="pragma-optimize"><p>
817
818   Switch optimization on or off. If the argument is "off", optimization is
819   disabled, otherwise it is enabled. Please note that this pragma only effects
820   whole functions. The setting in effect when the function is encountered will
821   determine if the generated code is optimized or not.
822
823   Optimization and code generation is also controlled by the <ref
824   id="pragma-codesize" name="codesize pragma">.
825
826   The default is "off", but may be changed with the <tt/<ref name="-O"
827   id="option-O">/ compiler option.
828
829   The <tt/#pragma/ understands the push and pop parameters as explained above.
830
831
832 <sect1><tt>#pragma rodataseg ([push,]&lt;name&gt;)</tt><p>
833
834   This pragma changes the name used for the RODATA segment (the RODATA
835   segment is used to store readonly data). The argument is a string
836   enclosed in double quotes.
837
838   Note: The default linker configuration file does only map the standard
839   segments. If you use other segments, you have to create a new linker
840   configuration file.
841
842   The <tt/#pragma/ understands the push and pop parameters as explained above.
843
844   Example:
845   <tscreen><verb>
846         #pragma rodataseg ("MyRODATA")
847   </verb></tscreen>
848
849
850 <sect1><tt>#pragma regvaraddr ([push,]on|off)</tt><p>
851
852   The compiler does not allow to take the address of register variables.
853   The regvaraddr pragma changes this. Taking the address of a register
854   variable is allowed after using this pragma with "on" as argument.
855   Using "off" as an argument switches back to the default behaviour.
856
857   Beware: The C standard does not allow taking the address of a variable
858   declared as register. So your programs become non-portable if you use
859   this pragma. In addition, your program may not work. This is usually the
860   case if a subroutine is called with the address of a register variable,
861   and this subroutine (or a subroutine called from there) uses
862   register variables. So be careful with this #pragma.
863
864   The <tt/#pragma/ understands the push and pop parameters as explained above.
865
866   Example:
867   <tscreen><verb>
868         #pragma regvaraddr(on)  /* Allow taking the address
869                                  * of register variables
870                                  */
871   </verb></tscreen>
872
873
874 <sect1><tt>#pragma regvars ([push,]on|off)</tt><label id="pragma-regvars"><p>
875
876   Enables or disables use of register variables. If register variables are
877   disabled (the default), the <tt/register/ keyword is ignored. Register
878   variables are explained in more detail in <ref id="regvars" name="a separate
879   chapter">.
880
881   The <tt/#pragma/ understands the push and pop parameters as explained above.
882
883
884 <sect1><tt>#pragma signedchars ([push,]on|off)</tt><label id="pragma-signedchars"><p>
885
886   Changes the signedness of the default character type. If the argument is
887   "on", default characters are signed, otherwise characters are unsigned.
888   The compiler default is to make characters unsigned since this creates a
889   lot better code. This default may be overridden by the <tt/--signed-chars/
890   command line option.
891
892   The <tt/#pragma/ understands the push and pop parameters as explained above.
893
894
895 <sect1><tt>#pragma staticlocals ([push,]on|off)</tt><label id="pragma-staticlocals"<p>
896
897   Use variables in the bss segment instead of variables on the stack. This
898   pragma changes the default set by the compiler option <tt/-Cl/. If the
899   argument is "on", local variables are allocated in the BSS segment,
900   leading to shorter and in most cases faster, but non-reentrant code.
901
902   The <tt/#pragma/ understands the push and pop parameters as explained above.
903
904
905 <sect1><tt>#pragma warn ([push,]on|off)</tt><label id="pragma-warn"><p>
906
907   Switch compiler warnings on or off. If the argument is "off", warnings are
908   disabled, otherwise they're enabled. The default is "on", but may be changed
909   with the <tt/<ref name="-W" id="option-W">/ compiler option.
910
911   The <tt/#pragma/ understands the push and pop parameters as explained above.
912
913
914 <sect1><tt>#pragma zpsym (&lt;name&gt;)</tt><p>
915
916   Tell the compiler that the -- previously as external declared -- symbol with
917   the given name is a zero page symbol (usually from an assembler file).
918   The compiler will create a matching import declaration for the assembler.
919
920   Example:
921   <tscreen><verb>
922         extern int foo;
923         #pragma zpsym ("foo");  /* foo is in the zeropage */
924   </verb></tscreen>
925
926
927
928
929 <sect>Register variables<label id="regvars"><p>
930
931 The runtime for all supported platforms has 6 bytes of zero page space
932 available for register variables (this could be increased, but I think it's a
933 good value). So you can declare register variables up to a total size of 6 per
934 function. The compiler will allocate register space on a "first come, first
935 served" base and convert any <tt/register/ declarations that exceed the
936 available register space silently to <tt/auto/. Parameters can also be
937 declared as <tt/register/, this will in fact give slightly shorter code than
938 using a register variable.
939
940 Since a function must save the current values of the registers on entry and
941 restore them on exit, there is an overhead associated with register variables,
942 and this overhead is quite high (about 20 bytes per variable). This means that
943 just declaring anything as <tt/register/ is not a good idea.
944
945 The best use for register variables are pointers, especially those that point
946 to structures. The magic number here is about 3 uses of a struct field: If the
947 function contains this number or even more, the generated code will be usually
948 shorter and faster when using a register variable for the struct pointer. The
949 reason for this is that the register variable can in many cases be used as a
950 pointer directly. Having a pointer in an auto variable means that this pointer
951 must first be copied into a zero page location, before it can be dereferenced.
952
953 Second best use for register variables are counters. However, there is not
954 much difference in the code generated for counters, so you will need at least
955 100 operations on this variable (for example in a loop) to make it worth the
956 trouble. The only savings you get here are by the use of a zero page variable
957 instead of one on the stack or in the data segment.
958
959 Register variables must be explicitly enabled by using <tt/-Or/ or <tt/-r/ on
960 the command line. Register variables are only accepted on function top level,
961 register variables declared in interior blocks are silently converted to
962 <tt/auto/. With register variables disabled, all variables declared as
963 <tt/register/ are actually auto variables.
964
965 Please take care when using register variables: While they are helpful and can
966 lead to a tremendous speedup when used correctly, improper usage will cause
967 bloated code and a slowdown.
968
969
970
971 <sect>Inline assembler<label id="inline-asm"><p>
972
973 The compiler allows to insert assembler statements into the output file. The
974 syntax is
975
976 <tscreen><verb>
977         asm (&lt;string literal&gt;[, optional parameters]) ;
978 </verb></tscreen>
979 or
980 <tscreen><verb>
981         __asm__ (&lt;string literal&gt;[, optional parameters]) ;
982 </verb></tscreen>
983 <p>
984
985 The first form is in the user namespace and is disabled by <tt><ref
986 id="option--standard" name="--standard"></tt> if the argument is not <tt/cc65/.
987
988 The asm statement may be used inside a function and on global file level. An
989 inline assembler statement is a primary expression, so it may also be used as
990 part of an expression. Please note however that the result of an expression
991 containing just an inline assembler statement is always of type <tt/void/.
992
993 The contents of the string literal are preparsed by the compiler and inserted
994 into the generated assembly output, so that the can be further processed by
995 the backend and especially the optimizer. For this reason, the compiler does
996 only allow regular 6502 opcodes to be used with the inline assembler. Pseudo
997 instructions (like <tt/.import/, <tt/.byte/ and so on) are <em/not/ allowed,
998 even if the ca65 assembler (which is used to translate the generated assembler
999 code) would accept them. The builtin inline assembler is not a replacement for
1000 the full blown macro assembler which comes with the compiler.
1001
1002 Note: Inline assembler statements are subject to all optimizations done by the
1003 compiler. There is currently no way to protect an inline assembler statement
1004 from being moved or removed completely by the optimizer. If in doubt, check
1005 the generated assembler output, or disable optimizations.
1006
1007 The string literal may contain format specifiers from the following list. For
1008 each format specifier, an argument is expected which is inserted instead of
1009 the format specifier before passing the assembly code line to the backend.
1010
1011 <itemize>
1012   <item><tt/%b/ - Numerical 8-bit value
1013   <item><tt/%w/ - Numerical 16-bit value
1014   <item><tt/%l/ - Numerical 32-bit value
1015   <item><tt/%v/ - Assembler name of a (global) variable or function
1016   <item><tt/%o/ - Stack offset of a (local) variable
1017   <item><tt/%g/ - Assembler name of a C label
1018   <item><tt/%s/ - The argument is converted to a string
1019   <item><tt/%%/ - The % sign itself
1020 </itemize><p>
1021
1022 Using these format specifiers, you can access C <tt/#defines/, variables or
1023 similar stuff from the inline assembler. For example, to load the value of
1024 a C <tt/#define/ into the Y register, one would use
1025
1026 <tscreen><verb>
1027         #define OFFS  23
1028         __asm__ ("ldy #%b", OFFS);
1029 </verb></tscreen>
1030
1031 Or, to access a struct member of a static variable:
1032
1033 <tscreen><verb>
1034         typedef struct {
1035             unsigned char x;
1036             unsigned char y;
1037             unsigned char color;
1038         } pixel_t;
1039         static pixel_t pixel;
1040         __asm__ ("ldy #%b", offsetof(pixel_t, color));
1041         __asm__ ("lda %v,y", pixel);
1042 </verb></tscreen>
1043 <p>
1044
1045 Note: Do not embed the assembler labels that are used as names of global
1046 variables or functions into your asm statements. Code like this
1047
1048 <tscreen><verb>
1049         int foo;
1050         int bar () { return 1; }
1051         __asm__ ("lda _foo");           /* DON'T DO THAT! */
1052         ...
1053         __asm__ ("jsr _bar");           /* DON'T DO THAT EITHER! */
1054 </verb></tscreen>
1055 <p>
1056
1057 may stop working if the way, the compiler generates these names is changed in
1058 a future version. Instead use the format specifiers from the table above:
1059
1060 <tscreen><verb>
1061         __asm__ ("lda %v", foo);        /* OK */
1062         ...
1063         __asm__ ("jsr %v", bar);        /* OK */
1064 </verb></tscreen>
1065 <p>
1066
1067
1068 <sect>Implementation-defined behavior<p>
1069
1070 This section describes the behavior of cc65 when the standard describes the
1071 behavior as implementation-defined.                                       
1072
1073 (to be done)
1074
1075 <sect>Bugs/Feedback<p>
1076
1077 If you have problems using the compiler, if you find any bugs, or if you're
1078 doing something interesting with it, I would be glad to hear from you. Feel
1079 free to contact me by email (<htmlurl url="mailto:uz@cc65.org"
1080 name="uz@cc65.org">).
1081
1082
1083
1084 <sect>Copyright<p>
1085
1086 This is the original compiler copyright:
1087
1088 <tscreen><verb>
1089 --------------------------------------------------------------------------
1090   -*- Mode: Text -*-
1091
1092      This is the copyright notice for RA65, LINK65, LIBR65, and other
1093   Atari 8-bit programs.  Said programs are Copyright 1989, by John R.
1094   Dunning.  All rights reserved, with the following exceptions:
1095
1096       Anyone may copy or redistribute these programs, provided that:
1097
1098   1:  You don't charge anything for the copy.  It is permissable to
1099       charge a nominal fee for media, etc.
1100
1101   2:  All source code and documentation for the programs is made
1102       available as part of the distribution.
1103
1104   3:  This copyright notice is preserved verbatim, and included in
1105       the distribution.
1106
1107       You are allowed to modify these programs, and redistribute the
1108   modified versions, provided that the modifications are clearly noted.
1109
1110       There is NO WARRANTY with this software, it comes as is, and is
1111   distributed in the hope that it may be useful.
1112
1113       This copyright notice applies to any program which contains
1114   this text, or the refers to this file.
1115
1116       This copyright notice is based on the one published by the Free
1117   Software Foundation, sometimes known as the GNU project.  The idea
1118   is the same as theirs, ie the software is free, and is intended to
1119   stay that way.  Everybody has the right to copy, modify, and re-
1120   distribute this software.  Nobody has the right to prevent anyone
1121   else from copying, modifying or redistributing it.
1122
1123 --------------------------------------------------------------------------
1124 </verb></tscreen>
1125
1126 Small parts of the compiler (parts of the preprocessor and main parser) are
1127 still covered by this copyright. The main portion is covered by the usual
1128 cc65 license, which reads:
1129
1130 This software is provided 'as-is', without any expressed or implied
1131 warranty.  In no event will the authors be held liable for any damages
1132 arising from the use of this software.
1133
1134 Permission is granted to anyone to use this software for any purpose,
1135 including commercial applications, and to alter it and redistribute it
1136 freely, subject to the following restrictions:
1137
1138 <enum>
1139 <item>  The origin of this software must not be misrepresented; you must not
1140         claim that you wrote the original software. If you use this software
1141         in a product, an acknowledgment in the product documentation would be
1142         appreciated but is not required.
1143 <item>  Altered source versions must be plainly marked as such, and must not
1144         be misrepresented as being the original software.
1145 <item>  This notice may not be removed or altered from any source
1146         distribution.
1147 </enum>
1148
1149 </article>
1150