]> git.sur5r.net Git - cc65/blob - doc/ld65.sgml
Merge remote-tracking branch 'upstream/master' into creativision
[cc65] / doc / ld65.sgml
1 <!doctype linuxdoc system>      <!-- -*- text-mode -*- -->
2
3 <article>
4 <title>ld65 Users Guide
5 <author><url url="mailto:uz@cc65.org" name="Ullrich von Bassewitz">
6 <date>2014-04-20
7
8 <abstract>
9 The ld65 linker combines object files into an executable file. ld65 is highly
10 configurable and uses configuration files for high flexibility.
11 </abstract>
12
13 <!-- Table of contents -->
14 <toc>
15
16 <!-- Begin the document -->
17
18 <sect>Overview<p>
19
20 The ld65 linker combines several object modules created by the ca65
21 assembler, producing an executable file. The object modules may be read
22 from a library created by the ar65 archiver (this is somewhat faster and
23 more convenient). The linker was designed to be as flexible as possible.
24 It complements the features that are built into the ca65 macroassembler:
25
26 <itemize>
27
28 <item>  Accept any number of segments to form an executable module.
29
30 <item>  Resolve arbitrary expressions stored in the object files.
31
32 <item>  In case of errors, use the meta information stored in the object files
33         to produce helpful error messages. In case of undefined symbols,
34         expression range errors, or symbol type mismatches, ld65 is able to
35         tell you the exact location in the original assembler source, where
36         the symbol was referenced.
37
38 <item>  Flexible output. The output of ld65 is highly configurable by a config
39         file. Some more-common platforms are supported by default configurations
40         that may be activated by naming the target system. The output
41         generation was designed with different output formats in mind, so
42         adding other formats shouldn't be a great problem.
43
44 </itemize>
45
46
47 <sect>Usage<p>
48
49
50 <sect1>Command-line option overview<p>
51
52 The linker is called as follows:
53
54 <tscreen><verb>
55 ---------------------------------------------------------------------------
56 Usage: ld65 [options] module ...
57 Short options:
58   -(                    Start a library group
59   -)                    End a library group
60   -C name               Use linker config file
61   -D sym=val            Define a symbol
62   -L path               Specify a library search path
63   -Ln name              Create a VICE label file
64   -S addr               Set the default start address
65   -V                    Print the linker version
66   -h                    Help (this text)
67   -m name               Create a map file
68   -o name               Name the default output file
69   -t sys                Set the target system
70   -u sym                Force an import of symbol `sym'
71   -v                    Verbose mode
72   -vm                   Verbose map file
73
74 Long options:
75   --cfg-path path       Specify a config file search path
76   --config name         Use linker config file
77   --dbgfile name        Generate debug information
78   --define sym=val      Define a symbol
79   --end-group           End a library group
80   --force-import sym    Force an import of symbol `sym'
81   --help                Help (this text)
82   --lib file            Link this library
83   --lib-path path       Specify a library search path
84   --mapfile name        Create a map file
85   --module-id id        Specify a module id
86   --obj file            Link this object file
87   --obj-path path       Specify an object file search path
88   --start-addr addr     Set the default start address
89   --start-group         Start a library group
90   --target sys          Set the target system
91   --version             Print the linker version
92 ---------------------------------------------------------------------------
93 </verb></tscreen>
94
95
96 <sect1>Command-line options in detail<p>
97
98 Here is a description of all of the command-line options:
99
100 <descrip>
101
102   <label id="option--start-group">
103   <tag><tt>-(, --start-group</tt></tag>
104
105   Start a library group. The libraries specified within a group are searched
106   multiple times to resolve crossreferences within the libraries. Normally,
107   crossreferences are resolved only within a library, that is the library is
108   searched multiple times. Libraries specified later on the command line
109   cannot reference otherwise unreferenced symbols in libraries specified
110   earlier, because the linker has already handled them. Library groups are
111   a solution for this problem, because the linker will search repeatedly
112   through all libraries specified in the group, until all possible open
113   symbol references have been satisfied.
114
115
116   <tag><tt>-), --end-group</tt></tag>
117
118   End a library group. See the explanation of the <tt><ref
119   id="option--start-group" name="--start-group"></tt> option.
120
121
122   <tag><tt>-h, --help</tt></tag>
123
124   Print the short option summary shown above.
125
126
127   <label id="option-m">
128   <tag><tt>-m name, --mapfile name</tt></tag>
129
130   This option (which needs an argument that will used as a filename for
131   the generated map file) will cause the linker to generate a map file.
132   The map file does contain a detailed overview over the modules used, the
133   sizes for the different segments, and a table containing exported
134   symbols.
135
136
137   <label id="option-o">
138   <tag><tt>-o name</tt></tag>
139
140   The -o switch is used to give the name of the default output file.
141   Depending on your output configuration, this name <em/might not/ be used as the
142   name for the output file. However, for the default configurations, this
143   name is used for the output file name.
144
145
146   <label id="option-t">
147   <tag><tt>-t sys, --target sys</tt></tag>
148
149   The argument for the -t switch is the name of the target system. Since this
150   switch will activate a default configuration, it may not be used together
151   with the <tt><ref id="option-C" name="-C"></tt> option. The following target
152   systems are currently supported:
153
154   <itemize>
155   <item>none
156   <item>module
157   <item>apple2
158   <item>apple2enh
159   <item>atari2600
160   <item>atari
161   <item>atarixl
162   <item>atmos
163   <item>c16 (works also for the c116 with memory up to 32K)
164   <item>c64
165   <item>c128
166   <item>cbm510 (CBM-II series with 40-column video)
167   <item>cbm610 (all CBM series-II computers with 80-column video)
168   <item>geos-apple
169   <item>geos-cbm
170   <item>lunix
171   <item>lynx
172   <item>nes
173   <item>pet (all CBM PET systems except the 2001)
174   <item>plus4
175   <item>sim6502
176   <item>sim65c02
177   <item>supervision
178   <item>vic20
179   </itemize>
180
181   There are a few more targets defined but neither of them is actually
182   supported.
183
184
185   <tag><tt>-u sym[:addrsize], --force-import sym[:addrsize]</tt></tag>
186
187   Force an import of a symbol. While object files are always linked to the
188   output file, regardless if there are any references, object modules from
189   libraries get only linked in if an import can be satisfied by this module.
190   The <tt/--force-import/ option may be used to add a reference to a symbol and
191   as a result force linkage of the module that exports the identifier.
192
193   The name of the symbol may optionally be followed by a colon and an address-size
194   specifier. If no address size is specified, the default address size
195   for the target machine is used.
196
197   Please note that the symbol name needs to have the internal representation,
198   meaning you have to prepend an underscore for C identifiers.
199
200
201   <label id="option-v">
202   <tag><tt>-v, --verbose</tt></tag>
203
204   Using the -v option, you may enable more output that may help you to
205   locate problems. If an undefined symbol is encountered, -v causes the
206   linker to print a detailed list of the references (that is, source file
207   and line) for this symbol.
208
209
210   <tag><tt>-vm</tt></tag>
211
212   Must be used in conjunction with <tt><ref id="option-m" name="-m"></tt>
213   (generate map file). Normally the map file will not include empty segments
214   and sections, or unreferenced symbols. Using this option, you can force the
215   linker to include all that information into the map file.  Also, it will
216   include a second <tt/Exports/ list.  The first list is sorted by name;
217   the second one is sorted by value.
218
219
220   <label id="option-C">
221   <tag><tt>-C</tt></tag>
222
223   This gives the name of an output config file to use. See section 4 for more
224   information about config files. -C may not be used together with <tt><ref
225   id="option-t" name="-t"></tt>.
226
227
228   <label id="option-D">
229   <tag><tt>-D sym=value, --define sym=value</tt></tag>
230
231   This option allows to define an external symbol on the command line. Value
232   may start with a '&dollar;' sign or with <tt/0x/ for hexadecimal values,
233   otherwise a leading zero denotes octal values. See also <ref
234   id="SYMBOLS" name="the SYMBOLS section"> in the configuration file.
235
236
237   <label id="option--lib-path">
238   <tag><tt>-L path, --lib-path path</tt></tag>
239
240   Specify a library search path. This option may be used more than once. It
241   adds a directory to the search path for library files. Libraries specified
242   without a path are searched in the current directory, in the list of
243   directories specified using <tt/--lib-path/, in directories given by
244   environment variables, and in a built-in default directory.
245
246
247   <tag><tt>-Ln</tt></tag>
248
249   This option allows you to create a file that contains all global labels and
250   may be loaded into the VICE emulator using the <tt/ll/ (load label) command. You
251   may use this to debug your code with VICE. Note: Older versions had some
252   bugs in the label code. If you have problems, please get the latest <url
253   url="http://vice-emu.sourceforge.net/" name="VICE"> version.
254
255
256   <label id="option-S">
257   <tag><tt>-S addr, --start-addr addr</tt></tag>
258
259   Using -S you may define the default starting address. If and how this
260   address is used depends on the config file in use. For the default
261   configurations, only the "none", "apple2" and "apple2enh" systems honor an
262   explicit start address, all other default configs provide their own.
263
264
265   <tag><tt>-V, --version</tt></tag>
266
267   This option prints the version number of the linker. If you send any
268   suggestions or bugfixes, please include this number.
269
270
271   <label id="option--cfg-path">
272   <tag><tt>--cfg-path path</tt></tag>
273
274   Specify a config file search path. This option may be used more than once.
275   It adds a directory to the search path for config files. A config file given
276   with the <tt><ref id="option-C" name="-C"></tt> option that has no path in
277   its name is searched in the current directory, in the list of directories
278   specified using <tt/--cfg-path/, in directories given by environment variables,
279   and in a built-in default directory.
280
281
282   <label id="option--dbgfile">
283   <tag><tt>--dbgfile name</tt></tag>
284
285   Specify an output file for debug information. Available information will be
286   written to this file. Using the <tt/-g/ option for the compiler and assembler
287   will increase the amount of information available. Please note that debug
288   information generation is currently being developed, so the format of the
289   file and its contents are subject to change without further notice.
290
291
292   <tag><tt>--lib file</tt></tag>
293
294   Links a library to the output. Use this command-line option instead of just
295   naming the library file, if the linker is not able to determine the file
296   type because of an unusual extension.
297
298
299   <tag><tt>--obj file</tt></tag>
300
301   Links an object file to the output. Use this command-line option instead
302   of just naming the object file, if the linker is not able to determine the
303   file type because of an unusual extension.
304
305
306   <label id="option--obj-path">
307   <tag><tt>--obj-path path</tt></tag>
308
309   Specify an object file search path. This option may be used more than once.
310   It adds a directory to the search path for object files. An object file
311   passed to the linker that has no path in its name is searched in the current
312   directory, in the list of directories specified using <tt/--obj-path/, in
313   directories given by environment variables, and in a built-in default directory.
314
315 </descrip>
316
317
318
319 <sect>Search paths<p>
320
321 Starting with version 2.10, there are now several search-path lists for files needed
322 by the linker: one for libraries, one for object files, and one for config
323 files.
324
325
326 <sect1>Library search path<p>
327
328 The library search-path list contains in this order:
329
330 <enum>
331 <item>The current directory.
332 <item>Any directory added with the <tt><ref id="option--lib-path"
333       name="--lib-path"></tt> option on the command line.
334 <item>The value of the environment variable <tt/LD65_LIB/ if it is defined.
335 <item>A subdirectory named <tt/lib/ of the directory defined in the environment
336       variable <tt/CC65_HOME/, if it is defined.
337 <item>An optionally compiled-in library path.
338 </enum>
339
340
341 <sect1>Object file search path<p>
342
343 The object file search-path list contains in this order:
344
345 <enum>
346 <item>The current directory.
347 <item>Any directory added with the <tt><ref id="option--obj-path"
348       name="--obj-path"></tt> option on the command line.
349 <item>The value of the environment variable <tt/LD65_OBJ/ if it is defined.
350 <item>A subdirectory named <tt/obj/ of the directory defined in the environment
351       variable <tt/CC65_HOME/, if it is defined.
352 <item>An optionally compiled-in directory.
353 </enum>
354
355
356 <sect1>Config file search path<p>
357
358 The config file search-path list contains in this order:
359
360 <enum>
361 <item>The current directory.
362 <item>Any directory added with the <tt><ref id="option--cfg-path"
363       name="--cfg-path"></tt> option on the command line.
364 <item>The value of the environment variable <tt/LD65_CFG/ if it is defined.
365 <item>A subdirectory named <tt/cfg/ of the directory defined in the environment
366       variable <tt/CC65_HOME/, if it is defined.
367 <item>An optionally compiled-in directory.
368 </enum>
369
370
371
372 <sect>Detailed workings<p>
373
374 The linker does several things when combining object modules:
375
376 First, the command line is parsed from left to right. For each object file
377 encountered (object files are recognized by a magic word in the header, so
378 the linker does not care about the name), imported and exported
379 identifiers are read from the file and inserted in a table. If a library
380 name is given (libraries are also recognized by a magic word, there are no
381 special naming conventions), all modules in the library are checked if an
382 export from this module would satisfy an import from other modules. All
383 modules where this is the case are marked. If duplicate identifiers are
384 found, the linker issues warnings.
385
386 That procedure (parsing and reading from left to right) does mean that a
387 library may only satisfy references for object modules (given directly or from
388 a library) named <em/before/ that library. With the command line
389
390 <tscreen><verb>
391         ld65 crt0.o clib.lib test.o
392 </verb></tscreen>
393
394 the module <tt/test.o/ must not contain references to modules in the library
395 <tt/clib.lib/.  But, if it does, you have to change the order of the modules
396 on the command line:
397
398 <tscreen><verb>
399         ld65 crt0.o test.o clib.lib
400 </verb></tscreen>
401
402 Step two is, to read the configuration file, and assign start addresses
403 for the segments and define any linker symbols (see <ref id="config-files"
404 name="Configuration files">).
405
406 After that, the linker is ready to produce an output file. Before doing that,
407 it checks its data for consistency. That is, it checks for unresolved
408 externals (if the output format is not relocatable) and for symbol type
409 mismatches (for example a zero-page symbol is imported by a module as an absolute
410 symbol).
411
412 Step four is, to write the actual target files. In this step, the linker will
413 resolve any expressions contained in the segment data. Circular references are
414 also detected in this step (a symbol may have a circular reference that goes
415 unnoticed if the symbol is not used).
416
417 Step five is to output a map file with a detailed list of all modules,
418 segments and symbols encountered.
419
420 And, last step, if you give the <tt><ref id="option-v" name="-v"></tt> switch
421 twice, you get a dump of the segment data. However, this may be quite
422 unreadable if you're not a developer. :-)
423
424
425
426 <sect>Configuration files<label id="config-files"><p>
427
428 Configuration files are used to describe the layout of the output file(s). Two
429 major topics are covered in a config file: The memory layout of the target
430 architecture, and the assignment of segments to memory areas. In addition,
431 several other attributes may be specified.
432
433 Case is ignored for keywords, that is, section or attribute names, but it is
434 <em/not/ ignored for names and strings.
435
436
437
438 <sect1>Memory areas<p>
439
440 Memory areas are specified in a <tt/MEMORY/ section. Let's have a look at an
441 example (this one describes the usable memory layout of the C64):
442
443 <tscreen><verb>
444         MEMORY {
445             RAM1:  start = $0800, size = $9800;
446             ROM1:  start = $A000, size = $2000;
447             RAM2:  start = $C000, size = $1000;
448             ROM2:  start = $E000, size = $2000;
449         }
450 </verb></tscreen>
451
452 As you can see, there are two RAM areas and two ROM areas. The names
453 (before the colon) are arbitrary names that must start with a letter, with
454 the remaining characters being letters or digits. The names of the memory
455 areas are used when assigning segments. As mentioned above, case is
456 significant for those names.
457
458 The syntax above is used in all sections of the config file. The name
459 (<tt/ROM1/ etc.) is said to be an identifier, the remaining tokens up to the
460 semicolon specify attributes for this identifier. You may use the equal sign
461 to assign values to attributes, and you may use a comma to separate
462 attributes, you may also leave both out. But you <em/must/ use a semicolon to
463 mark the end of the attributes for one identifier. The section above may also
464 have looked like this:
465
466 <tscreen><verb>
467         # Start of memory section
468         MEMORY
469         {
470             RAM1:
471                 start $0800
472                 size $9800;
473             ROM1:
474                 start $A000
475                 size $2000;
476             RAM2:
477                 start $C000
478                 size $1000;
479             ROM2:
480                 start $E000
481                 size $2000;
482         }
483 </verb></tscreen>
484
485 There are of course more attributes for a memory section than just start and
486 size. Start and size are mandatory attributes, that means, each memory area
487 defined <em/must/ have these attributes given (the linker will check that). I
488 will cover other attributes later. As you may have noticed, I've used a
489 comment in the example above. Comments start with a hash mark (`#'), the
490 remainder of the line is ignored if this character is found.
491
492
493 <sect1>Segments<p>
494
495 Let's assume you have written a program for your trusty old C64, and you would
496 like to run it. For testing purposes, it should run in the <tt/RAM/ area. So
497 we will start to assign segments to memory sections in the <tt/SEGMENTS/
498 section:
499
500 <tscreen><verb>
501         SEGMENTS {
502             CODE:   load = RAM1, type = ro;
503             RODATA: load = RAM1, type = ro;
504             DATA:   load = RAM1, type = rw;
505             BSS:    load = RAM1, type = bss, define = yes;
506         }
507 </verb></tscreen>
508
509 What we are doing here is telling the linker, that all segments go into the
510 <tt/RAM1/ memory area in the order specified in the <tt/SEGMENTS/ section. So
511 the linker will first write the <tt/CODE/ segment, then the <tt/RODATA/
512 segment, then the <tt/DATA/ segment - but it will not write the <tt/BSS/
513 segment. Why? Here enters the segment type: For each segment specified, you may also
514 specify a segment attribute. There are four possible segment attributes:
515
516 <tscreen><verb>
517         ro      means readonly
518         rw      means read/write
519         bss     means that this is an uninitialized segment
520         zp      a zeropage segment
521 </verb></tscreen>
522
523 So, because we specified that the segment with the name BSS is of type bss,
524 the linker knows that this is uninitialized data, and will not write it to an
525 output file. This is an important point: For the assembler, the <tt/BSS/
526 segment has no special meaning. You specify, which segments have the bss
527 attribute when linking. This approach is much more flexible than having one
528 fixed bss segment, and is a result of the design decision to supporting an
529 arbitrary segment count.
530
531 If you specify "<tt/type = bss/" for a segment, the linker will make sure that
532 this segment does only contain uninitialized data (that is, zeroes), and issue
533 a warning if this is not the case.
534
535 For a <tt/bss/ type segment to be useful, it must be cleared somehow by your
536 program (this happens usually in the startup code - for example the startup
537 code for cc65-generated programs takes care about that). But how does your
538 code know, where the segment starts, and how big it is? The linker is able to
539 give that information, but you must request it. This is, what we're doing with
540 the "<tt/define = yes/" attribute in the <tt/BSS/ definitions. For each
541 segment, where this attribute is true, the linker will export three symbols.
542
543 <tscreen><verb>
544         __NAME_LOAD__   This is set to the address where the
545                         segment is loaded.
546         __NAME_RUN__    This is set to the run address of the
547                         segment. We will cover run addresses
548                         later.
549         __NAME_SIZE__   This is set to the segment size.
550 </verb></tscreen>
551
552 Replace <tt/NAME/ by the name of the segment, in the example above, this would
553 be <tt/BSS/. These symbols may be accessed by your code.
554
555 Now, as we've configured the linker to write the first three segments and
556 create symbols for the last one, there's only one question left: Where does
557 the linker put the data? It would be very convenient to have the data in a
558 file, wouldn't it?
559
560 <sect1>Output files<p>
561
562 We don't have any files specified above, and indeed, this is not needed in a
563 simple configuration like the one above. There is an additional attribute
564 "file" that may be specified for a memory area, that gives a file name to
565 write the area data into. If there is no file name given, the linker will
566 assign the default file name. This is "a.out" or the one given with the
567 <tt><ref id="option-o" name="-o"></tt> option on the command line. Since the
568 default behaviour is OK for our purposes, I did not use the attribute in the
569 example above. Let's have a look at it now.
570
571 The "file" attribute (the keyword may also be written as "FILE" if you like
572 that better) takes a string enclosed in double quotes (`&dquot;') that specifies the
573 file, where the data is written. You may specify the same file several times,
574 in that case the data for all memory areas having this file name is written
575 into this file, in the order of the memory areas defined in the <tt/MEMORY/
576 section. Let's specify some file names in the <tt/MEMORY/ section used above:
577
578 <tscreen><verb>
579         MEMORY {
580             RAM1:  start = $0800, size = $9800, file = %O;
581             ROM1:  start = $A000, size = $2000, file = "rom1.bin";
582             RAM2:  start = $C000, size = $1000, file = %O;
583             ROM2:  start = $E000, size = $2000, file = "rom2.bin";
584         }
585 </verb></tscreen>
586
587 The <tt/%O/ used here is a way to specify the default behaviour explicitly:
588 <tt/%O/ is replaced by a string (including the quotes) that contains the
589 default output name, that is, "a.out" or the name specified with the <tt><ref
590 id="option-o" name="-o"></tt> option on the command line. Into this file, the
591 linker will first write any segments that go into <tt/RAM1/, and will append
592 then the segments for <tt/RAM2/, because the memory areas are given in this
593 order. So, for the RAM areas, nothing has really changed.
594
595 We've not used the ROM areas, but we will do that below, so we give the file
596 names here. Segments that go into <tt/ROM1/ will be written to a file named
597 "rom1.bin", and segments that go into <tt/ROM2/ will be written to a file
598 named "rom2.bin". The name given on the command line is ignored in both cases.
599
600 Assigning an empty file name for a memory area will discard the data written
601 to it. This is useful, if the memory area has segments assigned that are empty
602 (for example because they are of type bss). In that case, the linker will
603 create an empty output file. This may be suppressed by assigning an empty file
604 name to that memory area.
605
606 The <tt/%O/ sequence is also allowed inside a string. So using
607
608 <tscreen><verb>
609         MEMORY {
610             ROM1:  start = $A000, size = $2000, file = "%O-1.bin";
611             ROM2:  start = $E000, size = $2000, file = "%O-2.bin";
612         }
613 </verb></tscreen>
614
615 would write two files that start with the name of the output file specified on
616 the command line, with "-1.bin" and "-2.bin" appended respectively. Because
617 '%' is used as an escape char, the sequence "%%" has to be used if a single
618 percent sign is required.
619
620 <sect1>LOAD and RUN addresses (ROMable code)<p>
621
622 Let us look now at a more complex example. Say, you've successfully tested
623 your new "Super Operating System" (SOS for short) for the C64, and you
624 will now go and replace the ROMs by your own code. When doing that, you
625 face a new problem: If the code runs in RAM, we need not to care about
626 read/write data. But now, if the code is in ROM, we must care about it.
627 Remember the default segments (you may of course specify your own):
628
629 <tscreen><verb>
630         CODE            read-only code
631         RODATA          read-only data
632         DATA            read/write data
633         BSS             uninitialized data, read/write
634 </verb></tscreen>
635
636 Since <tt/BSS/ is not initialized, we must not care about it now, but what
637 about <tt/DATA/? <tt/DATA/ contains initialized data, that is, data that was
638 explicitly assigned a value. And your program will rely on these values on
639 startup. Since there's no way to remember the contents of the data segment,
640 other than storing it into one of the ROMs, we have to put it there. But
641 unfortunately, ROM is not writable, so we have to copy it into RAM before
642 running the actual code.
643
644 The linker won't copy the data from ROM into RAM for you (this must be done by
645 the startup code of your program), but it has some features that will help you
646 in this process.
647
648 First, you may not only specify a "<tt/load/" attribute for a segment, but
649 also a "<tt/run/" attribute. The "<tt/load/" attribute is mandatory, and, if
650 you don't specify a "<tt/run/" attribute, the linker assumes that load area
651 and run area are the same. We will use this feature for our data area:
652
653 <tscreen><verb>
654         SEGMENTS {
655             CODE:   load = ROM1, type = ro;
656             RODATA: load = ROM2, type = ro;
657             DATA:   load = ROM2, run = RAM2, type = rw, define = yes;
658             BSS:    load = RAM2, type = bss, define = yes;
659         }
660 </verb></tscreen>
661
662 Let's have a closer look at this <tt/SEGMENTS/ section. We specify that the
663 <tt/CODE/ segment goes into <tt/ROM1/ (the one at $A000). The readonly data
664 goes into <tt/ROM2/. Read/write data will be loaded into <tt/ROM2/ but is run
665 in <tt/RAM2/. That means that all references to labels in the <tt/DATA/
666 segment are relocated to be in <tt/RAM2/, but the segment is written to
667 <tt/ROM2/. All your startup code has to do is, to copy the data from its
668 location in <tt/ROM2/ to the final location in <tt/RAM2/.
669
670 So, how do you know, where the data is located? This is the second point,
671 where you get help from the linker. Remember the "<tt/define/" attribute?
672 Since we have set this attribute to true, the linker will define three
673 external symbols for the data segment that may be accessed from your code:
674
675 <tscreen><verb>
676         __DATA_LOAD__   This is set to the address where the segment
677                         is loaded, in this case, it is an address in
678                         ROM2.
679         __DATA_RUN__    This is set to the run address of the segment,
680                         in this case, it is an address in RAM2.
681         __DATA_SIZE__   This is set to the segment size.
682 </verb></tscreen>
683
684 So, what your startup code must do, is to copy <tt/__DATA_SIZE__/ bytes from
685 <tt/__DATA_LOAD__/ to <tt/__DATA_RUN__/ before any other routines are called.
686 All references to labels in the <tt/DATA/ segment are relocated to <tt/RAM2/
687 by the linker, so things will work properly.
688
689 There's a library subroutine called <tt/copydata/ (in a module named
690 <tt/copydata.s/) that might be used to do actual copying. Be sure to have a
691 look at it's inner workings before using it!
692
693
694 <sect1>Other MEMORY area attributes<p>
695
696 There are some other attributes not covered above. Before starting the
697 reference section, I will discuss the remaining things here.
698
699 You may request symbols definitions also for memory areas. This may be
700 useful for things like a software stack, or an I/O area.
701
702 <tscreen><verb>
703         MEMORY {
704             STACK:  start = $C000, size = $1000, define = yes;
705         }
706 </verb></tscreen>
707
708 This will define some external symbols that may be used in your code:
709
710 <tscreen><verb>
711         __STACK_START__         This is set to the start of the memory
712                                 area, $C000 in this example.
713         __STACK_SIZE__          The size of the area, here $1000.
714         __STACK_LAST__          This is NOT the same as START+SIZE.
715                                 Instead, it is defined as the first
716                                 address that is not used by data. If we
717                                 don't define any segments for this area,
718                                 the value will be the same as START.
719         __STACK_FILEOFFS__      The binary offset in the output file. This
720                                 is not defined for relocatable output file
721                                 formats (o65).
722 </verb></tscreen>
723
724 A memory section may also have a type. Valid types are
725
726 <tscreen><verb>
727         ro      for readonly memory
728         rw      for read/write memory.
729 </verb></tscreen>
730
731 The linker will assure, that no segment marked as read/write or bss is put
732 into a memory area that is marked as readonly.
733
734 Unused memory in a memory area may be filled. Use the "<tt/fill = yes/"
735 attribute to request this. The default value to fill unused space is zero. If
736 you don't like this, you may specify a byte value that is used to fill these
737 areas with the "<tt/fillval/" attribute. If there is no "<tt/fillval/"
738 attribute for the segment, the "<tt/fillval/" attribute of the memory area (or
739 its default) is used instead. This means that the value may also be used to
740 fill unfilled areas generated by the assembler's <tt/.ALIGN/ and <tt/.RES/
741 directives.
742
743 The symbol <tt/%S/ may be used to access the default start address (that is,
744 the one defined in <ref id="FEATURES" name="the FEATURES section">, or the
745 value given on the command line with the <tt><ref id="option-S" name="-S"></tt>
746 option).
747
748 To support systems with banked memory, a special attribute named <tt/bank/ is
749 available. The attribute value is an arbitrary 32-bit integer. The assembler
750 has a builtin function named <tt/.BANK/ which may be used with an argument
751 that has a segment reference (for example a symbol). The result of this
752 function is the value of the bank attribute for the run memory area of the
753 segment.
754
755
756 <sect1>Other SEGMENT attributes<p>
757
758 Segments may be aligned to some memory boundary. Specify "<tt/align = num/" to
759 request this feature. Num must be a power of two. To align all segments on a
760 page boundary, use
761
762 <tscreen><verb>
763         SEGMENTS {
764             CODE:   load = ROM1, type = ro, align = $100;
765             RODATA: load = ROM2, type = ro, align = $100;
766             DATA:   load = ROM2, run = RAM2, type = rw, define = yes,
767                     align = $100;
768             BSS:    load = RAM2, type = bss, define = yes, align = $100;
769         }
770 </verb></tscreen>
771
772 If an alignment is requested, the linker will add enough space to the output
773 file, so that the new segment starts at an address that is dividable by the
774 given number without a remainder. All addresses are adjusted accordingly. To
775 fill the unused space, bytes of zero are used, or, if the memory area has a
776 "<tt/fillval/" attribute, that value. Alignment is always needed, if you have
777 used the <tt/.ALIGN/ command in the assembler. The alignment of a segment
778 must be equal or greater than the alignment used in the <tt/.ALIGN/ command.
779 The linker will check that, and issue a warning, if the alignment of a segment
780 is lower than the alignment requested in an <tt/.ALIGN/ command of one of the
781 modules making up this segment.
782
783 For a given segment you may also specify a fixed offset into a memory area or
784 a fixed start address. Use this if you want the code to run at a specific
785 address (a prominent case is the interrupt vector table which must go at
786 address $FFFA). Only one of <tt/ALIGN/ or <tt/OFFSET/ or <tt/START/ may be
787 specified. If the directive creates empty space, it will be filled with zero,
788 of with the value specified with the "<tt/fillval/" attribute if one is given.
789 The linker will warn you if it is not possible to put the code at the
790 specified offset (this may happen if other segments in this area are too
791 large). Here's an example:
792
793 <tscreen><verb>
794         SEGMENTS {
795             VECTORS: load = ROM2, type = ro, start = $FFFA;
796         }
797 </verb></tscreen>
798
799 or (for the segment definitions from above)
800
801 <tscreen><verb>
802         SEGMENTS {
803             VECTORS: load = ROM2, type = ro, offset = $1FFA;
804         }
805 </verb></tscreen>
806
807 The "<tt/align/", "<tt/start/" and "<tt/offset/" attributes change placement
808 of the segment in the run memory area, because this is what is usually
809 desired. If load and run memory areas are equal (which is the case if only the
810 load memory area has been specified), the attributes will also work. There is
811 also an "<tt/align_load/" attribute that may be used to align the start of the
812 segment in the load memory area, in case different load and run areas have
813 been specified. There are no special attributes to set start or offset for
814 just the load memory area.
815
816 A "<tt/fillval/" attribute may not only be specified for a memory area, but
817 also for a segment. The value must be an integer between 0 and 255. It is used
818 as the fill value for space reserved by the assembler's <tt/.ALIGN/ and <tt/.RES/
819 commands. It is also used as the fill value for space between sections (part of a
820 segment that comes from one object file) caused by alignment, but not for
821 space that preceeds the first section.
822
823 To suppress the warning, the linker issues if it encounters a segment that is
824 not found in any of the input files, use "<tt/optional=yes/" as an additional
825 segment attribute. Be careful when using this attribute, because a missing
826 segment may be a sign of a problem, and if you're suppressing the warning,
827 there is no one left to tell you about it.
828
829 <sect1>The FILES section<p>
830
831 The <tt/FILES/ section is used to support other formats than straight binary
832 (which is the default, so binary output files do not need an explicit entry
833 in the <tt/FILES/ section).
834
835 The <tt/FILES/ section lists output files and as only attribute the format of
836 each output file. Assigning binary format to the default output file would
837 look like this:
838
839 <tscreen><verb>
840         FILES {
841             %O: format = bin;
842         }
843 </verb></tscreen>
844
845 The only other available output format is the o65 format specified by Andre
846 Fachat (see the <url url="http://www.6502.org/users/andre/o65/fileformat.html"
847 name="6502 binary relocation format specification">). It is defined like this:
848
849 <tscreen><verb>
850         FILES {
851             %O: format = o65;
852         }
853 </verb></tscreen>
854
855 The necessary o65 attributes are defined in a special section labeled
856 <ref id="FORMAT" name="FORMAT">.
857
858
859
860 <sect1>The FORMAT section<label id="FORMAT"><p>
861
862 The <tt/FORMAT/ section is used to describe file formats. The default (binary)
863 format has currently no attributes, so, while it may be listed in this
864 section, the attribute list is empty. The second supported format,
865 <url url="http://www.6502.org/users/andre/o65/fileformat.html" name="o65">,
866 has several attributes that may be defined here.
867
868 <tscreen><verb>
869     FORMATS {
870         o65: os = lunix, version = 0, type = small,
871              import = LUNIXKERNEL,
872              export = _main;
873     }
874 </verb></tscreen>
875
876
877
878 <sect1>The FEATURES section<label id="FEATURES"><p>
879
880 In addition to the <tt/MEMORY/ and <tt/SEGMENTS/ sections described above, the
881 linker has features that may be enabled by an additional section labeled
882 <tt/FEATURES/.
883
884
885 <sect2>The CONDES feature<p>
886
887 <tt/CONDES/ is used to tell the linker to emit module constructor/destructor
888 tables.
889
890 <tscreen><verb>
891         FEATURES {
892             CONDES: segment = RODATA,
893                     type = constructor,
894                     label = __CONSTRUCTOR_TABLE__,
895                     count = __CONSTRUCTOR_COUNT__;
896         }
897 </verb></tscreen>
898
899 The <tt/CONDES/ feature has several attributes:
900
901 <descrip>
902
903   <tag><tt>segment</tt></tag>
904
905   This attribute tells the linker into which segment the table should be
906   placed. If the segment does not exist, it is created.
907
908
909   <tag><tt>type</tt></tag>
910
911   Describes the type of the routines to place in the table. Type may be one of
912   the predefined types <tt/constructor/, <tt/destructor/, <tt/interruptor/, or
913   a numeric value between 0 and 6.
914
915
916   <tag><tt>label</tt></tag>
917
918   This specifies the label to use for the table. The label points to the start
919   of the table in memory and may be used from within user-written code.
920
921
922   <tag><tt>count</tt></tag>
923
924   This is an optional attribute. If specified, an additional symbol is defined
925   by the linker using the given name. The value of this symbol is the number
926   of entries (<em/not/ bytes) in the table. While this attribute is optional,
927   it is often useful to define it.
928
929
930   <tag><tt>order</tt></tag>
931
932   An optional attribute that takes one of the keywords <tt/increasing/ or
933   <tt/decreasing/ as an argument. Specifies the sorting order of the entries
934   within the table. The default is <tt/increasing/, which means that the
935   entries are sorted with increasing priority (the first entry has the lowest
936   priority). "Priority" is the priority specified when declaring a symbol as
937   <tt/.CONDES/ with the assembler, higher values mean higher priority. You may
938   change this behaviour by specifying <tt/decreasing/ as the argument, the
939   order of entries is reversed in this case.
940
941   Please note that the order of entries with equal priority is undefined.
942
943   <tag><tt>import</tt></tag>
944
945   This attribute defines a valid symbol name, that is added as an import
946   to the modules defining a constructor/destructor of the given type.
947   This can be used to force linkage of a module if this module exports the
948   requested symbol.
949
950 </descrip>
951
952 Without specifying the <tt/CONDES/ feature, the linker will not create any
953 tables, even if there are <tt/condes/ entries in the object files.
954
955 For more information see the <tt/.CONDES/ command in the <url
956 url="ca65.html" name="ca65 manual">.
957
958
959 <sect2>The STARTADDRESS feature<p>
960
961 <tt/STARTADDRESS/ is used to set the default value for the start address,
962 which can be referenced by the <tt/%S/ symbol. The builtin default for the
963 linker is &dollar;200.
964
965 <tscreen><verb>
966         FEATURES {
967             # Default start address is $1000
968             STARTADDRESS:       default = $1000;
969         }
970 </verb></tscreen>
971
972 Please note that order is important: The default start address must be defined
973 <em/before/ the <tt/%S/ symbol is used in the config file. This does usually
974 mean, that the <tt/FEATURES/ section has to go to the top of the config file.
975
976
977
978 <sect1>The SYMBOLS section<label id="SYMBOLS"><p>
979
980 The configuration file may also be used to define symbols used in the link
981 stage or to force symbols imports. This is done in the SYMBOLS section. The
982 symbol name is followed by a colon and symbol attributes.
983
984 The following symbol attributes are supported:
985
986 <descrip>
987
988   <tag><tt>addrsize</tt></tag>
989
990   The <tt/addrsize/ attribute specifies the address size of the symbol and
991   may be one of
992 <itemize>
993     <item><tt/zp/, <tt/zeropage/ or <tt/direct/
994     <item><tt/abs/, <tt/absolute/ or <tt/near/
995     <item><tt/far/
996     <item><tt/long/ or <tt/dword/.
997 </itemize>
998
999 Without this attribute, the default address size is <tt/abs/.
1000
1001   <tag><tt>type</tt></tag>
1002
1003   This attribute is mandatory. Its value is one of <tt/export/, <tt/import/ or
1004   <tt/weak/. <tt/export/ means that the symbol is defined and exported from
1005   the linker config. <tt/import/ means that an import is generated for this
1006   symbol, eventually forcing a module that exports this symbol to be included
1007   in the output. <tt/weak/ is similar as <tt/export/. However, the symbol is
1008   only defined if it is not defined elsewhere.
1009
1010   <tag><tt>value</tt></tag>
1011
1012   This must only be given for symbols of type <tt/export/ or <tt/weak/. It
1013   defines the value of the symbol and may be an expression.
1014
1015 </descrip>
1016
1017 The following example defines the stack size for an application, but allows
1018 the programmer to override the value by specifying <tt/--define
1019 __STACKSIZE__=xxx/ on the command line.
1020
1021 <tscreen><verb>
1022         SYMBOLS {
1023             # Define the stack size for the application
1024             __STACKSIZE__:  type = weak, value = $800;
1025         }
1026 </verb></tscreen>
1027
1028
1029
1030 <sect>Special segments<p>
1031
1032 The builtin config files do contain segments that have a special meaning for
1033 the compiler and the libraries that come with it. If you replace the builtin
1034 config files, you will need the following information.
1035
1036 <sect1>ONCE<p>
1037
1038 The ONCE segment is used for initialization code run only once before
1039 execution reaches main() - provided that the program runs in RAM. You
1040 may for example add the ONCE segment to the heap in really memory
1041 constrained systems.
1042
1043 <sect1>LOWCODE<p>
1044
1045 For the LOWCODE segment, it is guaranteed that it won't be banked out, so it
1046 is reachable at any time by interrupt handlers or similar.
1047
1048 <sect1>STARTUP<p>
1049
1050 This segment contains the startup code which initializes the C software stack
1051 and the libraries. It is placed in its own segment because it needs to be
1052 loaded at the lowest possible program address on several platforms.
1053
1054 <sect1>ZPSAVE<p>
1055
1056 The ZPSAVE segment contains the original values of the zeropage locations used
1057 by the ZEROPAGE segment. It is placed in its own segment because it must not be
1058 initialized.
1059
1060
1061
1062 <sect>Copyright<p>
1063
1064 ld65 (and all cc65 binutils) are (C) Copyright 1998-2005 Ullrich von
1065 Bassewitz. For usage of the binaries and/or sources the following
1066 conditions do apply:
1067
1068 This software is provided 'as-is', without any expressed or implied
1069 warranty.  In no event will the authors be held liable for any damages
1070 arising from the use of this software.
1071
1072 Permission is granted to anyone to use this software for any purpose,
1073 including commercial applications, and to alter it and redistribute it
1074 freely, subject to the following restrictions:
1075
1076 <enum>
1077 <item>  The origin of this software must not be misrepresented; you must not
1078         claim that you wrote the original software. If you use this software
1079         in a product, an acknowledgment in the product documentation would be
1080         appreciated but is not required.
1081 <item>  Altered source versions must be plainly marked as such, and must not
1082         be misrepresented as being the original software.
1083 <item>  This notice may not be removed or altered from any source
1084         distribution.
1085 </enum>
1086
1087
1088
1089 </article>