]> git.sur5r.net Git - cc65/blobdiff - src/cc65/scanner.c
Add code size factor for optimizer routines
[cc65] / src / cc65 / scanner.c
index 445d11405e32362a5f2ea0f602eaec9d011bb4f1..3584a56a138e46d330ddc5e64ed0a6f2c6d4b638 100644 (file)
@@ -1,8 +1,35 @@
-/*
- * scanner.c
- *
- * Ullrich von Bassewitz, 07.06.1998
- */
+/*****************************************************************************/
+/*                                                                           */
+/*                                scanner.c                                 */
+/*                                                                           */
+/*                     Source file line info structure                      */
+/*                                                                           */
+/*                                                                           */
+/*                                                                           */
+/* (C) 1998-2001 Ullrich von Bassewitz                                       */
+/*               Wacholderweg 14                                             */
+/*               D-70597 Stuttgart                                           */
+/* EMail:        uz@musoftware.de                                            */
+/*                                                                           */
+/*                                                                           */
+/* This software is provided 'as-is', without any expressed or implied       */
+/* warranty.  In no event will the authors be held liable for any damages    */
+/* arising from the use of this software.                                    */
+/*                                                                           */
+/* Permission is granted to anyone to use this software for any purpose,     */
+/* including commercial applications, and to alter it and redistribute it    */
+/* freely, subject to the following restrictions:                            */
+/*                                                                           */
+/* 1. The origin of this software must not be misrepresented; you must not   */
+/*    claim that you wrote the original software. If you use this software   */
+/*    in a product, an acknowledgment in the product documentation would be  */
+/*    appreciated but is not required.                                       */
+/* 2. Altered source versions must be plainly marked as such, and must not   */
+/*    be misrepresented as being the original software.                      */
+/* 3. This notice may not be removed or altered from any source              */
+/*    distribution.                                                          */
+/*                                                                           */
+/*****************************************************************************/
 
 
 
 #include <errno.h>
 #include <ctype.h>
 
-#include "ctrans.h"
+/* common */
+#include "chartype.h"
+#include "tgttrans.h"
+
+/* cc65 */
 #include "datatype.h"
 #include "error.h"
 #include "function.h"
@@ -48,10 +79,14 @@ static const struct Keyword {
     unsigned char   Tok;       /* The token */
     unsigned char   Type;              /* Token type */
 } Keywords [] = {
+    { "__A__",         TOK_A,          TT_C    },
     { "__AX__",                TOK_AX,         TT_C    },
     { "__EAX__",               TOK_EAX,        TT_C    },
+    { "__X__",                 TOK_X,          TT_C    },
+    { "__Y__",                 TOK_Y,          TT_C    },
     { "__asm__",               TOK_ASM,        TT_C    },
     { "__attribute__", TOK_ATTRIBUTE,  TT_C    },
+    { "__far__",       TOK_FAR,        TT_C    },
     { "__fastcall__",          TOK_FASTCALL,   TT_C    },
     { "asm",                   TOK_ASM,        TT_EXT  },
     { "auto",                  TOK_AUTO,       TT_C    },
@@ -66,6 +101,7 @@ static const struct Keyword {
     { "else",                  TOK_ELSE,       TT_C    },
     { "enum",                  TOK_ENUM,       TT_C    },
     { "extern",                TOK_EXTERN,     TT_C    },
+    { "far",           TOK_FAR,        TT_EXT  },
     { "fastcall",              TOK_FASTCALL,   TT_EXT  },
     { "float",                 TOK_FLOAT,      TT_C    },
     { "for",                   TOK_FOR,        TT_C    },
@@ -129,7 +165,7 @@ static int FindKey (const char* Key)
 }
 
 
-                         
+
 static int SkipWhite (void)
 /* Skip white space in the input stream, reading and preprocessing new lines
  * if necessary. Return 0 if end of file is reached, return 1 otherwise.
@@ -142,7 +178,7 @@ static int SkipWhite (void)
            }
            Preprocess ();
        }
-       if (CurC == ' ' || CurC == '\r') {
+       if (IsSpace (CurC)) {
            NextChar ();
        } else {
            return 1;
@@ -162,7 +198,7 @@ void SymName (char* s)
                    *s++ = CurC;
        }
                NextChar ();
-    } while (IsIdent (CurC) || isdigit (CurC));
+    } while (IsIdent (CurC) || IsDigit (CurC));
     *s = '\0';
 }
 
@@ -181,10 +217,10 @@ int IsSym (char *s)
 
 
 
-static void unknown (char C)
+static void UnknownChar (char C)
 /* Error message for unknown character */
 {
-    Error (ERR_INVALID_CHAR, C);
+    Error ("Invalid input character with code %02X", C & 0xFF);
     NextChar ();                       /* Skip */
 }
 
@@ -193,10 +229,10 @@ static void unknown (char C)
 static unsigned hexval (int c)
 /* Convert a hex digit into a value */
 {
-    if (!isxdigit (c)) {
-       Error (ERR_ILLEGAL_HEX_DIGIT);
+    if (!IsXDigit (c)) {
+       Error ("Invalid hexadecimal digit: `%c'", c);
     }
-    if (isdigit (c)) {
+    if (IsDigit (c)) {
        return c - '0';
     } else {
                return toupper (c) - 'A' + 10;
@@ -206,9 +242,9 @@ static unsigned hexval (int c)
 
 
 static void SetTok (int tok)
-/* set nxttok and bump line ptr */
+/* Set NextTok.Tok and bump line ptr */
 {
-    nxttok = tok;
+    NextTok.Tok = tok;
     NextChar ();
 }
 
@@ -275,12 +311,12 @@ static int ParseChar (void)
                i = 0;
                C = CurC - '0';
                        while (NextC >= '0' && NextC <= '7' && i++ < 4) {
-                   NextChar ();
+                   NextChar ();
                    C = (C << 3) | (CurC - '0');
                }
                break;
            default:
-               Error (ERR_ILLEGAL_CHARCONST);
+               Error ("Illegal character constant");
                C = ' ';
                break;
        }
@@ -310,16 +346,20 @@ static void CharConst (void)
 
     /* Check for closing quote */
     if (CurC != '\'') {
-               Error (ERR_QUOTE_EXPECTED);
+               Error ("`\'' expected");
     } else {
        /* Skip the quote */
        NextChar ();
     }
 
     /* Setup values and attributes */
-    nxttok  = TOK_CCONST;
-    nxtval  = SignExtendChar (ctrans (C));     /* Translate into target charset */
-    nxttype = type_int;                                /* Character constants have type int */
+    NextTok.Tok  = TOK_CCONST;
+
+    /* Translate into target charset */
+    NextTok.IVal = SignExtendChar (TgtTranslateChar (C));
+
+    /* Character constants have type int */
+    NextTok.Type = type_int;
 }
 
 
@@ -327,8 +367,8 @@ static void CharConst (void)
 static void StringConst (void)
 /* Parse a quoted string */
 {
-    nxtval = GetLiteralOffs ();
-    nxttok = TOK_SCONST;
+    NextTok.IVal = GetLiteralPoolOffs ();
+    NextTok.Tok  = TOK_SCONST;
 
     /* Be sure to concatenate strings */
     while (CurC == '\"') {
@@ -338,7 +378,7 @@ static void StringConst (void)
 
        while (CurC != '\"') {
            if (CurC == '\0') {
-               Error (ERR_UNEXPECTED_NEWLINE);
+               Error ("Unexpected newline");
                break;
            }
            AddLiteralChar (ParseChar ());
@@ -363,21 +403,31 @@ void NextToken (void)
 {
     ident token;
 
+    /* We have to skip white space here before shifting tokens, since the
+     * tokens and the current line info is invalid at startup and will get
+     * initialized by reading the first time from the file. Remember if
+     * we were at end of input and handle that later.
+     */
+    int GotEOF = (SkipWhite() == 0);
+
     /* Current token is the lookahead token */
+    if (CurTok.LI) {
+       ReleaseLineInfo (CurTok.LI);
+    }
     CurTok = NextTok;
 
     /* Remember the starting position of the next token */
-    NextTok.Pos = GetCurrentLine();
+    NextTok.LI = UseLineInfo (GetCurLineInfo ());
 
-    /* Skip spaces and read the next line if needed */
-    if (SkipWhite () == 0) {
+    /* Now handle end of input. */
+    if (GotEOF) {
        /* End of file reached */
-       nxttok = TOK_CEOF;
+       NextTok.Tok = TOK_CEOF;
        return;
     }
 
     /* Determine the next token from the lookahead */
-    if (isdigit (CurC)) {
+    if (IsDigit (CurC)) {
 
        /* A number */
        int HaveSuffix;         /* True if we have a type suffix */
@@ -396,16 +446,16 @@ void NextToken (void)
            NextChar ();
            if (toupper (CurC) == 'X') {
                base = 16;
-               nxttype = type_uint;
+               NextTok.Type = type_uint;
                        NextChar ();    /* gobble "x" */
            } else {
                base = 8;
            }
        }
        while (1) {
-           if (isdigit (CurC)) {
+           if (IsDigit (CurC)) {
                k = k * base + (CurC - '0');
-           } else if (base == 16 && isxdigit (CurC)) {
+           } else if (base == 16 && IsXDigit (CurC)) {
                k = (k << 4) + hexval (CurC);
            } else {
                break;          /* not digit */
@@ -446,7 +496,7 @@ void NextToken (void)
             * warning.
             */
                    if (k <= 0xFFFF && (types & IT_UINT) == 0 && !HaveSuffix) {
-               Warning (WARN_CONSTANT_IS_LONG);
+               Warning ("Constant is long");
            }
        }
        if (k > 0xFFFF) {
@@ -460,25 +510,25 @@ void NextToken (void)
 
        /* Now set the type string to the smallest type in types */
        if (types & IT_INT) {
-           nxttype = type_int;
+           NextTok.Type = type_int;
        } else if (types & IT_UINT) {
-           nxttype = type_uint;
+           NextTok.Type = type_uint;
        } else if (types & IT_LONG) {
-           nxttype = type_long;
+           NextTok.Type = type_long;
        } else {
-           nxttype = type_ulong;
+           NextTok.Type = type_ulong;
        }
 
        /* Set the value and the token */
-       nxtval = k;
-       nxttok = TOK_ICONST;
+       NextTok.IVal = k;
+       NextTok.Tok  = TOK_ICONST;
        return;
     }
 
     if (IsSym (token)) {
 
        /* Check for a keyword */
-       if ((nxttok = FindKey (token)) != TOK_IDENT) {
+       if ((NextTok.Tok = FindKey (token)) != TOK_IDENT) {
            /* Reserved word found */
            return;
        }
@@ -486,24 +536,19 @@ void NextToken (void)
        if (token [0] == '_') {
            /* Special symbols */
            if (strcmp (token, "__FILE__") == 0) {
-               nxtval = AddLiteral (GetCurrentFile());
-               nxttok = TOK_SCONST;
+               NextTok.IVal = AddLiteral (GetCurrentFile());
+               NextTok.Tok  = TOK_SCONST;
                return;
            } else if (strcmp (token, "__LINE__") == 0) {
-               nxttok  = TOK_ICONST;
-               nxtval  = GetCurrentLine();
-               nxttype = type_int;
-               return;
-           } else if (strcmp (token, "__fixargs__") == 0) {
-               nxttok  = TOK_ICONST;
-               nxtval  = GetParamSize (CurrentFunc);
-               nxttype = type_uint;
+               NextTok.Tok  = TOK_ICONST;
+               NextTok.IVal = GetCurrentLine();
+               NextTok.Type = type_int;
                return;
            } else if (strcmp (token, "__func__") == 0) {
                /* __func__ is only defined in functions */
                if (CurrentFunc) {
-                   nxtval = AddLiteral (GetFuncName (CurrentFunc));
-                   nxttok = TOK_SCONST;
+                   NextTok.IVal = AddLiteral (GetFuncName (CurrentFunc));
+                   NextTok.Tok  = TOK_SCONST;
                    return;
                }
            }
@@ -523,7 +568,7 @@ void NextToken (void)
            if (CurC == '=') {
                SetTok (TOK_NE);
            } else {
-               nxttok = TOK_BOOL_NOT;
+               NextTok.Tok = TOK_BOOL_NOT;
            }
            break;
 
@@ -536,7 +581,7 @@ void NextToken (void)
            if (CurC == '=') {
                SetTok (TOK_MOD_ASSIGN);
            } else {
-               nxttok = TOK_MOD;
+               NextTok.Tok = TOK_MOD;
            }
            break;
 
@@ -550,7 +595,7 @@ void NextToken (void)
                    SetTok (TOK_AND_ASSIGN);
                    break;
                default:
-                   nxttok = TOK_AND;
+                   NextTok.Tok = TOK_AND;
            }
            break;
 
@@ -571,7 +616,7 @@ void NextToken (void)
            if (CurC == '=') {
                SetTok (TOK_MUL_ASSIGN);
            } else {
-               nxttok = TOK_STAR;
+               NextTok.Tok = TOK_STAR;
            }
            break;
 
@@ -585,7 +630,7 @@ void NextToken (void)
                    SetTok (TOK_PLUS_ASSIGN);
                    break;
                default:
-                   nxttok = TOK_PLUS;
+                   NextTok.Tok = TOK_PLUS;
            }
            break;
 
@@ -606,7 +651,7 @@ void NextToken (void)
                    SetTok (TOK_PTR_REF);
                    break;
                default:
-                   nxttok = TOK_MINUS;
+                   NextTok.Tok = TOK_MINUS;
            }
            break;
 
@@ -617,10 +662,10 @@ void NextToken (void)
                if (CurC == '.') {
                    SetTok (TOK_ELLIPSIS);
                } else {
-                   unknown (CurC);
+                   UnknownChar (CurC);
                }
            } else {
-               nxttok = TOK_DOT;
+               NextTok.Tok = TOK_DOT;
            }
            break;
 
@@ -629,7 +674,7 @@ void NextToken (void)
            if (CurC == '=') {
                SetTok (TOK_DIV_ASSIGN);
            } else {
-               nxttok = TOK_DIV;
+               NextTok.Tok = TOK_DIV;
            }
            break;
 
@@ -652,11 +697,11 @@ void NextToken (void)
                    if (CurC == '=') {
                        SetTok (TOK_SHL_ASSIGN);
                    } else {
-                       nxttok = TOK_SHL;
+                       NextTok.Tok = TOK_SHL;
                    }
                    break;
                default:
-                   nxttok = TOK_LT;
+                   NextTok.Tok = TOK_LT;
            }
            break;
 
@@ -665,7 +710,7 @@ void NextToken (void)
                    if (CurC == '=') {
                SetTok (TOK_EQ);
            } else {
-               nxttok = TOK_ASSIGN;
+               NextTok.Tok = TOK_ASSIGN;
            }
            break;
 
@@ -680,11 +725,11 @@ void NextToken (void)
                    if (CurC == '=') {
                        SetTok (TOK_SHR_ASSIGN);
                    } else {
-                       nxttok = TOK_SHR;
+                       NextTok.Tok = TOK_SHR;
                    }
                    break;
                default:
-                   nxttok = TOK_GT;
+                   NextTok.Tok = TOK_GT;
            }
            break;
 
@@ -705,7 +750,7 @@ void NextToken (void)
            if (CurC == '=') {
                SetTok (TOK_XOR_ASSIGN);
            } else {
-               nxttok = TOK_XOR;
+               NextTok.Tok = TOK_XOR;
            }
            break;
 
@@ -723,7 +768,7 @@ void NextToken (void)
                    SetTok (TOK_OR_ASSIGN);
                    break;
                default:
-                   nxttok = TOK_OR;
+                   NextTok.Tok = TOK_OR;
            }
            break;
 
@@ -742,13 +787,13 @@ void NextToken (void)
            } while (CurC == ' ');
            if (!IsSym (token) || strcmp (token, "pragma") != 0) {
                /* OOPS - should not happen */
-               Error (ERR_CPP_DIRECTIVE_EXPECTED);
+               Error ("Preprocessor directive expected");
            }
-           nxttok = TOK_PRAGMA;
+           NextTok.Tok = TOK_PRAGMA;
            break;
 
        default:
-                   unknown (CurC);
+                   UnknownChar (CurC);
 
     }
 
@@ -756,15 +801,39 @@ void NextToken (void)
 
 
 
-void Consume (token_t Token, unsigned ErrNum)
+void SkipTokens (const token_t* TokenList, unsigned TokenCount)
+/* Skip tokens until we reach TOK_CEOF or a token in the given token list.
+ * This routine is used for error recovery.
+ */
+{                                                             
+    while (CurTok.Tok != TOK_CEOF) {
+
+       /* Check if the current token is in the token list */
+       unsigned I;
+       for (I = 0; I < TokenCount; ++I) {
+           if (CurTok.Tok == TokenList[I]) {
+               /* Found a token in the list */
+               return;
+           }
+       }
+
+       /* Not in the list: Skip it */
+       NextToken ();
+
+    }
+}
+
+
+
+void Consume (token_t Token, const char* ErrorMsg)
 /* Eat token if it is the next in the input stream, otherwise print an error
  * message.
  */
 {
-    if (curtok == Token) {
+    if (CurTok.Tok == Token) {
        NextToken ();
     } else {
-               Error (ErrNum);
+               Error (ErrorMsg);
     }
 }
 
@@ -773,7 +842,7 @@ void Consume (token_t Token, unsigned ErrNum)
 void ConsumeColon (void)
 /* Check for a colon and skip it. */
 {
-    Consume (TOK_COLON, ERR_COLON_EXPECTED);
+    Consume (TOK_COLON, "`:' expected");
 }
 
 
@@ -782,11 +851,27 @@ void ConsumeSemi (void)
 /* Check for a semicolon and skip it. */
 {
     /* Try do be smart about typos... */
-    if (curtok == TOK_SEMI) {
+    if (CurTok.Tok == TOK_SEMI) {
+       NextToken ();
+    } else {
+       Error ("`;' expected");
+       if (CurTok.Tok == TOK_COLON || CurTok.Tok == TOK_COMMA) {
+           NextToken ();
+       }
+    }
+}
+
+
+
+void ConsumeComma (void)
+/* Check for a comma and skip it. */
+{
+    /* Try do be smart about typos... */
+    if (CurTok.Tok == TOK_COMMA) {
        NextToken ();
     } else {
-       Error (ERR_SEMICOLON_EXPECTED);
-       if (curtok == TOK_COLON || curtok == TOK_COMMA) {
+       Error ("`,' expected");
+       if (CurTok.Tok == TOK_SEMI) {
            NextToken ();
        }
     }
@@ -797,7 +882,7 @@ void ConsumeSemi (void)
 void ConsumeLParen (void)
 /* Check for a left parenthesis and skip it */
 {
-    Consume (TOK_LPAREN, ERR_LPAREN_EXPECTED);
+    Consume (TOK_LPAREN, "`(' expected");
 }
 
 
@@ -805,7 +890,7 @@ void ConsumeLParen (void)
 void ConsumeRParen (void)
 /* Check for a right parenthesis and skip it */
 {
-    Consume (TOK_RPAREN, ERR_RPAREN_EXPECTED);
+    Consume (TOK_RPAREN, "`)' expected");
 }
 
 
@@ -813,7 +898,7 @@ void ConsumeRParen (void)
 void ConsumeLBrack (void)
 /* Check for a left bracket and skip it */
 {
-    Consume (TOK_LBRACK, ERR_LBRACK_EXPECTED);
+    Consume (TOK_LBRACK, "`[' expected");
 }
 
 
@@ -821,7 +906,7 @@ void ConsumeLBrack (void)
 void ConsumeRBrack (void)
 /* Check for a right bracket and skip it */
 {
-    Consume (TOK_RBRACK, ERR_RBRACK_EXPECTED);
+    Consume (TOK_RBRACK, "`]' expected");
 }
 
 
@@ -829,7 +914,7 @@ void ConsumeRBrack (void)
 void ConsumeLCurly (void)
 /* Check for a left curly brace and skip it */
 {
-    Consume (TOK_LCURLY, ERR_LCURLY_EXPECTED);
+    Consume (TOK_LCURLY, "`{' expected");
 }
 
 
@@ -837,7 +922,7 @@ void ConsumeLCurly (void)
 void ConsumeRCurly (void)
 /* Check for a right curly brace and skip it */
 {
-    Consume (TOK_RCURLY, ERR_RCURLY_EXPECTED);
+    Consume (TOK_RCURLY, "`}' expected");
 }