add parser
This commit is contained in:
parent
ae098219b3
commit
669b0458cc
35
src/lexer.c
35
src/lexer.c
@ -1,5 +1,6 @@
|
|||||||
#include "lexer.h"
|
#include "lexer.h"
|
||||||
#include <stdbool.h>
|
#include <stdbool.h>
|
||||||
|
#include <string.h>
|
||||||
|
|
||||||
bool lexer_done(const Lexer* lexer) { return lexer->index >= lexer->length; }
|
bool lexer_done(const Lexer* lexer) { return lexer->index >= lexer->length; }
|
||||||
|
|
||||||
@ -121,3 +122,37 @@ Token lexer_next(Lexer* lexer)
|
|||||||
else
|
else
|
||||||
return lexer_level2(lexer);
|
return lexer_level2(lexer);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
char* pos_string(Position pos, size_t length, const char* text)
|
||||||
|
{
|
||||||
|
return strndup(&text[pos.index], length);
|
||||||
|
}
|
||||||
|
|
||||||
|
const char* token_type_to_string(TokenType type)
|
||||||
|
{
|
||||||
|
switch (type) {
|
||||||
|
case TokenTypeEof:
|
||||||
|
return "Eof";
|
||||||
|
case TokenTypeInvalidChar:
|
||||||
|
return "InvalidChar";
|
||||||
|
case TokenTypeInt:
|
||||||
|
return "Int";
|
||||||
|
case TokenTypePlus:
|
||||||
|
return "Plus";
|
||||||
|
case TokenTypeMinus:
|
||||||
|
return "Minus";
|
||||||
|
case TokenTypeAsterisk:
|
||||||
|
return "Asterisk";
|
||||||
|
case TokenTypeSlash:
|
||||||
|
return "Slash";
|
||||||
|
case TokenTypeLParen:
|
||||||
|
return "LParen";
|
||||||
|
case TokenTypeRParen:
|
||||||
|
return "RParen";
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
char* token_to_string(Token* token, const char* text)
|
||||||
|
{
|
||||||
|
// frick it late
|
||||||
|
}
|
||||||
|
@ -8,6 +8,8 @@ typedef struct {
|
|||||||
int line, col;
|
int line, col;
|
||||||
} Position;
|
} Position;
|
||||||
|
|
||||||
|
char* pos_string(Position pos, size_t length, const char* text);
|
||||||
|
|
||||||
typedef enum {
|
typedef enum {
|
||||||
TokenTypeEof,
|
TokenTypeEof,
|
||||||
TokenTypeInvalidChar,
|
TokenTypeInvalidChar,
|
||||||
@ -20,12 +22,16 @@ typedef enum {
|
|||||||
TokenTypeRParen,
|
TokenTypeRParen,
|
||||||
} TokenType;
|
} TokenType;
|
||||||
|
|
||||||
|
const char* token_type_to_string(TokenType type);
|
||||||
|
|
||||||
typedef struct {
|
typedef struct {
|
||||||
TokenType type;
|
TokenType type;
|
||||||
size_t index, length;
|
size_t index, length;
|
||||||
int line, col;
|
int line, col;
|
||||||
} Token;
|
} Token;
|
||||||
|
|
||||||
|
char* token_to_string(Token* token, const char* text);
|
||||||
|
|
||||||
typedef struct {
|
typedef struct {
|
||||||
const char* text;
|
const char* text;
|
||||||
size_t index, length;
|
size_t index, length;
|
||||||
|
202
src/parser.c
Normal file
202
src/parser.c
Normal file
@ -0,0 +1,202 @@
|
|||||||
|
#include "parser.h"
|
||||||
|
#include "lexer.h"
|
||||||
|
#include <stdbool.h>
|
||||||
|
#include <stdint.h>
|
||||||
|
#include <stdio.h>
|
||||||
|
#include <stdlib.h>
|
||||||
|
#include <string.h>
|
||||||
|
|
||||||
|
#define PARSER_ERROR_BUFFER_SIZE 512
|
||||||
|
|
||||||
|
Expr* error_expr(Position pos, const char* message)
|
||||||
|
{
|
||||||
|
Expr* node = malloc(sizeof(Expr));
|
||||||
|
*node = (Expr) {
|
||||||
|
.type = ExprTypeError,
|
||||||
|
.error = (ErrorExpr) {
|
||||||
|
.pos = pos,
|
||||||
|
.message = strdup(message),
|
||||||
|
},
|
||||||
|
};
|
||||||
|
return node;
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* int_expr(int64_t value)
|
||||||
|
{
|
||||||
|
Expr* node = malloc(sizeof(Expr));
|
||||||
|
*node = (Expr) {
|
||||||
|
.type = ExprTypeInt,
|
||||||
|
.int_expr = (IntExpr) {
|
||||||
|
.value = value,
|
||||||
|
},
|
||||||
|
};
|
||||||
|
return node;
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* unary_expr(UnaryExprType type, Expr* subject)
|
||||||
|
{
|
||||||
|
Expr* node = malloc(sizeof(Expr));
|
||||||
|
*node = (Expr) {
|
||||||
|
.type = ExprTypeUnary,
|
||||||
|
.unary = (UnaryExpr) {
|
||||||
|
.type = type,
|
||||||
|
.subject = subject,
|
||||||
|
},
|
||||||
|
};
|
||||||
|
return node;
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* binary_expr(BinaryExprType type, Expr* left, Expr* right)
|
||||||
|
{
|
||||||
|
Expr* node = malloc(sizeof(Expr));
|
||||||
|
*node = (Expr) {
|
||||||
|
.type = ExprTypeBinary,
|
||||||
|
.binary = (BinaryExpr) {
|
||||||
|
.type = type,
|
||||||
|
.left = left,
|
||||||
|
.right = right,
|
||||||
|
},
|
||||||
|
};
|
||||||
|
return node;
|
||||||
|
}
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
const char* text;
|
||||||
|
size_t length;
|
||||||
|
Lexer* lexer;
|
||||||
|
Token current;
|
||||||
|
} Parser;
|
||||||
|
|
||||||
|
bool parser_done(Parser* parser)
|
||||||
|
{
|
||||||
|
return parser->current.type == TokenTypeEof;
|
||||||
|
}
|
||||||
|
|
||||||
|
bool parser_current_is(Parser* parser, TokenType type)
|
||||||
|
{
|
||||||
|
return !parser_done(parser) && parser->current.type == type;
|
||||||
|
}
|
||||||
|
|
||||||
|
void parser_step(Parser* parser)
|
||||||
|
{
|
||||||
|
parser->current = lexer_next(parser->lexer);
|
||||||
|
}
|
||||||
|
|
||||||
|
Position parser_pos(Parser* parser)
|
||||||
|
{
|
||||||
|
return (Position) {
|
||||||
|
.index = parser->current.index,
|
||||||
|
.line = parser->current.line,
|
||||||
|
.col = parser->current.col,
|
||||||
|
};
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_error(Parser* parser, const char* message)
|
||||||
|
{
|
||||||
|
size_t line_width = 0;
|
||||||
|
for (size_t i = 0;
|
||||||
|
i < parser->length && parser->text[parser->current.index + i] != '\r'
|
||||||
|
&& parser->text[parser->current.index + i] != '\n';
|
||||||
|
++i)
|
||||||
|
line_width = i;
|
||||||
|
|
||||||
|
char line[PARSER_ERROR_BUFFER_SIZE] = { 0 };
|
||||||
|
|
||||||
|
char underline_indent[512] = { 0 };
|
||||||
|
if (line_width > 0)
|
||||||
|
memset(underline_indent, ' ', line_width - 1);
|
||||||
|
|
||||||
|
char underline[512] = { '^', 0 };
|
||||||
|
memset(underline, '^', parser->current.length);
|
||||||
|
|
||||||
|
char formatted[PARSER_ERROR_BUFFER_SIZE];
|
||||||
|
snprintf(
|
||||||
|
formatted,
|
||||||
|
PARSER_ERROR_BUFFER_SIZE,
|
||||||
|
"error: %s\n |\n %-4d|%s\n |%s%s\n",
|
||||||
|
message,
|
||||||
|
parser->current.line,
|
||||||
|
line,
|
||||||
|
underline_indent,
|
||||||
|
underline
|
||||||
|
);
|
||||||
|
return error_expr(parser_pos(parser), formatted);
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_unknown_token_error(Parser* parser) { }
|
||||||
|
|
||||||
|
Expr* parser_operand(Parser* parser)
|
||||||
|
{
|
||||||
|
if (parser_current_is(parser, TokenTypeInt)) {
|
||||||
|
return NULL;
|
||||||
|
} else {
|
||||||
|
parser_step(parser);
|
||||||
|
return parser_error(parser, "invalid token");
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_unary(Parser* parser)
|
||||||
|
{
|
||||||
|
if (parser_current_is(parser, TokenTypeMinus)) {
|
||||||
|
parser_step(parser);
|
||||||
|
return unary_expr(UnaryExprTypeNegate, parser_operand(parser));
|
||||||
|
} else {
|
||||||
|
return parser_operand(parser);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_multiply_divide(Parser* parser)
|
||||||
|
{
|
||||||
|
Expr* left = parser_unary(parser);
|
||||||
|
while (!parser_done(parser)) {
|
||||||
|
if (parser_current_is(parser, TokenTypeAsterisk)) {
|
||||||
|
parser_step(parser);
|
||||||
|
Expr* right = parser_unary(parser);
|
||||||
|
left = binary_expr(BinaryExprTypeMultiply, left, right);
|
||||||
|
} else if (parser_current_is(parser, TokenTypeSlash)) {
|
||||||
|
parser_step(parser);
|
||||||
|
Expr* right = parser_unary(parser);
|
||||||
|
left = binary_expr(BinaryExprTypeDivide, left, right);
|
||||||
|
} else {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return left;
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_add_subtract(Parser* parser)
|
||||||
|
{
|
||||||
|
Expr* left = parser_multiply_divide(parser);
|
||||||
|
while (!parser_done(parser)) {
|
||||||
|
if (parser_current_is(parser, TokenTypePlus)) {
|
||||||
|
parser_step(parser);
|
||||||
|
Expr* right = parser_multiply_divide(parser);
|
||||||
|
left = binary_expr(BinaryExprTypeAdd, left, right);
|
||||||
|
} else if (parser_current_is(parser, TokenTypeMinus)) {
|
||||||
|
parser_step(parser);
|
||||||
|
Expr* right = parser_multiply_divide(parser);
|
||||||
|
left = binary_expr(BinaryExprTypeSubtract, left, right);
|
||||||
|
} else {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return left;
|
||||||
|
}
|
||||||
|
|
||||||
|
Expr* parser_expr(Parser* parser) { return parser_add_subtract(parser); }
|
||||||
|
|
||||||
|
Expr* parse(Lexer* lexer, const char* text, size_t length)
|
||||||
|
{
|
||||||
|
Parser parser = {
|
||||||
|
.text = text,
|
||||||
|
.length = length,
|
||||||
|
.lexer = lexer,
|
||||||
|
.current = lexer_next(lexer),
|
||||||
|
};
|
||||||
|
return parser_expr(&parser);
|
||||||
|
}
|
||||||
|
|
||||||
|
void free_expr(Expr* expr)
|
||||||
|
{
|
||||||
|
//
|
||||||
|
}
|
60
src/parser.h
Normal file
60
src/parser.h
Normal file
@ -0,0 +1,60 @@
|
|||||||
|
#ifndef PARSER_H
|
||||||
|
#define PARSER_H
|
||||||
|
|
||||||
|
#include "lexer.h"
|
||||||
|
#include <stdint.h>
|
||||||
|
|
||||||
|
typedef enum {
|
||||||
|
ExprTypeError,
|
||||||
|
ExprTypeInt,
|
||||||
|
ExprTypeUnary,
|
||||||
|
ExprTypeBinary,
|
||||||
|
} ExprType;
|
||||||
|
|
||||||
|
typedef struct Expr Expr;
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
Position pos;
|
||||||
|
char* message;
|
||||||
|
} ErrorExpr;
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
int64_t value;
|
||||||
|
} IntExpr;
|
||||||
|
|
||||||
|
typedef enum {
|
||||||
|
UnaryExprTypeNegate,
|
||||||
|
} UnaryExprType;
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
UnaryExprType type;
|
||||||
|
Expr* subject;
|
||||||
|
} UnaryExpr;
|
||||||
|
|
||||||
|
typedef enum {
|
||||||
|
BinaryExprTypeAdd,
|
||||||
|
BinaryExprTypeSubtract,
|
||||||
|
BinaryExprTypeMultiply,
|
||||||
|
BinaryExprTypeDivide,
|
||||||
|
} BinaryExprType;
|
||||||
|
|
||||||
|
typedef struct {
|
||||||
|
BinaryExprType type;
|
||||||
|
Expr* left;
|
||||||
|
Expr* right;
|
||||||
|
} BinaryExpr;
|
||||||
|
|
||||||
|
struct Expr {
|
||||||
|
ExprType type;
|
||||||
|
union {
|
||||||
|
ErrorExpr error;
|
||||||
|
IntExpr int_expr;
|
||||||
|
UnaryExpr unary;
|
||||||
|
BinaryExpr binary;
|
||||||
|
};
|
||||||
|
};
|
||||||
|
|
||||||
|
Expr* parse(Lexer* lexer, const char* text, size_t length);
|
||||||
|
void free_expr(Expr* expr);
|
||||||
|
|
||||||
|
#endif
|
Loading…
Reference in New Issue
Block a user