Tokenizer

This repository contains 3 modules:

tokenizer
token
example

tokenizer module

class StringTokenizer
params:

text: String to break into tokens
tokentypes: Dictionary of token names
keyword: Dictionary of reserved names(mostly for programming languages)

the most important method is create_token_generator; builds and returns
a generator object which yields the tokens when needed.

token module

class Token
params:

type: Name of token
value: token value

represents a token object.

example module

serves as a pointer for however needs help

Usage

Before you can successfully use StringTokenizer, you must create a dictionary
of token types and values example:

tokentype = {
    "INT": "INT",
    "FLOAT": "FLOAT",
    "<": "GT"
}

or you can import the default in the token module if it matches your use case.

Complete Example

make imports

from tokenizer import StringTokenizer
from token import tokentype

create instance of StringTokenizer class and dummy text

text = """
    names = "Josiah Augustine"
    nick = "Austitech"
    age = 25
    occupation = "Student"
"""

lexer = StringTokenizer(text=text, tokentype=tokentype)

get generator object to yield tokens

token_generator = lexer.create_token_generator()

conclusion

Use generator object to yield tokens where needed examples:

# get single token
token = next(token_generator)

# using a loop
for token in token_generator:
    print(token)

Contributions

Contribution and suggestion of ways to improve is welcome

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
LICENSE		LICENSE
README.md		README.md
example.py		example.py
test.ex		test.ex
token.py		token.py
tokenizer.py		tokenizer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LICENSE

LICENSE

README.md

README.md

example.py

example.py

test.ex

test.ex

token.py

token.py

tokenizer.py

tokenizer.py

Repository files navigation

Tokenizer

tokenizer module

token module

example module

Usage

Complete Example

make imports

create instance of StringTokenizer class and dummy text

get generator object to yield tokens

conclusion

Contributions

About

Releases

Packages

Languages

License

austitech/Tokenizer

Folders and files

Latest commit

History

Repository files navigation

Tokenizer

tokenizer module

token module

example module

Usage

Complete Example

make imports

create instance of StringTokenizer class and dummy text

get generator object to yield tokens

conclusion

Contributions

About

Resources

License

Stars

Watchers

Forks

Languages