words.py

#!/usr/bin/python

from os import path
import pyexcel as pe
from enum import Enum, auto
import constants as c
import re
import pprint
import openpyxl


class Language(Enum):
    English = auto()
    German = auto()


def get_sheet_name(lang: Language):
    if lang == Language.English:
        sheet_can_include = c.XL_SHEET_NAME_INCLUDE_ENGLISH
    else:
        sheet_can_include = c.XL_SHEET_NAME_INCLUDE_GERMAN

    sheets = list()
    xlsheets = pe.get_book(file_name=c.XL_FILE).sheet_names()

    try:
        for work_sheet in sheet_can_include:
            [sheets.append(sheet) for sheet in xlsheets if re.search(
                work_sheet.lower(), sheet.lower())]
        return sheets[0]
    except:
        raise NotImplementedError('Sheet is not exist')


def to_transcript(words):
    unique_words = dict()
    for entry in words:
        word = re.sub(r"\(*\)*|[!<>]|(-\w+)", "",
                      entry[c.ENTRY_PART['word']])
        transcript = re.sub(
            r"\[*?\]*?|[!/]", "", entry[c.ENTRY_PART['transcription']])

        word_to_array = word.split()
        transcript_to_array = transcript.split()

        for i, j in enumerate(word_to_array):
            if len(word_to_array) > 0 and len(word_to_array) <= \
                    len(transcript_to_array):
                unique_words[j] = transcript_to_array[i]
            else:
                if j not in unique_words and re.findall('[a-zA-Z]', j):
                    unique_words[j] = ''
    return unique_words


def get_words_dictionary(lang: Language):
    sheet_to_use = get_sheet_name(lang)
    words_dictionary = pe.get_records(file_name=c.XL_FILE,
                                      sheet_name=sheet_to_use,
                                      name_columns_by_row=1)
    return words_dictionary


def get_words_list(lang: Language):
    sheet_to_use = get_sheet_name(lang)
    entry_list = pe.get_array(file_name=c.XL_FILE,
                              sheet_name=sheet_to_use,
                              start_column=c.XL_TABLE_START_POSITION['column'],
                              start_row=c.XL_TABLE_START_POSITION['row'])
    return entry_list


def write_transcription(lang: Language, word_dict: dict = None):
    sheet_to_use = get_sheet_name(lang)
    wb = openpyxl.load_workbook(filename=c.XL_FILE)
    sheet = wb[sheet_to_use]
    for row in sheet.iter_rows(min_row=c.XL_TABLE_START_POSITION['row'] + 1,
                               min_col=c.XL_TABLE_START_POSITION['column']):
        # word: 1
        # transcription: 4
        row[4].value = prepare_entry(row[1].value, word_dict)
    wb.save(filename=c.XL_FILE)


def prepare_entry(word: str, word_dict: dict):
    if word_dict is not None:
        depart = word.split()
        result = list()

        for w in depart:
            if re.findall('[a-zA-Z]', w):
                s = word_dict.get(w, None)
                if s is None:
                    s = '...'
                print(s)
                result.append(s)
        result_string = '[{0}]'.format(
            re.sub(r'\[*?\]*?\'*?', '', ' '.join(str(x) for x in result)))
        return result_string.replace(',', ';')


if __name__ == '__main__':
    # r = get_words_list(Language.English)
    # pprint.pprint(to_transcript(r))
    write_transcription(Language.English)