Esempi in Python per Doc.tag_morph, esempi in Python per natasha.Doc.tag_morph

Esempio n. 1

0

Mostra file

def __FuncTokLem(text):
 doc = Doc(text)

 doc.segment(segmenter)
 doc.tag_morph(morph_tagger)
 for token in doc.tokens:
     token.lemmatize(morph_vocab)
 return doc.tokens[0].text

Esempio n. 2

0

Mostra file

File: nlp.py Progetto: blanchefort/freyrmonitoring

def lemmatize(text):
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)

    for token in doc.tokens:
        token.lemmatize(morph_vocab)
    return [token.lemma for token in doc.tokens]

Esempio n. 3

0

Mostra file

File: MainForNatasha.py Progetto: agentdolphin/knowledge_base

def process_text_file(text_file, mongo=None):
    # nlp = spacy.load('ru_core_news_sm')
    segmenter = Segmenter()
    emb = NewsEmbedding()
    morph_tagger = NewsMorphTagger(emb)
    syntax_parser = NewsSyntaxParser(emb)

    with open(text_file, 'r', encoding='utf-8') as file:
        file_name = file.name[2:]
        line_number = 0
        for line in file:
            line_number += 1
            if line_number % 100 == 0:
                logging.info(f'Processed line {line_number}')
                if line_number >= 100000:
                    return
            sents = [sent.text for sent in sentenize(line)]
            sentence_number = 0
            for sentence in sents:
                doc = Doc(sentence)
                doc.segment(segmenter)
                doc.tag_morph(morph_tagger)
                doc.parse_syntax(syntax_parser)
                sentence_number += 1
                sentence_tokens = doc.tokens

                # sentence_tokens = [
                #     {
                #         'text': token.text,
                #         'lemma': token.lemma_,
                #         'pos': token.pos_,
                #         'tag': token.tag_,
                #         'dep': token.dep_,
                #         'shape': token.shape_,
                #         'is_alpha': token.is_alpha,
                #         'is_stop': token.is_stop
                #     } for token in sentence]
                words = markup_words(doc.syntax)
                deps = token_deps(doc.syntax.tokens)
                html = show_dep_markup(words, deps)
                save_html(
                    html,
                    f'./htmls/dependency_plot_{file_name}_{line_number}_{sentence_number}.html'
                )
                #
                # svg = displacy.render(sentence, style='dep', options={'compact': False, 'bg': '#09a3d5',
                #                                                       'color': 'white', 'font': 'Source Sans Pro'})
                # output_path = Path(f'./images/dependency_plot_{file_name}_{line_number}_{sentence_number}.svg')
                # output_path.open('w', encoding='utf-8').write(svg)
                PatternExtractor.extract_relations(
                    file_name,
                    line_number,
                    sentence_number,
                    sentence,
                    sentence_tokens,
                    # noun_phrases,
                    # mongo=mongo
                )

Esempio n. 4

0

Mostra file

File: views.py Progetto: vmoshikov/cp_final_mco

def calculate_skills_assessment(text, ca):
    vacancy_key_skills = list(
        map(
            lambda x: x.lower(),
            list(ca.core_vacancy.key_skills.all().values_list('title',
                                                              flat=True))))
    vacancy_additional_skills = list(
        map(
            lambda x: x.lower(),
            list(ca.core_vacancy.additional_skills.all().values_list(
                'title', flat=True))))

    segmenter = Segmenter()
    emb = NewsEmbedding()
    morph_tagger = NewsMorphTagger(emb)
    syntax_parser = NewsSyntaxParser(emb)
    morph_vocab = MorphVocab()

    text = extract_text(ca.cv_file.path)

    doc = Doc(text)

    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)

    cv_key_skills = []
    cv_additional_skills = []

    for token in doc.tokens:
        token.lemmatize(morph_vocab)
        print(token)
        if token.lemma in vacancy_key_skills and token.lemma not in cv_key_skills:
            cv_key_skills.append(token.lemma)
            print(token.lemma)

        if token.lemma in vacancy_additional_skills and token.lemma not in cv_additional_skills:
            cv_additional_skills.append(token.lemma)
            print(token.lemma)

    candidate_conformity = {
        "key_skills": {
            "vacancy_key_skills": vacancy_key_skills,
            "cv_key_skills": cv_key_skills,
            "conformity_percent": len(cv_key_skills) / len(vacancy_key_skills)
        },
        "additional_skills": {
            "vacancy_additional_skills":
            vacancy_additional_skills,
            "cv_additional_skills":
            cv_additional_skills,
            "conformity_percent":
            len(cv_additional_skills) / len(vacancy_additional_skills)
        }
    }

    return candidate_conformity

Esempio n. 5

0

Mostra file

File: main_natasha.py Progetto: avidale/debug-tgalice

 def respond(self, ctx: Context):
     if not ctx.message_text:
         return Response('привет!')
     doc = Doc(ctx.message_text)
     doc.segment(segmenter)
     doc.tag_morph(morph_tagger)
     for token in doc.tokens:
         token.lemmatize(morph_vocab)
     return Response('Леммы: ' + ' '.join([t.lemma for t in doc.tokens]))

Esempio n. 6

0

Mostra file

File: DateTimeAnalyser.py Progetto: kapustinalex/sandbox

 def get_extended_lemms(self, str_):
     doc = Doc(str_)
     doc.segment(self.segmenter)
     doc.tag_morph(self.morph_tagger)
     lemms = list()
     for token in doc.tokens:
         token.lemmatize(self.morph_vocab)
         lemms.append([token.lemma, token.text])
     return lemms

Esempio n. 7

0

Mostra file

File: DateTimeAnalyser.py Progetto: kapustinalex/sandbox

 def get_tokens(self, str_):
     lemms = list()
     doc = Doc(str_)
     doc.segment(self.segmenter)
     doc.tag_morph(self.morph_tagger)
     for token in doc.tokens:
         token.lemmatize(self.morph_vocab)
         lemms.append(token.text)
     return [lemms]

Esempio n. 8

0

Mostra file

File: entities_extractor.py Progetto: vnkrtv/vk-news-dashboard

    def get_doc(self, text: str) -> Doc:
        doc = Doc(text)

        doc.segment(self.segmenter)
        doc.tag_morph(self.morph_tagger)
        doc.parse_syntax(self.syntax_parser)

        doc.tag_ner(self.ner_tagger)
        return doc

Esempio n. 9

0

Mostra file

File: classificator.py Progetto: hotmapteam/core

def segmentate(text: str, date: typing.Optional[datetime.datetime] = None):
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)
    doc.tag_ner(ner_tagger)
    for span in doc.spans:
        span.normalize(morph_vocab)

    return {_.type: _.normal for _ in doc.spans}

Esempio n. 10

0

Mostra file

File: main.py Progetto: alexLX7/Simple-Text-Analyzer-Template

def process_russian_text(text, type_of_word_to_highlight='VERB'):
    # check out the original source:
    # https://github.com/natasha/natasha
    segmenter = Segmenter()
    emb = NewsEmbedding()
    morph_tagger = NewsMorphTagger(emb)
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    return [token.text for token in doc.tokens if token.pos == type_of_word_to_highlight]

Esempio n. 11

0

Mostra file

File: server.py Progetto: arshyn-t/nurbot-detect

def cleaner(text):
    # out = []
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    for token in doc.tokens:
        token.lemmatize(morph_vocab)
    out = [token.lemma for token in doc.tokens if token.pos != 'PUNCT']
    if len(out) > 2:
        return out

Esempio n. 12

0

Mostra file

File: nlp_utils.py Progetto: 678098/labor-extraction

    def process(self, text: str) -> Doc:
        doc = Doc(text)
        doc.segment(self.segmenter)
        doc.tag_morph(self.morph_tagger)

        for token in doc.tokens:
            token.lemmatize(self.morph_vocab)

        doc.parse_syntax(self.syntax_parser)
        return doc

Esempio n. 13

0

Mostra file

    def select_corefs(self, text: str) -> Tuple[List]:
        '''Метод извлекает из текста кореферентности на основе NER.
        '''
        doc = Doc(text)
        doc.segment(self.segmenter)
        doc.tag_morph(self.morph_tagger)
        for token in doc.tokens:
            token.lemmatize(self.morph_vocab)
        doc.tag_ner(self.ner_tagger)

        # Извлекаем леммы и ищем встречающиеся NER-сущности
        extracted_lemmas = {}
        for span in doc.spans:
            for token in span.tokens:
                if token.lemma in extracted_lemmas:
                    extracted_lemmas[token.lemma] += 1
                else:
                    extracted_lemmas[token.lemma] = 1
        selected_items = [
            item for item in extracted_lemmas if extracted_lemmas[item] > 1
        ]

        # Выбираем антецеденты и упоминания
        coref_sequence = []
        for item in selected_items:
            antecedent_found = -100
            for span in doc.spans:
                for token in span.tokens:
                    if token.lemma == item:
                        if antecedent_found == -100:
                            antecedent_found = span.start
                            coref_sequence.append(
                                CorefItem(span.text, token.lemma, span.type,
                                          span.start, span.stop))
                        else:
                            coref_sequence.append(
                                CorefItem(span.text, token.lemma, span.type,
                                          span.start, span.stop,
                                          antecedent_found))

        # Обзначаем индексы токенов
        sequence = [token for token in doc.tokens]
        indexes = {}
        for item in coref_sequence:
            for i, token in enumerate(doc.tokens):
                if item.start == token.start:
                    indexes[item.start] = i
                    item.start = i
                if item.stop == token.stop:
                    item.stop = i

        for item in coref_sequence:
            if item.coref != -100:
                item.coref = indexes[item.coref]
        return sequence, coref_sequence

Esempio n. 14

0

Mostra file

 def __call__(self, text):
     doc = Doc(text)
     doc.segment(self.segmenter)
     doc.tag_morph(self.morph_tagger)
     for token in doc.tokens:
         token.lemmatize(self.morph_vocab)
     doc.parse_syntax(self.syntax_parser)
     doc.tag_ner(self.ner_tagger)
     for span in doc.spans:
         span.normalize(self.morph_vocab)
     return doc

Esempio n. 15

0

Mostra file

File: tools.py Progetto: orzhan/rusimscore

def tag_text(text):
    if not (text in tag_text_cache):
        doc = Doc(text)
        doc.segment(segmenter)
        doc.tag_morph(morph_tagger)
        doc.tag_ner(ner_tagger)
        doc.parse_syntax(syntax_parser)
        for span in doc.spans:
            span.normalize(morph_vocab)
        tag_text_cache[text] = doc

    return tag_text_cache[text]

Esempio n. 16

0

Mostra file

File: app.py Progetto: OitaGG/diploma

def clean_and_tokenize(text):
    REPLACE_BY_SPACE_RE = re.compile('[/(){}\[\]\|@,;]')
    text = REPLACE_BY_SPACE_RE.sub(' ', text)
    text.lower()
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    for token in doc.tokens:
        token.lemmatize(morph_vocab)
    words = []
    {words.append(_.lemma) for _ in doc.tokens if _.lemma not in STOP_WORDS}
    return words

Esempio n. 17

0

Mostra file

def define_speechs_author(bigoutputdict, charlist, chardi):
    for chap in bigoutputdict:
        speeches = chap['speeches']
        for onespeech in speeches:
            if onespeech['author_text'] != None:
                texttosearch = onespeech['author_text']

                for i in texttosearch.split():
                    word = i.strip(punctuation).strip()
                    if len(word) != 1:
                        for i in morph.parse(word):
                            if (
                                ("NOUN" in i.tag) and ("anim" in i.tag) and
                                ('nomn' in i.tag) and ('plur' not in i.tag)
                            ) or word == "Николка" or word == "старший" or word == "Най":
                                #print(word)
                                if word in charlist:
                                    onespeech['author_in_text'] = word
                                    for key in chardi:
                                        if word in chardi[key]:
                                            onespeech['authors_name'] = key
                                    if onespeech[
                                            'authors_name'] == 'undefined':
                                        onespeech['authors_name'] = word

                texttosearch = onespeech['author_text']
                natashatext = Doc(texttosearch)
                natashatext.segment(segmenter)
                natashatext.tag_morph(morph_tagger)
                textnames = ''
                for token in natashatext.tokens:
                    if ((token.pos == "NOUN" and 'Animacy' in token.feats
                         and token.feats['Animacy'] == 'Anim') or
                        (token.pos == "PROPN")) and 'Case' in token.feats and (
                            token.feats['Case'] == 'Nom'):
                        textnames += str(token.text) + ' '
                namestoanalize = Doc(textnames)
                namestoanalize.segment(segmenter)
                namestoanalize.tag_ner(ner_tagger)
                if len(namestoanalize.spans) != 0:
                    for span in namestoanalize.spans:
                        if onespeech['author_in_text'] in str(
                                span.text
                        ) and onespeech['author_in_text'] != str(
                                span.text) and str(span.text) in charlist:
                            onespeech['author_in_text'] = str(span.text)

    with open('resultswithauth.json', 'w', encoding='utf-8') as f:
        f.write(json.dumps(bigoutputdict, ensure_ascii=False))

Esempio n. 18

0

Mostra file

def preprocess_sent(incoming_sent):
    doc = Doc(incoming_sent)

    segmenter = Segmenter()

    emb = NewsEmbedding()
    morph_tagger = NewsMorphTagger(emb)
    syntax_parser = NewsSyntaxParser(emb)

    doc.segment(segmenter)

    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)

    return doc.sents[0]

Esempio n. 19

0

Mostra file

File: network.py Progetto: AlfiiaKharlamova/VKR_Kharlamova

def preprocess_words(corpus):
    doc = Doc(corpus)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)

    for token in doc.tokens:
        token.lemmatize(morph_vocab)

    lemmas = []
    stop_words = get_stop_words('russian')

    for token in doc.tokens:
        if token.lemma not in stop_words and not re.match('\W+', token.lemma):
            lemmas.append(token.lemma)
    return lemmas

Esempio n. 20

0

Mostra file

File: preprocess_data.py Progetto: Vlad116/paraphrase-identification-with-framebank

def _text_preprocess(text):
    if text is None:
        return []

    text = text.strip().replace('`', "'")

    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)

    for token in doc.tokens:
        token.lemmatize(morph_vocab)

    tokens = [t.lemma for t in doc.tokens]
    return tokens

Esempio n. 21

0

Mostra file

File: app.py Progetto: a1ip/natasha-demo

    def __call__(self, text):
        doc = Doc(text)
        doc.segment(self.segmenter)
        doc.tag_morph(self.morph_tagger)
        doc.parse_syntax(self.syntax_parser)
        doc.tag_ner(self.ner_tagger)

        for token in doc.tokens:
            token.lemmatize(self.morph_vocab)

        for span in doc.spans:
            span.normalize(self.morph_vocab)
            if span.type == PER:
                span.extract_fact(self.names_extractor)

        return doc

Esempio n. 22

0

Mostra file

File: test_doc.py Progetto: AbbaVaR/1191b_Abbazov_mobile

def test_doc(segmenter, morph_vocab,
             morph_tagger, syntax_parser, ner_tagger,
             names_extractor, capsys):
    doc = Doc(TEXT)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)
    doc.tag_ner(ner_tagger)

    for span in doc.spans:
        span.normalize(morph_vocab)
        if span.type == PER:
            span.extract_fact(names_extractor)

    for token in doc.tokens:
        token.lemmatize(morph_vocab)

    doc.ner.print()
    assert strip(capsys.readouterr().out) == NER

    sent = doc.sents[0]

    sent.morph.print()
    assert strip(capsys.readouterr().out) == MORPH

    sent.syntax.print()
    assert strip(capsys.readouterr().out) == SYNTAX

    lemmas = {
        _.text: _.lemma
        for _ in doc.tokens
        if _.text.lower() != _.lemma
    }
    assert lemmas == LEMMAS

    normals = {
        _.text: _.normal
        for _ in doc.spans
    }
    assert normals == NORMALS

    facts = {
        _.normal: _.fact.as_dict
        for _ in doc.spans
        if _.fact
    }
    assert facts == FACTS

Esempio n. 23

0

Mostra file

File: backend.py Progetto: amthomps1/russian-literary-bible

def nat_parse(textDf, textCol='text', columns=tokenCols):
    t0 = time.time()
    # initialize collective token dataframe
    tokenDf = pd.DataFrame(columns=columns)
    # gather row list
    for an_id in tqdm(textDf.index.to_list(), desc="Text DF Index id"):
        # initialize list of token data dicts
        pDict = []
        # create Natasha Doc object with text
        doc = Doc(textDf.loc[an_id][textCol])
        # apply segmenter (sentenizer+tokenizer)
        doc.segment(segmenter)
        # apply morphology tagger
        doc.tag_morph(morph_tagger)
        # apply lemmatizer
        for token in doc.tokens:
            token.lemmatize(morph_vocab)
        # apply syntax parser
        doc.parse_syntax(syntax_parser)
        # apply NER tagger
        doc.tag_ner(ner_tagger)
        # gather all tokens' data (excluding punctuation which Natasha treats as tokens)
        for token in tqdm([x for x in doc.tokens if x.pos != 'PUNCT'],
                          desc="Token id",
                          leave=False):
            start = token.start
            stop = token.stop
            text = token.text
            token_id = token.id
            head_id = token.head_id
            rel = token.rel
            pos = token.pos
            lemma = token.lemma
            # Animacy, Aspect, Case, Degree, Gender, Mood, Number, Person, Tense, VerbForm, Voice
            # several to many for each token will be NoneType and throw an error
            try:
                anim = token.feats['Animacy']
            except:
                anim = None
            try:
                aspect = token.feats['Aspect']
            except:
                aspect = None
            try:
                case = token.feats['Case']
            except:

Esempio n. 24

0

Mostra file

File: ner_tools.py Progetto: AnastasiyaKudin/ChekhovDigital_html_tei

def extract_names(text):
    """Извлекает имена из текста"""
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)
    doc.tag_ner(ner_tagger)
    for span in doc.spans:
        if span.type == PER:
            span.normalize(morph_vocab)
            span.extract_fact(names_extractor)
    names = [{
        'normal': _.normal,
        'fio': _.fact.as_dict,
        'start': _.start,
        'end': _.stop
    } for _ in doc.spans if _.fact]
    return names

Esempio n. 25

0

Mostra file

File: nlp.py Progetto: blanchefort/freyrmonitoring

def extract_entities(text: str) -> List[NamedEntity]:
    """Распознавание именованных сущностей"""
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_ner(ner_tagger)
    doc.tag_morph(morph_tagger)
    for token in doc.tokens:
        token.lemmatize(morph_vocab)

    for span in doc.spans:
        span.normalize(morph_vocab)
    entities = []
    for sentence in doc.sents:
        for span in sentence.spans:
            ent = NamedEntity(text=span.text,
                              type=span.type,
                              norm=span.normal,
                              sentence=sentence.text)
            entities.append(ent)
    return entities

Esempio n. 26

0

Mostra file

File: nlp.py Progetto: blanchefort/freyrmonitoring

def ner(text: str) -> set:
    """Распознавание именованных сущностей
    """
    warnings.warn('К удалению. Заменится на `extract_entities`',
                  DeprecationWarning)
    doc = Doc(text)
    doc.segment(segmenter)
    doc.tag_ner(ner_tagger)
    doc.tag_morph(morph_tagger)
    for token in doc.tokens:
        token.lemmatize(morph_vocab)

    for span in doc.spans:
        span.normalize(morph_vocab)
    ner_tokens = []
    for span in doc.spans:
        if len(span.normal) > 0:
            ner_tokens.append((span.normal, span.type))
        else:
            ner_tokens.append((span.text, span.type))
    return set(ner_tokens)

Esempio n. 27

0

Mostra file

File: chat_bot.py Progetto: mazubar/weather_chatbot

def get_date(text):
    text = text.lower()
    doc = Doc(text)

    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)

    from natasha import MorphVocab
    morph_vocab = MorphVocab()

    from natasha import DatesExtractor
    dates_extractor = DatesExtractor(morph_vocab)

    if 'завтр' in text or tomorrow in str(list(dates_extractor(text))):
        return "завтра"
    elif 'сегодня' in text or 'сейчас' in text or today in str(
            list(dates_extractor(text))):
        return "сегодня"
    else:
        return None

Esempio n. 28

0

Mostra file

def ne_loc_extraction(text, del_names=False, del_addr=False):

    #Extract, normalize and delete (optional) named entities and locations

    doc = Doc(text)

    doc.segment(segmenter)
    doc.tag_ner(ner_tagger)
    doc.tag_morph(morph_tagger)

    for span in doc.spans:
        span.normalize(morph_vocab)

    for span in doc.spans:

        if span.type == 'PER':
            span.extract_fact(names_extractor)

        if span.type == 'LOC':
            span.extract_fact(addr_extractor)

    if del_names:
        for span in doc.spans:
            if span.type == 'PER':
                text = text.replace(span.text, '')

    if del_addr:
        for span in doc.spans:
            if span.type == 'LOC':
                text = text.replace(span.text, '')

    normal_ne_loc = {}
    normal_ne_loc['NAMES'] = [
        span.normal for span in doc.spans if span.type == 'PER'
    ]
    normal_ne_loc['LOCATIONS'] = [
        span.normal for span in doc.spans if span.type == 'LOC'
    ]

    return text, normal_ne_loc

Esempio n. 29

0

Mostra file

File: facts_extractor.py Progetto: nsbarsukov/weather-telegram-bot

class NatashaExtractor:
    def __init__(self, text: str):
        self.doc = Doc(text)
        self.doc.segment(segmenter)
        self.doc.tag_morph(morph_tagger)
        self.doc.parse_syntax(syntax_parser)
        self.doc.tag_ner(ner_tagger)
        for span in self.doc.spans:
            span.normalize(morph_vocab)

    def find_locations(self) -> List[str]:
        locations = list(
            filter(lambda span: span.type == 'LOC', self.doc.spans))

        return list(map(lambda span: span.normal, locations))

    def find_date(self) -> List[date]:
        matched_obj: List[Match] = list(dates_extractor(self.doc.text))
        natasha_found_dates = list(
            map(lambda x: parse_natasha_date_to_datetime(x.fact), matched_obj))

        return find_dates_as_word(self.doc.text) + natasha_found_dates

Esempio n. 30

0

Mostra file

File: entities_extractor.py Progetto: ZadneprovskiyNikolay/NewsNLP

def extract_entities(text: str): 
    """Returns dictionry with all recognized entities in format 
    { 
        locations: [], 
        peaple: [], 
        orginizations: [],
        money: []
    }
    """ 
    doc = Doc(text)

    doc.segment(segmenter)
    doc.tag_morph(morph_tagger)
    doc.parse_syntax(syntax_parser)
    doc.tag_ner(ner_tagger)

    for span in  doc.spans: 
        span.normalize(morph_vocab)

    locations = list(filter(lambda span: span.type == 'LOC', doc.spans))
    locations = list(set(location.normal for location in locations))
    orginizations = list(filter(lambda span: span.type == 'ORG', doc.spans))
    orginizations = list(set(org.normal for org in orginizations))
    people = list(filter(lambda span: span.type == 'PER', doc.spans))
    people = list(set(person.normal for person in people))
    money = list(match.fact for match in money_extractor(text))
    money = list(set(f'{m.amount} {m.currency}' for m in money))

    return { 
        'locations': locations, 
        'people': people, 
        'orginizations': orginizations, 
        'money': money
    }



# text = 'Минздрав Украины проверит медицинские учреждения Харьковской, Одесской и Запорожской областей из-за того, что они не до конца использовали индийскую вакцину от коронавируса Covishield компании AstraZeneca из первой партии. Об этом сегодня, 23 апреля, во время брифинга сказал главный государственный санитарный врач Виктор Ляшко. По его словам, только в трех областях до сих пор не использовали полностью вакцину Covishield из первой партии, нарушив тем самым указания Минздрава. Ляшко сообщил, что с 26 апреля в Харьковскую, Одесскую и Запорожскую области направятся представители Минздрава, чтобы выяснить, почему сложилась такая ситуация. Напомним, что в Украине вакцинация от коронавируса началась 24 февраля 2021 года. По состоянию на утро 23 апреля прививки получили 508 046 человек. Из них пять человек получили две дозы вакцины. Ранее сообщалось, что с начала пандемии в Украине по состоянию на утро 23 апреля 2021 года было подтверждено 2 004 630 случаев СOVID-19. Выздоровели 1 552 267 человек, а 41 700 – умерли.'
# print(extract_entities(text))