Ejemplos de XMLPageParser.from_titles en Python

Lenguaje de programación: Python

Namespace/Package Name: wiktionary_parser.xml_parser

Clase / Tipo: XMLPageParser

Método / Función: from_titles

Ejemplos en hotexamples.com: 6

Python XMLPageParser.from_titles - 6 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de wiktionary_parser.xml_parser.XMLPageParser.from_titles extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

XMLPageParser(7)

from_titles(4)

Métodos usados con frecuencia

XMLPageParser (7)

from_titles (4)

Ejemplo n.º 1

Mostrar archivo

Archivo: get_french_words.py Proyecto: spandanagella/wiktionary-parser

import sys
sys.path.insert(
    0,
    '/disk/scratch/s1146856/project_codes/tools/sense_stuff/wiktionary-parser-xml/wiktionary_parser'
)
sys.path.insert(
    0,
    '/disk/scratch/s1146856/project_codes/tools/sense_stuff/wiktionary-parser-xml'
)
from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.fr.page import frPage
from wiktionary_parser.languages.fr.parseText import FrParseText

xml_file = open(
    '../../../../../datasets/sense_disambiguation_datasets/frwiktionary-20161101-pages-articles-multistream.xml'
)
xml_parser = XMLPageParser(xml_file, frPage)

french_words = set(['sauter'])

#for title, page in xml_parser.from_titles(german_words):
#    found_words.add(title)
for page in xml_parser.from_titles(french_words):
    #print page.text
    parseData = FrParseText(page.text)
    print 'Title', page.title
    #parseData.view_sections()
    #print parseData.synonyms
    print parseData.verb_translations
    break

Ejemplo n.º 2

Mostrar archivo

Archivo: get_words.py Proyecto: benreynwar/wiktionary-parser

# -*- coding: utf-8 -*-
"""
This example extracts a number of words from the wiktionary xml file.
"""

from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.de.page import dePage

xml_file = open('../../wiktionary_data/dewiktionary-20110504-pages-articles.xml')
xml_parser = XMLPageParser(xml_file, dePage)

german_words = set([u'Bank', u'Kiefer'])

found_words = set([])

for title, page in xml_parser.from_titles(german_words):
    found_words.add(title)
    page.parse()
    for word in page.words:
        print('')
        print(word.title)
        print('******************')
        if word.bedeutungen:
            print('--Bedeutungen---------------')
            print(word.bedeutungen)
        if word.beispiele:
            print('--Beispiele-----------------')
            print(word.beispiele)
        if word.gender:
            print('--Gender--------------------')
            print(word.gender)

Ejemplo n.º 3

Mostrar archivo

Archivo: simple_english.py Proyecto: benreynwar/wiktionary-parser

# -*- coding: utf-8 -*-
"""
This example extracts a number of words from the simple.wiktionary xml file.
"""

from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.simple.page import simplePage

xml_file = open('../../wiktionary_data/simplewiktionary-20110514-pages-articles.xml')
xml_parser = XMLPageParser(xml_file, simplePage)

# The words we want to extract
wanted_words = set([u'fish'])

found_words = set([])

for title, page in xml_parser.from_titles(wanted_words):
    page.parse()
    # Print out a summary of the want
    for word in page.words:
        print word.summary()
    found_words.add(title)
    if wanted_words == found_words:
        break

Ejemplo n.º 4

Mostrar archivo

Archivo: simple_english.py Proyecto: spandanagella/wiktionary-parser

# -*- coding: utf-8 -*-
"""
This example extracts a number of words from the simple.wiktionary xml file.
"""

from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.simple.page import simplePage

xml_file = open(
    '../../wiktionary_data/simplewiktionary-20110514-pages-articles.xml')
xml_parser = XMLPageParser(xml_file, simplePage)

# The words we want to extract
wanted_words = set([u'fish'])

found_words = set([])

for title, page in xml_parser.from_titles(wanted_words):
    page.parse()
    # Print out a summary of the want
    for word in page.words:
        print word.summary()
    found_words.add(title)
    if wanted_words == found_words:
        break

Ejemplo n.º 5

Mostrar archivo

Archivo: get_words.py Proyecto: spandanagella/wiktionary-parser

"""
This example extracts a number of words from the wiktionary xml file.
"""

from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.de.page import dePage

xml_file = open(
    '../../wiktionary_data/dewiktionary-20110504-pages-articles.xml')
xml_parser = XMLPageParser(xml_file, dePage)

german_words = set([u'Bank', u'Kiefer'])

found_words = set([])

for title, page in xml_parser.from_titles(german_words):
    found_words.add(title)
    page.parse()
    for word in page.words:
        print('')
        print(word.title)
        print('******************')
        if word.bedeutungen:
            print('--Bedeutungen---------------')
            print(word.bedeutungen)
        if word.beispiele:
            print('--Beispiele-----------------')
            print(word.beispiele)
        if word.gender:
            print('--Gender--------------------')
            print(word.gender)

Ejemplo n.º 6

Mostrar archivo

Archivo: get_dutch_words.py Proyecto: spandanagella/wiktionary-parser

# -*- coding: utf-8 -*-
"""
This example extracts a number of words from the wiktionary xml file.
"""

import sys
sys.path.insert(0, '/disk/scratch/s1146856/project_codes/tools/sense_stuff/wiktionary-parser-xml/wiktionary_parser')
sys.path.insert(0, '/disk/scratch/s1146856/project_codes/tools/sense_stuff/wiktionary-parser-xml')
from wiktionary_parser.xml_parser import XMLPageParser
from wiktionary_parser.languages.nl.page import nlPage
from wiktionary_parser.languages.nl.parseText import NlParseText

xml_file = open('../../../../../datasets/sense_disambiguation_datasets/nlwiktionary-20161120-pages-articles-multistream.xml')
xml_parser = XMLPageParser(xml_file, nlPage)

dutch_words = set(['springen'])


#for title, page in xml_parser.from_titles(german_words):
#    found_words.add(title)
for page in xml_parser.from_titles(dutch_words):
    print page.text
    parseData = NlParseText(page.text)
    print 'Title', page.title
    #parseData.view_sections()
    #print parseData.synonyms
    print parseData.verb_translations
    break