Ejemplos de processMatches en Python

Lenguaje de programación: Python

Namespace/Package Name: mpiRK_chunkCorpus

Método / Función: processMatches

Ejemplos en hotexamples.com: 3

Python processMatches - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de mpiRK_chunkCorpus.processMatches extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: MasterSlave_chunkMultCorpus.py Proyecto: wwkam/cs205final

def checkTxt(pHashed, pProcessed, txt, lineNum, m, rank):
  '''Check for matches between pHashed (hashed pattern) and txt (one chunk of hashed corpus text)'''

  matches = []

  # for each m-tuple in corpus
  for k,txtMtuple in enumerate(izip(*[iter(txt[i:]) for i in xrange(m)])):

    # for m-tuples in pattern -- might just use izip here
    for i in range(len(pHashed)-m+1): # first word in seqs

      seq = pHashed[i:i+m]

      broken = m # not broken
      for j,hashedWord in enumerate(seq):

        if hashedWord != txtMtuple[j]:
          broken = j
          break


      if broken == m: # was not redefined
          matches.append((k,' '.join(pProcessed[i:i+m])))


  if len(matches) > 0:
    processMatches(matches,m) # print out matches

Ejemplo n.º 2

Mostrar archivo

Archivo: prehashedSerialRK.py Proyecto: pombredanne/cs205final

def full_search(hashedData, pat, m=20):
    """Take prehashed corpus text and hash the pattern text. Compare each line of 20 words in pattern with each line of 20 words in the corpus. Print line number and text for matches."""

    # Hash words in pattern
    pHashed = []
    pProcessed = []
    matches = []

    for word in pat.split():
        new = word.translate(string.maketrans("", ""), string.punctuation).upper()
        pProcessed.append(new)
        pHashed.append(letsHash(new))

    # for each m-tuple in corpus
    for k, txtMtuple in enumerate(izip(*[iter(hashedData[i:]) for i in xrange(m)])):

        # for m-tuples in pattern -- might just use izip here
        for i in range(len(pHashed) - m + 1):  # first word in seqs

            seq = pHashed[i : i + m]

            broken = m  # not broken
            for j, hashedWord in enumerate(seq):

                if hashedWord != txtMtuple[j]:
                    broken = j
                    break

            if broken == m:  # was not redefined
                matches.append((k, " ".join(pProcessed[i : i + m])))

    if len(matches) > 0:
        processMatches(matches, m)  # print out matches

Ejemplo n.º 3

Mostrar archivo

def full_search(hashedData, pat, m=20):
    '''Take prehashed corpus text and hash the pattern text. Compare each line of 20 words in pattern with each line of 20 words in the corpus. Print line number and text for matches.'''

    # Hash words in pattern
    pHashed = []
    pProcessed = []
    matches = []

    for word in (pat.split()):
        new = word.translate(string.maketrans("", ""),
                             string.punctuation).upper()
        pProcessed.append(new)
        pHashed.append(letsHash(new))

    # for each m-tuple in corpus
    for k, txtMtuple in enumerate(
            izip(*[iter(hashedData[i:]) for i in xrange(m)])):

        # for m-tuples in pattern -- might just use izip here
        for i in range(len(pHashed) - m + 1):  # first word in seqs

            seq = pHashed[i:i + m]

            broken = m  # not broken
            for j, hashedWord in enumerate(seq):

                if hashedWord != txtMtuple[j]:
                    broken = j
                    break

            if broken == m:  # was not redefined
                matches.append((k, ' '.join(pProcessed[i:i + m])))

    if len(matches) > 0:
        processMatches(matches, m)  # print out matches