예제 #1
0
 def test_GetAllApproximateMatchesWithAbbrev(self):
     daftext = sp(u'מימיך רב נחמן בר יצחק אמר עשה כדברי בית שמאי חייב מיתה דתנן אמר ר"ט אני הייתי בא בדרך והטתי לקרות כדברי ב"ש וסכנתי בעצמי מפני הלסטים אמרו לו כדאי היית לחוב בעצמך שעברת על דברי ב"ה: מתני׳')
     rashi = [u'רב נחמן בר יצחק אמר עשה כדברי בית שמאי חייב מיתה דתנן אמר רבי טרפון אני הייתי בא בדרך והטתי לקרות כדברי בית שמאי וסכנתי בעצמי מפני הלסטים אמרו לו כדאי היית לחוב בעצמך שעברת על דברי בית הלל']
     daf = dhm.GemaraDaf(daftext,rashi)
     textMatchList = dhm.GetAllMatches(daf,daf.allRashi[0],0,len(daf.allWords)-1,0.27,0.2)
     for tm in textMatchList:
         print u'{}'.format(tm)
예제 #2
0
 def test_GetAllMatches_nonempty(self):
     daftext = sp(u'אע״ג שאמרו ככה בלה בלה בלה')
     rashi = [u'אף על גב שאמרו']
     daf = dhm.GemaraDaf(daftext,rashi)
     textMatchList = dhm.GetAllMatches(daf,daf.allRashi[0],0,len(daf.allWords)-1,0.27,0.2)
     for tm in textMatchList:
         print u'{}'.format(tm)
 def test_GetAllMatches_empty(self):
     print('yo')
     daftext = 'אע״ג שאמרו ככה בלה בלה בלה'.split()
     rashi = ['', 'אף על גב שאמרו']
     daf = dhm.GemaraDaf(daftext, rashi)
     textMatchList = dhm.GetAllMatches(daf, daf.allRashi[0], 0,
                                       len(daf.allWords) - 1, 0.27, 0.2)
     for tm in textMatchList:
         print('{}'.format(tm))
예제 #4
0
def setup_module(module):
    global daf

    dhm.InitializeHashTables()

    daf_words = sp(u'משעה שהכהנים נכנסים לאכול בתרומתן עד סוף האשמורה הראשונה דברי רבי אליעזר. וחכמים אומרים עד חצות ר"ג אומר עד שיעלה עמוד השחר. מעשה ובאו בניו מבית המשתה אמרו לו')
    comments = [u'משעה שהכהנים נכנסים לאכול', #exact
                u'עד האשמורה הראשונה דברי רבי אליעזר.', # 1 skip
                u'עד הראשונה דברי רבי אליעזר.', # 2 skip
                u'עד סוף האשמורה הראשונה דברי.', # 2 skip at end of word
                u'רבן גמליאל אומר עד שיעלה', # abbrev in base_text
                u'משעה שהכהנים עלין נכנסים לאכול', #extra word in Rashi
                u'בניו מבית המשתה אמרו לו וולה!', #extra (ridiculous) word in rashi at end of daf
                u'עד סוף האשמורה הראשונה דברי רבי בלהבלה.', #last word is a mismatch
                u'וחכמים אומרים עד חצות', #small rashi
                u'וחכמים אומרים סבבה עד חצות ר"ג שיעלה עמוד השחר.', #too many skips
                u'וחכמים אומרים סבבה עד חצות ר"ג אומר שיעלה עמוד השחר'] #max skips
    daf = dhm.GemaraDaf(daf_words,comments)