예제 #1
0
def test_lcs_transcription(unspecified_test_corpus):
    expected = [
        ('atema', 'atema', ['ɑ', 't', 'e', 'm', 'ɑ'], []),
        ('atema', 'enuta', ['e'], ['ɑ', 't', 'm', 'ɑ', 't', 'n', 'u', 'ɑ']),
        ('atema', 'mashomisi', ['m', 'ɑ'],
         ['ɑ', 't', 'e', 'ʃ', 'o', 'm', 'i', 's', 'i']),
        ('atema', 'mata', ['m', 'ɑ'], ['ɑ', 't', 'e', 't', 'ɑ']),
        ('atema', 'nata', ['ɑ', 't'], ['e', 'm', 'ɑ', 'n', 'ɑ']),
        ('atema', 'sasi', ['ɑ'], ['t', 'e', 'm', 'ɑ', 's', 's', 'i']),
        ('atema', 'shashi', ['ɑ'], ['t', 'e', 'm', 'ɑ', 'ʃ', 'ʃ', 'i']),
        ('atema', 'shisata', ['ɑ', 't'], ['e', 'm', 'ɑ', 'ʃ', 'i', 's', 'ɑ']),
        ('atema', 'shushoma', ['m', 'ɑ'], ['ɑ', 't', 'e', 'ʃ', 'u', 'ʃ', 'o']),
        ('atema', 'ta', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'ɑ']),
        ('atema', 'tatomi', ['ɑ', 't'], ['e', 'm', 'ɑ', 't', 'o', 'm', 'i']),
        ('atema', 'tishenishu', ['t'],
         ['ɑ', 'e', 'm', 'ɑ', 'i', 'ʃ', 'e', 'n', 'i', 'ʃ', 'u']),
        ('atema', 'toni', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'o', 'n', 'i']),
        ('atema', 'tusa', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'u', 's', 'ɑ']),
        ('atema', 'ʃi', [], ['ɑ', 't', 'e', 'm', 'ɑ', 'ʃ', 'i']),
        ('sasi', 'atema', ['ɑ'], ['t', 'e', 'm', 'ɑ', 's', 's', 'i']),
        ('sasi', 'enuta', ['ɑ'], ['s', 's', 'i', 'e', 'n', 'u', 't']),
        ('sasi', 'mashomisi', ['s',
                               'i'], ['s', 'ɑ', 'm', 'ɑ', 'ʃ', 'o', 'm', 'i']),
        ('sasi', 'mata', ['ɑ'], ['s', 's', 'i', 'm', 't', 'ɑ']),
        ('sasi', 'nata', ['ɑ'], ['s', 's', 'i', 'n', 't', 'ɑ']),
        ('sasi', 'sasi', ['s', 'ɑ', 's', 'i'], []),
        ('sasi', 'shashi', ['ɑ'], ['s', 's', 'i', 'ʃ', 'ʃ', 'i']),
        ('sasi', 'shisata', ['s', 'ɑ'], ['s', 'i', 'ʃ', 'i', 't', 'ɑ']),
        ('sasi', 'shushoma', ['ɑ'], ['s', 's', 'i', 'ʃ', 'u', 'ʃ', 'o', 'm']),
        ('sasi', 'ta', ['ɑ'], ['s', 's', 'i', 't']),
        ('sasi', 'tatomi', ['ɑ'], ['s', 's', 'i', 't', 't', 'o', 'm', 'i']),
        ('sasi', 'tishenishu', ['i'],
         ['s', 'ɑ', 's', 't', 'ʃ', 'e', 'n', 'i', 'ʃ', 'u']),
        ('sasi', 'toni', ['i'], ['s', 'ɑ', 's', 't', 'o', 'n']),
        ('sasi', 'tusa', ['s', 'ɑ'], ['s', 'i', 't', 'u']),
        ('sasi', 'ʃi', ['i'], ['s', 'ɑ', 's', 'ʃ']),
    ]
    for v in expected:
        x1 = unspecified_test_corpus[v[0]].transcription
        x2 = unspecified_test_corpus[v[1]].transcription
        calced = lcs(x1, x2)
        calced = (calced[0], sorted(calced[1]))
        assert (calced == (v[2], sorted(v[3])))
def test_lcs_transcription(unspecified_test_corpus):
    expected = [('atema','atema',['ɑ','t','e','m','ɑ'],[]),
                ('atema','enuta',['e'],['ɑ','t','m','ɑ','t','n','u','ɑ']),
                ('atema','mashomisi',['m','ɑ'],['ɑ','t','e','ʃ','o','m','i','s','i']),
                ('atema','mata',['m','ɑ'],['ɑ','t','e','t','ɑ']),
                ('atema','nata',['ɑ','t'],['e','m','ɑ','n','ɑ']),
                ('atema','sasi',['ɑ'],['t','e','m','ɑ','s','s','i']),
                ('atema','shashi',['ɑ'],['t','e','m','ɑ','ʃ','ʃ','i']),
                ('atema','shisata',['ɑ','t'],['e','m','ɑ','ʃ','i','s','ɑ']),
                ('atema','shushoma',['m','ɑ'],['ɑ','t','e','ʃ','u','ʃ','o']),
                ('atema','ta',['t'],['ɑ','e','m','ɑ','ɑ']),
                ('atema','tatomi',['ɑ','t'],['e','m','ɑ','t','o','m','i']),
                ('atema','tishenishu',['t'],['ɑ','e','m','ɑ','i','ʃ','e','n','i','ʃ','u']),
                ('atema','toni',['t'],['ɑ','e','m','ɑ','o','n','i']),
                ('atema','tusa',['t'],['ɑ','e','m','ɑ','u','s','ɑ']),
                ('atema','ʃi',[],['ɑ','t','e','m','ɑ','ʃ','i']),
                ('sasi','atema',['ɑ'],['t','e','m','ɑ','s','s','i']),
                ('sasi','enuta',['ɑ'],['s','s','i','e','n','u','t']),
                ('sasi','mashomisi',['s','i'],['s','ɑ','m','ɑ','ʃ','o','m','i']),
                ('sasi','mata',['ɑ'],['s','s','i','m','t','ɑ']),
                ('sasi','nata',['ɑ'],['s','s','i','n','t','ɑ']),
                ('sasi','sasi',['s','ɑ','s','i'],[]),
                ('sasi','shashi',['ɑ'],['s','s','i','ʃ','ʃ','i']),
                ('sasi','shisata',['s','ɑ'],['s','i','ʃ','i','t','ɑ']),
                ('sasi','shushoma',['ɑ'],['s','s','i','ʃ','u','ʃ','o','m']),
                ('sasi','ta',['ɑ'],['s','s','i','t']),
                ('sasi','tatomi',['ɑ'],['s','s','i','t','t','o','m','i']),
                ('sasi','tishenishu',['i'],['s','ɑ','s','t','ʃ','e','n','i','ʃ','u']),
                ('sasi','toni',['i'],['s','ɑ','s','t','o','n']),
                ('sasi','tusa',['s','ɑ'],['s','i','t','u']),
                ('sasi','ʃi',['i'],['s','ɑ','s','ʃ']),
                ]
    for v in expected:
        x1 = unspecified_test_corpus[v[0]].transcription
        x2 = unspecified_test_corpus[v[1]].transcription
        calced = lcs(x1,x2)
        calced = (calced[0],sorted(calced[1]))
        assert(calced == (v[2],sorted(v[3])))
예제 #3
0
def test_lcs_spelling(unspecified_test_corpus):
    expected = [
        ('atema', 'atema', 'atema', ''),
        ('atema', 'enuta', 'e', 'atmatnua'),
        ('atema', 'mashomisi', 'ma', 'ateshomisi'),
        ('atema', 'mata', 'ma', 'ateta'),
        ('atema', 'nata', 'at', 'emana'),
        ('atema', 'sasi', 'a', 'temassi'),
        ('atema', 'shashi', 'a', 'temashshi'),
        ('atema', 'shisata', 'at', 'emashisa'),
        ('atema', 'shushoma', 'ma', 'ateshusho'),
        ('atema', 'ta', 't', 'aemaa'),
        ('atema', 'tatomi', 'at', 'ematomi'),
        ('atema', 'tishenishu', 't', 'aemaishenishu'),
        ('atema', 'toni', 't', 'aemaoni'),
        ('atema', 'tusa', 't', 'aemausa'),
        ('atema', 'ʃi', '', 'atemaʃi'),
        ('sasi', 'atema', 'a', 'temassi'),
        ('sasi', 'enuta', 'a', 'ssienut'),
        ('sasi', 'mashomisi', 'as', 'simhomisi'),
        ('sasi', 'mata', 'a', 'ssimta'),
        ('sasi', 'nata', 'a', 'ssinta'),
        ('sasi', 'sasi', 'sasi', ''),
        ('sasi', 'shashi', 'as', 'sishhi'),
        ('sasi', 'shisata', 'sa', 'sishita'),
        ('sasi', 'shushoma', 's', 'asiahushom'),
        ('sasi', 'ta', 'a', 'ssit'),
        ('sasi', 'tatomi', 'a', 'ssittomi'),
        ('sasi', 'tishenishu', 's', 'asitihenishu'),
        ('sasi', 'toni', 'i', 'saston'),
        ('sasi', 'tusa', 'sa', 'situ'),
        ('sasi', 'ʃi', 'i', 'sasʃ'),
    ]
    for v in expected:
        calced = lcs(list(v[0]), list(v[1]))
        calced = (sorted(calced[0]), sorted(calced[1]))
        assert (calced == (sorted(v[2]), sorted(v[3])))
def test_lcs_spelling(unspecified_test_corpus):
    expected = [('atema','atema','atema',''),
                ('atema','enuta','e','atmatnua'),
                ('atema','mashomisi','ma','ateshomisi'),
                ('atema','mata','ma','ateta'),
                ('atema','nata','at','emana'),
                ('atema','sasi','a','temassi'),
                ('atema','shashi','a','temashshi'),
                ('atema','shisata','at','emashisa'),
                ('atema','shushoma','ma','ateshusho'),
                ('atema','ta','t','aemaa'),
                ('atema','tatomi','at','ematomi'),
                ('atema','tishenishu','t','aemaishenishu'),
                ('atema','toni','t','aemaoni'),
                ('atema','tusa','t','aemausa'),
                ('atema','ʃi','','atemaʃi'),
                ('sasi','atema','a','temassi'),
                ('sasi','enuta','a','ssienut'),
                ('sasi','mashomisi','as','simhomisi'),
                ('sasi','mata','a','ssimta'),
                ('sasi','nata','a','ssinta'),
                ('sasi','sasi','sasi',''),
                ('sasi','shashi','as','sishhi'),
                ('sasi','shisata','sa','sishita'),
                ('sasi','shushoma','s','asiahushom'),
                ('sasi','ta','a','ssit'),
                ('sasi','tatomi','a','ssittomi'),
                ('sasi','tishenishu','s','asitihenishu'),
                ('sasi','toni','i','saston'),
                ('sasi','tusa','sa','situ'),
                ('sasi','ʃi','i','sasʃ'),
                ]
    for v in expected:
        calced = lcs(list(v[0]),list(v[1]))
        calced = (sorted(calced[0]),sorted(calced[1]))
        assert(calced == (sorted(v[2]),sorted(v[3])))