def test_lcs_transcription(unspecified_test_corpus): expected = [ ('atema', 'atema', ['ɑ', 't', 'e', 'm', 'ɑ'], []), ('atema', 'enuta', ['e'], ['ɑ', 't', 'm', 'ɑ', 't', 'n', 'u', 'ɑ']), ('atema', 'mashomisi', ['m', 'ɑ'], ['ɑ', 't', 'e', 'ʃ', 'o', 'm', 'i', 's', 'i']), ('atema', 'mata', ['m', 'ɑ'], ['ɑ', 't', 'e', 't', 'ɑ']), ('atema', 'nata', ['ɑ', 't'], ['e', 'm', 'ɑ', 'n', 'ɑ']), ('atema', 'sasi', ['ɑ'], ['t', 'e', 'm', 'ɑ', 's', 's', 'i']), ('atema', 'shashi', ['ɑ'], ['t', 'e', 'm', 'ɑ', 'ʃ', 'ʃ', 'i']), ('atema', 'shisata', ['ɑ', 't'], ['e', 'm', 'ɑ', 'ʃ', 'i', 's', 'ɑ']), ('atema', 'shushoma', ['m', 'ɑ'], ['ɑ', 't', 'e', 'ʃ', 'u', 'ʃ', 'o']), ('atema', 'ta', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'ɑ']), ('atema', 'tatomi', ['ɑ', 't'], ['e', 'm', 'ɑ', 't', 'o', 'm', 'i']), ('atema', 'tishenishu', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'i', 'ʃ', 'e', 'n', 'i', 'ʃ', 'u']), ('atema', 'toni', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'o', 'n', 'i']), ('atema', 'tusa', ['t'], ['ɑ', 'e', 'm', 'ɑ', 'u', 's', 'ɑ']), ('atema', 'ʃi', [], ['ɑ', 't', 'e', 'm', 'ɑ', 'ʃ', 'i']), ('sasi', 'atema', ['ɑ'], ['t', 'e', 'm', 'ɑ', 's', 's', 'i']), ('sasi', 'enuta', ['ɑ'], ['s', 's', 'i', 'e', 'n', 'u', 't']), ('sasi', 'mashomisi', ['s', 'i'], ['s', 'ɑ', 'm', 'ɑ', 'ʃ', 'o', 'm', 'i']), ('sasi', 'mata', ['ɑ'], ['s', 's', 'i', 'm', 't', 'ɑ']), ('sasi', 'nata', ['ɑ'], ['s', 's', 'i', 'n', 't', 'ɑ']), ('sasi', 'sasi', ['s', 'ɑ', 's', 'i'], []), ('sasi', 'shashi', ['ɑ'], ['s', 's', 'i', 'ʃ', 'ʃ', 'i']), ('sasi', 'shisata', ['s', 'ɑ'], ['s', 'i', 'ʃ', 'i', 't', 'ɑ']), ('sasi', 'shushoma', ['ɑ'], ['s', 's', 'i', 'ʃ', 'u', 'ʃ', 'o', 'm']), ('sasi', 'ta', ['ɑ'], ['s', 's', 'i', 't']), ('sasi', 'tatomi', ['ɑ'], ['s', 's', 'i', 't', 't', 'o', 'm', 'i']), ('sasi', 'tishenishu', ['i'], ['s', 'ɑ', 's', 't', 'ʃ', 'e', 'n', 'i', 'ʃ', 'u']), ('sasi', 'toni', ['i'], ['s', 'ɑ', 's', 't', 'o', 'n']), ('sasi', 'tusa', ['s', 'ɑ'], ['s', 'i', 't', 'u']), ('sasi', 'ʃi', ['i'], ['s', 'ɑ', 's', 'ʃ']), ] for v in expected: x1 = unspecified_test_corpus[v[0]].transcription x2 = unspecified_test_corpus[v[1]].transcription calced = lcs(x1, x2) calced = (calced[0], sorted(calced[1])) assert (calced == (v[2], sorted(v[3])))
def test_lcs_transcription(unspecified_test_corpus): expected = [('atema','atema',['ɑ','t','e','m','ɑ'],[]), ('atema','enuta',['e'],['ɑ','t','m','ɑ','t','n','u','ɑ']), ('atema','mashomisi',['m','ɑ'],['ɑ','t','e','ʃ','o','m','i','s','i']), ('atema','mata',['m','ɑ'],['ɑ','t','e','t','ɑ']), ('atema','nata',['ɑ','t'],['e','m','ɑ','n','ɑ']), ('atema','sasi',['ɑ'],['t','e','m','ɑ','s','s','i']), ('atema','shashi',['ɑ'],['t','e','m','ɑ','ʃ','ʃ','i']), ('atema','shisata',['ɑ','t'],['e','m','ɑ','ʃ','i','s','ɑ']), ('atema','shushoma',['m','ɑ'],['ɑ','t','e','ʃ','u','ʃ','o']), ('atema','ta',['t'],['ɑ','e','m','ɑ','ɑ']), ('atema','tatomi',['ɑ','t'],['e','m','ɑ','t','o','m','i']), ('atema','tishenishu',['t'],['ɑ','e','m','ɑ','i','ʃ','e','n','i','ʃ','u']), ('atema','toni',['t'],['ɑ','e','m','ɑ','o','n','i']), ('atema','tusa',['t'],['ɑ','e','m','ɑ','u','s','ɑ']), ('atema','ʃi',[],['ɑ','t','e','m','ɑ','ʃ','i']), ('sasi','atema',['ɑ'],['t','e','m','ɑ','s','s','i']), ('sasi','enuta',['ɑ'],['s','s','i','e','n','u','t']), ('sasi','mashomisi',['s','i'],['s','ɑ','m','ɑ','ʃ','o','m','i']), ('sasi','mata',['ɑ'],['s','s','i','m','t','ɑ']), ('sasi','nata',['ɑ'],['s','s','i','n','t','ɑ']), ('sasi','sasi',['s','ɑ','s','i'],[]), ('sasi','shashi',['ɑ'],['s','s','i','ʃ','ʃ','i']), ('sasi','shisata',['s','ɑ'],['s','i','ʃ','i','t','ɑ']), ('sasi','shushoma',['ɑ'],['s','s','i','ʃ','u','ʃ','o','m']), ('sasi','ta',['ɑ'],['s','s','i','t']), ('sasi','tatomi',['ɑ'],['s','s','i','t','t','o','m','i']), ('sasi','tishenishu',['i'],['s','ɑ','s','t','ʃ','e','n','i','ʃ','u']), ('sasi','toni',['i'],['s','ɑ','s','t','o','n']), ('sasi','tusa',['s','ɑ'],['s','i','t','u']), ('sasi','ʃi',['i'],['s','ɑ','s','ʃ']), ] for v in expected: x1 = unspecified_test_corpus[v[0]].transcription x2 = unspecified_test_corpus[v[1]].transcription calced = lcs(x1,x2) calced = (calced[0],sorted(calced[1])) assert(calced == (v[2],sorted(v[3])))
def test_lcs_spelling(unspecified_test_corpus): expected = [ ('atema', 'atema', 'atema', ''), ('atema', 'enuta', 'e', 'atmatnua'), ('atema', 'mashomisi', 'ma', 'ateshomisi'), ('atema', 'mata', 'ma', 'ateta'), ('atema', 'nata', 'at', 'emana'), ('atema', 'sasi', 'a', 'temassi'), ('atema', 'shashi', 'a', 'temashshi'), ('atema', 'shisata', 'at', 'emashisa'), ('atema', 'shushoma', 'ma', 'ateshusho'), ('atema', 'ta', 't', 'aemaa'), ('atema', 'tatomi', 'at', 'ematomi'), ('atema', 'tishenishu', 't', 'aemaishenishu'), ('atema', 'toni', 't', 'aemaoni'), ('atema', 'tusa', 't', 'aemausa'), ('atema', 'ʃi', '', 'atemaʃi'), ('sasi', 'atema', 'a', 'temassi'), ('sasi', 'enuta', 'a', 'ssienut'), ('sasi', 'mashomisi', 'as', 'simhomisi'), ('sasi', 'mata', 'a', 'ssimta'), ('sasi', 'nata', 'a', 'ssinta'), ('sasi', 'sasi', 'sasi', ''), ('sasi', 'shashi', 'as', 'sishhi'), ('sasi', 'shisata', 'sa', 'sishita'), ('sasi', 'shushoma', 's', 'asiahushom'), ('sasi', 'ta', 'a', 'ssit'), ('sasi', 'tatomi', 'a', 'ssittomi'), ('sasi', 'tishenishu', 's', 'asitihenishu'), ('sasi', 'toni', 'i', 'saston'), ('sasi', 'tusa', 'sa', 'situ'), ('sasi', 'ʃi', 'i', 'sasʃ'), ] for v in expected: calced = lcs(list(v[0]), list(v[1])) calced = (sorted(calced[0]), sorted(calced[1])) assert (calced == (sorted(v[2]), sorted(v[3])))
def test_lcs_spelling(unspecified_test_corpus): expected = [('atema','atema','atema',''), ('atema','enuta','e','atmatnua'), ('atema','mashomisi','ma','ateshomisi'), ('atema','mata','ma','ateta'), ('atema','nata','at','emana'), ('atema','sasi','a','temassi'), ('atema','shashi','a','temashshi'), ('atema','shisata','at','emashisa'), ('atema','shushoma','ma','ateshusho'), ('atema','ta','t','aemaa'), ('atema','tatomi','at','ematomi'), ('atema','tishenishu','t','aemaishenishu'), ('atema','toni','t','aemaoni'), ('atema','tusa','t','aemausa'), ('atema','ʃi','','atemaʃi'), ('sasi','atema','a','temassi'), ('sasi','enuta','a','ssienut'), ('sasi','mashomisi','as','simhomisi'), ('sasi','mata','a','ssimta'), ('sasi','nata','a','ssinta'), ('sasi','sasi','sasi',''), ('sasi','shashi','as','sishhi'), ('sasi','shisata','sa','sishita'), ('sasi','shushoma','s','asiahushom'), ('sasi','ta','a','ssit'), ('sasi','tatomi','a','ssittomi'), ('sasi','tishenishu','s','asitihenishu'), ('sasi','toni','i','saston'), ('sasi','tusa','sa','situ'), ('sasi','ʃi','i','sasʃ'), ] for v in expected: calced = lcs(list(v[0]),list(v[1])) calced = (sorted(calced[0]),sorted(calced[1])) assert(calced == (sorted(v[2]),sorted(v[3])))