Exemple #1
0
 def test_encode_sent_to_tuples_504_2(self):
     rle = Rle()
     #p(rle.encode_to_tuples(self.test_byte_sent1_decoded, mapping=True))
     #p(rle.encode_to_tuples(self.test_byte_sent2_decoded, mapping=True))
     #self.test_byte_sent1_encoded,self.test_byte_sent1_encoded_mapping
     (rle.encode_to_tuples(self.test_byte_sent1_decoded, mapping=True)).should.be.equal((self.test_byte_sent1_encoded,self.test_byte_sent1_encoded_mapping))
     (rle.encode_to_tuples(self.test_byte_sent2_decoded, mapping=True)).should.be.equal((self.test_byte_sent2_encoded,self.test_byte_sent2_encoded_mapping))
Exemple #2
0
 def test_encode_rle_of_words_to_tuples_with_additional_start_index_as_byte_str_503_2(self):
     rle = Rle()
     # p(rle.encode_to_tuples(self.test_byte_str1_decoded, mapping=True), "str1")
     # p(rle.encode_to_tuples(self.test_byte_str2_decoded, mapping=True), "str2")
     # p(rle.encode_to_tuples(self.test_byte_str3_decoded, mapping=True), "str3")
     # p(rle.encode_to_tuples(self.test_byte_str4_decoded, mapping=True), "str4")
     rle.encode_to_tuples(self.test_byte_str1_decoded, mapping=True).should.be.equal(([(u'b', 1), (u'i', 1), (u'g', 9), (u' ', 1), (u'f', 1), (u'a', 1), (u't', 8), (u' ', 1), (u'p', 1), (u'o', 5), (u'n', 7), (u'y', 11), (u'.', 5), (u' ', 1), (u'O', 1), (u'r', 1), (u' ', 1), (u'h', 1), (u'o', 1), (u'w', 1), (u' ', 1), (u't', 1), (u'o', 1), (u' ', 1), (u'b', 1), (u'e', 6), (u' ', 1), (u'h', 1), (u'a', 5), (u'p', 3), (u'y', 1), (u'!', 5)], [0, 1, 2, 11, 12, 13, 14, 22, 23, 24, 29, 36, 47, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 70, 71, 72, 77, 80, 81]))
     rle.encode_to_tuples(self.test_byte_str2_decoded, mapping=True).should.be.equal(([(u'S', 1), (u'o', 1), (u' ', 1), (u'b', 1), (u'e', 1), (u'a', 1), (u'u', 1), (u't', 1), (u'i', 1), (u'f', 1), (u'u', 1), (u'l', 1), (u' ', 1), (u'l', 1), (u'i', 1), (u'f', 1), (u'e', 1), (u' ', 1), (u'\U0001f600', 8), (u'\U0001f61c', 6), (u' ', 1), (u'\U0001f607', 5)], [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 26, 32, 33]))
     rle.encode_to_tuples(self.test_byte_str3_decoded, mapping=True).should.be.equal(([(u'm', 1), (u'i', 1), (u't', 1), (u' ', 1), (u'\xdc', 1), (u'\xfc', 6), (u'b', 1), (u'e', 1), (u'r', 1), (u'z', 1), (u'e', 1), (u'u', 1), (u'g', 1), (u'u', 1), (u'n', 1), (u'g', 1), (u' ', 1), (u'h', 1), (u'a', 1), (u't', 1), (u' ', 1), (u'e', 1), (u'r', 1), (u' ', 1), (u'a', 4), (u'l', 5), (u'e', 1), (u's', 1), (u' ', 1), (u'g', 1), (u'e', 1), (u's', 1), (u't', 1), (u'\xe4', 4), (u'm', 1), (u't', 1), (u'!', 3)], [0, 1, 2, 3, 4, 5, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 33, 38, 39, 40, 41, 42, 43, 44, 45, 49, 50, 51]))
     rle.encode_to_tuples(self.test_byte_str4_decoded, mapping=True).should.be.equal(([(u'\u043d', 1), (u'\u0443', 5), (u' ', 1), (u'\u043a', 1), (u'\u0430', 1), (u'\u043a', 1), (u' ', 1), (u'\u0431', 1), (u'\u044b', 1), (u' ', 1), (u'\u043c', 1), (u'\u043e', 11), (u'\u0436', 1), (u'\u043d', 1), (u'\u043e', 1), (u' ', 1), (u'\u043b', 1), (u'\u0438', 7), (u'?', 4)], [0, 1, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 26, 27, 28, 29, 30, 31, 38]))
Exemple #3
0
    def test_get_rep_free_word_from_rle_as_tuples_as_bytestr_511(self):
        rle = Rle()

        #p(rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str1_encoded_to_tuples))
        rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str1_encoded_to_tuples).should.be.equal(u'big fat pony. Or how to be hapy!')
        #p(rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str2_encoded_to_tuples))
        rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str2_encoded_to_tuples).should.be.equal(u'So beautiful life \U0001f600\U0001f61c \U0001f607')
        #p(rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str3_encoded_to_tuples))
        rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str3_encoded_to_tuples).should.be.equal(u'mit \xdc\xfcberzeugung hat er ales gest\xe4mt!')
        #p(rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str4_encoded_to_tuples))
        rle.get_rep_free_word_from_rle_in_tuples(self.test_byte_str4_encoded_to_tuples).should.be.equal(u'\u043d\u0443 \u043a\u0430\u043a \u0431\u044b \u043c\u043e\u0436\u043d\u043e \u043b\u0438?')
Exemple #4
0
    def test_rep_extraction_word_without_rle_514(self):
        rle = Rle()
        #p(rle.rep_extraction_word(self.test_byte_str1_encoded_to_tuples))
        rle.rep_extraction_word(self.test_byte_str1_encoded_to_tuples).should.be.equal(([(u'g', 9, 2), (u't', 8, 6), (u'o', 5, 9), (u'n', 7, 10), (u'y', 11, 11), (u'.', 5, 12), (u'e', 6, 25), (u'a', 5, 28), (u'p', 3, 29), (u'!', 5, 31)], u'big fat pony. Or how to be hapy!'))
        #p(rle.rep_extraction_word(self.test_byte_str2_encoded_to_tuples))
        rle.rep_extraction_word(self.test_byte_str2_encoded_to_tuples).should.be.equal(([(u'\U0001f600', 8, 18), (u'\U0001f61c', 6, 19), (u'\U0001f607', 5, 21)], u'So beautiful life \U0001f600\U0001f61c \U0001f607'))
        #p(rle.rep_extraction_word(self.test_byte_str3_encoded_to_tuples))
        rle.rep_extraction_word(self.test_byte_str3_encoded_to_tuples).should.be.equal(([(u'\xfc', 6, 5), (u'a', 4, 24), (u'l', 5, 25), (u'\xe4', 4, 33), (u'!', 3, 36)], u'mit \xdc\xfcberzeugung hat er ales gest\xe4mt!'))

        #p(self.test_unicode_str4_decoded)
        #p(rle.rep_extraction_word(self.test_byte_str4_encoded_to_tuples))
        rle.rep_extraction_word(self.test_byte_str4_encoded_to_tuples).should.be.equal(([(u'\u0443', 5, 1), (u'\u043e', 11, 11), (u'\u0438', 7, 17), (u'?', 4, 18)], u'\u043d\u0443 \u043a\u0430\u043a \u0431\u044b \u043c\u043e\u0436\u043d\u043e \u043b\u0438?'))
Exemple #5
0
    def test_rep_extraction_word_with_rle_515(self):
        rle = Rle()
        # p(rle.rep_extraction_word(self.test_byte_str1_encoded_to_tuples, get_rle_as_str=True))
        rle.rep_extraction_word(self.test_byte_str1_encoded_to_tuples, get_rle_as_str=True).should.be.equal(([(u'g', 9, 2), (u't', 8, 6), (u'o', 5, 9), (u'n', 7, 10), (u'y', 11, 11), (u'.', 5, 12), (u'e', 6, 25), (u'a', 5, 28), (u'p', 3, 29), (u'!', 5, 31)], u'big fat pony. Or how to be hapy!', u'big^9 fat^8 po^5n^7y^11.^5 Or how to be^6 ha^5p^3y!^5'))
        # p(rle.rep_extraction_word(self.test_byte_str2_encoded_to_tuples, get_rle_as_str=True))
        rle.rep_extraction_word(self.test_byte_str2_encoded_to_tuples, get_rle_as_str=True).should.be.equal(([(u'\U0001f600', 8, 18), (u'\U0001f61c', 6, 19), (u'\U0001f607', 5, 21)], u'So beautiful life \U0001f600\U0001f61c \U0001f607', u'So beautiful life \U0001f600^8\U0001f61c^6 \U0001f607^5'))
        # p(rle.rep_extraction_word(self.test_byte_str3_encoded_to_tuples, get_rle_as_str=True))
        rle.rep_extraction_word(self.test_byte_str3_encoded_to_tuples, get_rle_as_str=True).should.be.equal(([(u'\xfc', 6, 5), (u'a', 4, 24), (u'l', 5, 25), (u'\xe4', 4, 33), (u'!', 3, 36)], u'mit \xdc\xfcberzeugung hat er ales gest\xe4mt!', u'mit \xdc\xfc^6berzeugung hat er a^4l^5es gest\xe4^4mt!^3'))

        #p(self.test_unicode_str4_decoded)
        # p(rle.rep_extraction_word(self.test_byte_str4_encoded_to_tuples, get_rle_as_str=True))
        rle.rep_extraction_word(self.test_byte_str4_encoded_to_tuples, get_rle_as_str=True).should.be.equal(([(u'\u0443', 5, 1), (u'\u043e', 11, 11), (u'\u0438', 7, 17), (u'?', 4, 18)], u'\u043d\u0443 \u043a\u0430\u043a \u0431\u044b \u043c\u043e\u0436\u043d\u043e \u043b\u0438?', u'\u043d\u0443^5 \u043a\u0430\u043a \u0431\u044b \u043c\u043e^11\u0436\u043d\u043e \u043b\u0438^7?^4'))
Exemple #6
0
    def test_get_repetativ_elems_513(self):
        rle = Rle()

        #p(rle.get_repetativ_elems(self.test_byte_str1_encoded_to_tuples))
        rle.get_repetativ_elems(self.test_byte_str1_encoded_to_tuples).should.be.equal([(u'g', 9, 2), (u't', 8, 6), (u'o', 5, 9), (u'n', 7, 10), (u'y', 11, 11), (u'.', 5, 12), (u'e', 6, 25), (u'a', 5, 28), (u'p', 3, 29), (u'!', 5, 31)])
        #p(rle.get_repetativ_elems(self.test_byte_str2_encoded_to_tuples))
        rle.get_repetativ_elems(self.test_byte_str2_encoded_to_tuples).should.be.equal([(u'\U0001f600', 8, 18), (u'\U0001f61c', 6, 19), (u'\U0001f607', 5, 21)])
        #p(rle.get_repetativ_elems(self.test_byte_str3_encoded_to_tuples))
        rle.get_repetativ_elems(self.test_byte_str3_encoded_to_tuples).should.be.equal([(u'\xfc', 6, 5), (u'a', 4, 24), (u'l', 5, 25), (u'\xe4', 4, 33), (u'!', 3, 36)])
        
        #p(self.test_unicode_str4_decoded)
        #p(rle.get_repetativ_elems(self.test_byte_str4_encoded_to_tuples))
        rle.get_repetativ_elems(self.test_byte_str4_encoded_to_tuples).should.be.equal([(u'\u0443', 5, 1), (u'\u043e', 11, 11), (u'\u0438', 7, 17), (u'?', 4, 18)])
Exemple #7
0
 def test_encode_rle_of_sent_to_tuples_512(self):
     rle = Rle()
     #p(self.test_byte_sent1_encoded)
     #p(rle.get_rep_free_sent_from_rle_in_tuples(self.test_byte_sent1_encoded))
     rle.get_rep_free_sent_from_rle_in_tuples(self.test_byte_sent1_encoded).should.be.equal(u'big fat pony')
     #p(rle.get_rep_free_sent_from_rle_in_tuples(self.test_byte_sent2_encoded))
     rle.get_rep_free_sent_from_rle_in_tuples(self.test_byte_sent2_encoded).should.be.equal(u'\U0001f600 \U0001f60d')
Exemple #8
0
 def test_rep_extraction_sent_515(self):
     rle = Rle()
     self.test_byte_sent1_encoded,self.test_byte_sent1_encoded_mapping
     #p(repr(rle.rep_extraction_sent(self.test_byte_sent1_encoded_with_start_index)))
     rle.rep_extraction_sent(self.test_byte_sent1_encoded,self.test_byte_sent1_encoded_mapping).should.be.equal(([{'start_index_in_orig': 0, 'length': 4, 'word': 'big', 'index_in_redu_free': 0}, {'start_index_in_orig': 5, 'length': 2, 'word': 'pony', 'index_in_redu_free': 2}], ['big', 'fat', 'pony']))
     #p(repr(rle.rep_extraction_sent(self.test_byte_sent2_encoded_with_start_index)))
     rle.rep_extraction_sent(self.test_byte_sent2_encoded,self.test_byte_sent2_encoded_mapping).should.be.equal(([{'start_index_in_orig': 0, 'length': 5, 'word': '\xf0\x9f\x98\x80', 'index_in_redu_free': 0}], ['\xf0\x9f\x98\x80', '\xf0\x9f\x98\x8d']))
Exemple #9
0
 def test_decode_str_from_str_510(self):
     rle = Rle()
     rle.decode_str_from_str(self.test_byte_str1_encoded_to_str).should.be.equal(self.test_byte_str1_decoded)
     rle.decode_str_from_str(self.test_byte_str2_encoded_to_str).should.be.equal(self.test_byte_str2_decoded)
     rle.decode_str_from_str(self.test_byte_str3_encoded_to_str).should.be.equal(self.test_byte_str3_decoded)
     rle.decode_str_from_str(self.test_byte_str4_encoded_to_str).should.be.equal(self.test_byte_str4_decoded)
Exemple #10
0
 def test_encode_str_to_str_509(self):
     rle = Rle()
     rle.encode_str_to_str(self.test_byte_str1_decoded).encode("utf-8").should.be.equal(self.test_byte_str1_encoded_to_str)
     rle.encode_str_to_str(self.test_byte_str2_decoded).encode("utf-8").should.be.equal(self.test_byte_str2_encoded_to_str)
     rle.encode_str_to_str(self.test_byte_str3_decoded).encode("utf-8").should.be.equal(self.test_byte_str3_encoded_to_str)
     rle.encode_str_to_str(self.test_byte_str4_decoded).encode("utf-8").should.be.equal(self.test_byte_str4_encoded_to_str)
Exemple #11
0
 def test_del_rep_from_unicode_str_501(self):
     rle = Rle()
     rle.del_rep(self.test_unicode_str1_decoded).encode("utf-8").should.be.equal(self.test_byte_str1_repfree)
     rle.del_rep(self.test_unicode_str2_decoded).encode("utf-8").should.be.equal(self.test_byte_str2_repfree)
     rle.del_rep(self.test_unicode_str3_decoded).encode("utf-8").should.be.equal(self.test_byte_str3_repfree)
     rle.del_rep(self.test_unicode_str4_decoded).encode("utf-8").should.be.equal(self.test_byte_str4_repfree)
Exemple #12
0
 def test_decode_letters_to_str_507(self):
     rle = Rle()
     rle.decode_letters_to_str(self.test_byte_str1_encoded_to_tuples).encode("utf-8").should.be.equal(self.test_byte_str1_decoded) 
     rle.decode_letters_to_str(self.test_byte_str2_encoded_to_tuples).encode("utf-8").should.be.equal(self.test_byte_str2_decoded) 
     rle.decode_letters_to_str(self.test_byte_str3_encoded_to_tuples).encode("utf-8").should.be.equal(self.test_byte_str3_decoded) 
     rle.decode_letters_to_str(self.test_byte_str4_encoded_to_tuples).encode("utf-8").should.be.equal(self.test_byte_str4_decoded) 
Exemple #13
0
 def test_decode_list_of_words_in_tuples_to_list_506(self):
     rle = Rle()
     rle.decode_words_to_list(self.test_byte_sent1_encoded).should.be.equal(self.test_byte_sent1_decoded)
     rle.decode_words_to_list(self.test_byte_sent2_encoded).should.be.equal(self.test_byte_sent2_decoded)
Exemple #14
0
 def test_encode_sent_to_tuples_504_1(self):
     rle = Rle()
     rle.encode_to_tuples(self.test_byte_sent1_decoded).should.be.equal(self.test_byte_sent1_encoded)
     rle.encode_to_tuples(self.test_byte_sent2_decoded).should.be.equal(self.test_byte_sent2_encoded)
Exemple #15
0
 def test_encode_rle_of_words_to_tuples_as_byte_str_503_1(self):
     rle = Rle()
     rle.encode_to_tuples(self.test_byte_str1_decoded).should.be.equal(self.test_byte_str1_encoded_to_tuples) 
     rle.encode_to_tuples(self.test_byte_str2_decoded).should.be.equal(self.test_byte_str2_encoded_to_tuples) 
     rle.encode_to_tuples(self.test_byte_str3_decoded).should.be.equal(self.test_byte_str3_encoded_to_tuples) 
     rle.encode_to_tuples(self.test_byte_str4_decoded).should.be.equal(self.test_byte_str4_encoded_to_tuples) 
Exemple #16
0
 def test_del_rep_from_list_with_words_502(self):
     rle = Rle()
     rle.del_rep_from_sent(self.test_byte_sent1_decoded).encode("utf-8").should.be.equal(self.test_byte_sent1_repfree)
     rle.del_rep_from_sent(self.test_byte_sent2_decoded).encode("utf-8").should.be.equal(self.test_byte_sent2_repfree)
Exemple #17
0
 def test_decode_words_to_str_508(self):
     rle = Rle()
     rle.decode_words_to_str(self.test_byte_sent1_encoded).should.be.equal(self.test_byte_sent1_decoded_to_str) 
     rle.decode_words_to_str(self.test_byte_sent2_encoded).should.be.equal(self.test_byte_sent2_decoded_to_str) 
Exemple #18
0
 def test_rle_initialization_000(self):
     rle = Rle()