Python ContentFormatter Examples, vumi_wikipedia.text_manglers.ContentFormatter Python Examples

Example #1

0

Show file

 def test_format_simple(self):
     cf = ContentFormatter(160, 70)
     self.assertEqual(u'', cf.format(u''))
     self.assertEqual(u'a', cf.format(u'a'))
     self.assertEqual(UNI_BIT, cf.format(UNI_BIT))
     self.assertEqual(long_ascii(39, u' ...'), cf.format(long_ascii()))
     self.assertEqual(long_unicode(16, u' ...'), cf.format(long_unicode()))

Example #2

0

Show file

    def test_format_more(self):
        cf = ContentFormatter(160, 70)
        fmt = lambda txt, i: cf.format_more(txt, i, u' (more)', u' (no more)')

        self.assertEqual((0, u' (no more)'), fmt(u'', 0))
        self.assertEqual((1, u'a (no more)'), fmt(u'a', 0))
        self.assertEqual((3, u'%s (no more)' % UNI_BIT), fmt(UNI_BIT, 0))
        self.assertEqual((1, u'...a (no more)'), fmt(u'a a', 2))
        self.assertEqual((3, u'...%s (no more)' % UNI_BIT),
                         fmt(long_unicode(2), 4))

        self.assertEqual((147, long_ascii(37, u' ... (more)')),
                         fmt(long_ascii(), 0))
        self.assertEqual((59, long_unicode(15, u' ... (more)')),
                         fmt(long_unicode(), 0))

        self.assertEqual((143, u'...' + long_ascii(36, u' ... (more)')),
                         fmt(long_ascii(), 4))
        self.assertEqual((55, u'...' + long_unicode(14, u' ... (more)')),
                         fmt(long_unicode(), 4))

Example #3

0

Show file

File: test_text_manglers.py Project: praekelt/vumi-wikipedia

    def test_format_more(self):
        cf = ContentFormatter(160, 70)
        fmt = lambda txt, i: cf.format_more(txt, i, u' (more)', u' (no more)')

        self.assertEqual((0, u' (no more)'), fmt(u'', 0))
        self.assertEqual((1, u'a (no more)'), fmt(u'a', 0))
        self.assertEqual((3, u'%s (no more)' % UNI_BIT), fmt(UNI_BIT, 0))
        self.assertEqual((1, u'...a (no more)'), fmt(u'a a', 2))
        self.assertEqual((3, u'...%s (no more)' % UNI_BIT),
                         fmt(long_unicode(2), 4))

        self.assertEqual((147, long_ascii(37, u' ... (more)')),
                         fmt(long_ascii(), 0))
        self.assertEqual((59, long_unicode(15, u' ... (more)')),
                         fmt(long_unicode(), 0))

        self.assertEqual((143, u'...' + long_ascii(36, u' ... (more)')),
                         fmt(long_ascii(), 4))
        self.assertEqual((55, u'...' + long_unicode(14, u' ... (more)')),
                         fmt(long_unicode(), 4))

Example #4

0

Show file

 def test_format_postfix(self):
     cf = ContentFormatter(160, 70)
     self.assertEqual(u' (postfix)', cf.format(u'', u' (postfix)'))
     self.assertEqual(u'a (postfix)', cf.format(u'a', u' (postfix)'))
     self.assertEqual(u'%s (postfix)' % UNI_BIT,
                      cf.format(UNI_BIT, u' (postfix)'))
     self.assertEqual(long_ascii(36, u' ... (postfix)'),
                      cf.format(long_ascii(), u' (postfix)'))
     self.assertEqual(long_unicode(14, u' ... (postfix)'),
                      cf.format(long_unicode(), u' (postfix)'))

Example #5

0

Show file

File: test_text_manglers.py Project: praekelt/vumi-wikipedia

    def test_format_very_long_words(self):
        """
        If we have a very long word at the start of our input, we split it in
        the middle.
        """
        cf = ContentFormatter(160, 70)

        long_ascii_words = u' '.join([u'abc' * 60] * 2)
        long_unicode_words = u' '.join([UNI_BIT * 25] * 2)

        self.assertEqual(
            long_ascii_words[:156] + u' ...', cf.format(long_ascii_words))
        self.assertEqual(
            long_unicode_words[:66] + u' ...', cf.format(long_unicode_words))

        self.assertEqual(
            long_ascii_words[:146] + u' ... (postfix)',
            cf.format(long_ascii_words, u' (postfix)'))
        self.assertEqual(
            long_unicode_words[:56] + u' ... (postfix)',
            cf.format(long_unicode_words, u' (postfix)'))

Example #6

0

Show file

File: test_text_manglers.py Project: praekelt/vumi-wikipedia

 def test_format_simple(self):
     cf = ContentFormatter(160, 70)
     self.assertEqual(u'', cf.format(u''))
     self.assertEqual(u'a', cf.format(u'a'))
     self.assertEqual(UNI_BIT, cf.format(UNI_BIT))
     self.assertEqual(long_ascii(39, u' ...'), cf.format(long_ascii()))
     self.assertEqual(long_unicode(16, u' ...'), cf.format(long_unicode()))

Example #7

0

Show file

File: test_text_manglers.py Project: praekelt/vumi-wikipedia

    def test_format_more_very_long_words(self):
        """
        If we have a very long word at the start of our input, we split it in
        the middle, even if we have a nonzero start offset.
        """
        cf = ContentFormatter(160, 70)
        fmt = lambda txt, i: cf.format_more(txt, i, u' (more)', u' (no more)')

        long_ascii_words = u' '.join([u'abc' * 60] * 2)
        long_unicode_words = u' '.join([UNI_BIT * 25] * 2)

        self.assertEqual(
            (149, long_ascii_words[:149] + u' ... (more)'),
            fmt(long_ascii_words, 0))
        self.assertEqual(
            (31, u'...' + long_ascii_words[149:].split()[0] + u' ... (more)'),
            fmt(long_ascii_words, 149))
        # Add one to skip the space.
        self.assertEqual(
            (146, u'...' + long_ascii_words.split()[1][:146] + u' ... (more)'),
            fmt(long_ascii_words, 149 + 31 + 1))
        self.assertEqual(
            (34, u'...' + long_ascii_words.split()[1][146:] + u' (no more)'),
            fmt(long_ascii_words, 149 + 31 + 1 + 146))

        self.assertEqual(
            (59, long_unicode_words[:59] + u' ... (more)'),
            fmt(long_unicode_words, 0))
        self.assertEqual(
            (16, u'...' + long_unicode_words[59:].split()[0] + u' ... (more)'),
            fmt(long_unicode_words, 59))
        # Add one to skip the space.
        self.assertEqual(
            (56, u'...' + long_unicode_words.split()[1][:56] + u' ... (more)'),
            fmt(long_unicode_words, 59 + 16 + 1))
        self.assertEqual(
            (19, u'...' + long_unicode_words.split()[1][56:] + u' (no more)'),
            fmt(long_unicode_words, 59 + 16 + 1 + 56))

Example #8

0

Show file

    def test_format_more_very_long_words(self):
        """
        If we have a very long word at the start of our input, we split it in
        the middle, even if we have a nonzero start offset.
        """
        cf = ContentFormatter(160, 70)
        fmt = lambda txt, i: cf.format_more(txt, i, u' (more)', u' (no more)')

        long_ascii_words = u' '.join([u'abc' * 60] * 2)
        long_unicode_words = u' '.join([UNI_BIT * 25] * 2)

        self.assertEqual((149, long_ascii_words[:149] + u' ... (more)'),
                         fmt(long_ascii_words, 0))
        self.assertEqual(
            (31, u'...' + long_ascii_words[149:].split()[0] + u' ... (more)'),
            fmt(long_ascii_words, 149))
        # Add one to skip the space.
        self.assertEqual(
            (146, u'...' + long_ascii_words.split()[1][:146] + u' ... (more)'),
            fmt(long_ascii_words, 149 + 31 + 1))
        self.assertEqual(
            (34, u'...' + long_ascii_words.split()[1][146:] + u' (no more)'),
            fmt(long_ascii_words, 149 + 31 + 1 + 146))

        self.assertEqual((59, long_unicode_words[:59] + u' ... (more)'),
                         fmt(long_unicode_words, 0))
        self.assertEqual(
            (16, u'...' + long_unicode_words[59:].split()[0] + u' ... (more)'),
            fmt(long_unicode_words, 59))
        # Add one to skip the space.
        self.assertEqual(
            (56, u'...' + long_unicode_words.split()[1][:56] + u' ... (more)'),
            fmt(long_unicode_words, 59 + 16 + 1))
        self.assertEqual(
            (19, u'...' + long_unicode_words.split()[1][56:] + u' (no more)'),
            fmt(long_unicode_words, 59 + 16 + 1 + 56))

Example #9

0

Show file

File: test_text_manglers.py Project: praekelt/vumi-wikipedia

 def test_format_postfix(self):
     cf = ContentFormatter(160, 70)
     self.assertEqual(u' (postfix)', cf.format(u'', u' (postfix)'))
     self.assertEqual(u'a (postfix)', cf.format(u'a', u' (postfix)'))
     self.assertEqual(u'%s (postfix)' % UNI_BIT,
                      cf.format(UNI_BIT, u' (postfix)'))
     self.assertEqual(long_ascii(36, u' ... (postfix)'),
                      cf.format(long_ascii(), u' (postfix)'))
     self.assertEqual(long_unicode(14, u' ... (postfix)'),
                      cf.format(long_unicode(), u' (postfix)'))

Example #10

0

Show file

    def test_format_very_long_words(self):
        """
        If we have a very long word at the start of our input, we split it in
        the middle.
        """
        cf = ContentFormatter(160, 70)

        long_ascii_words = u' '.join([u'abc' * 60] * 2)
        long_unicode_words = u' '.join([UNI_BIT * 25] * 2)

        self.assertEqual(long_ascii_words[:156] + u' ...',
                         cf.format(long_ascii_words))
        self.assertEqual(long_unicode_words[:66] + u' ...',
                         cf.format(long_unicode_words))

        self.assertEqual(long_ascii_words[:146] + u' ... (postfix)',
                         cf.format(long_ascii_words, u' (postfix)'))
        self.assertEqual(long_unicode_words[:56] + u' ... (postfix)',
                         cf.format(long_unicode_words, u' (postfix)'))

Example #11

0

Show file

File: wikipedia.py Project: JerJohn15/vumi-wikipedia

 def get_ussd_formatter(self, config):
     return ContentFormatter(
         config.max_ussd_content_length, config.max_ussd_unicode_length,
         sentence_break_threshold=0)

Example #12

0

Show file

File: wikipedia.py Project: JerJohn15/vumi-wikipedia

 def get_sms_formatter(self, config):
     return ContentFormatter(
         config.max_sms_content_length, config.max_sms_unicode_length,
         sentence_break_threshold=config.sentence_break_threshold)