Python process_email Examples, invenio.elmsubmit.process_email Python Examples

Example #1

0

Show file

        def test_simple_marc(self):
            """elmsubmit - parsing simple email"""
            f = open(
                os.path.join(
                    CFG_TMPDIR,
                    elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_1']), 'r')
            email = f.read()
            f.close()

            # let's try to parse an example email and compare it with the appropriate marc xml
            x = elmsubmit.process_email(email)
            y = """<record>
            <datafield tag ="245" ind1="" ind2="">
            <subfield code="a">something</subfield>
            </datafield>
            <datafield tag ="100" ind1="" ind2="">
            <subfield code="a">Simko, T</subfield>
            <subfield code="u">CERN</subfield>
            </datafield>
            </record>"""

            # in order to properly compare the marc files we have to remove the FFT node, it includes a random generated file path

            dom_x = xml.dom.minidom.parseString(x)
            datafields = dom_x.getElementsByTagName("datafield")

            #remove all the FFT datafields
            for node in datafields:
                if (node.hasAttribute("tag")
                        and node.getAttribute("tag") == "FFT"):
                    node.parentNode.removeChild(node)
                    node.unlink()

            new_x = dom_x.toprettyxml("", "\n")

            dom_y = xml.dom.minidom.parseString(y)
            new_y = dom_y.toprettyxml("", "\n")

            # 'normalize' the two XML MARC files for the purpose of comparing
            new_x = expandtabs(new_x)
            new_y = expandtabs(new_y)

            new_x = new_x.replace(' ', '')
            new_y = new_y.replace(' ', '')

            new_x = new_x.replace('\n', '')
            new_y = new_y.replace('\n', '')

            # compare the two xml marcs
            self.assertEqual(new_x, new_y)

Example #2

0

Show file

        def test_read_text_files(self):
            """elmsubmit - reading text files"""

            f = open(
                os.path.join(
                    CFG_TMPDIR,
                    elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_2']), 'r')
            email = f.read()
            f.close()

            # let's try to see if the files were properly stored:
            xml_marc = elmsubmit.process_email(email)

            dom = xml.dom.minidom.parseString(xml_marc)
            datafields = dom.getElementsByTagName("datafield")

            # get the file addresses
            file_list = []

            for node in datafields:
                if (node.hasAttribute("tag")
                        and node.getAttribute("tag") == "FFT"):
                    children = node.childNodes
                    for child in children:
                        if (child.hasChildNodes()):
                            file_list.append(child.firstChild.nodeValue)

            f = open(file_list[0], 'r')
            x = f.read()
            f.close()

            x.lstrip()
            x.rstrip()

            y = """second attachment\n"""

            self.assertEqual(x, y)

            f = open(file_list[1], 'r')
            x = f.read()
            f.close()

            x.lstrip()
            x.rstrip()

            y = """some attachment\n"""
            self.assertEqual(x, y)

Example #3

0

Show file

File: elmsubmit_unit_tests.py Project: BessemAamira/invenio

        def test_simple_marc(self):
            """elmsubmit - parsing simple email"""
            f=open(os.path.join(CFG_TMPDIR, elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_1']),'r')
            email = f.read()
            f.close()

            # let's try to parse an example email and compare it with the appropriate marc xml
            x = elmsubmit.process_email(email)
            y  = """<record>
            <datafield tag ="245" ind1="" ind2="">
            <subfield code="a">something</subfield>
            </datafield>
            <datafield tag ="100" ind1="" ind2="">
            <subfield code="a">Simko, T</subfield>
            <subfield code="u">CERN</subfield>
            </datafield>
            </record>"""

            # in order to properly compare the marc files we have to remove the FFT node, it includes a random generated file path

            dom_x = xml.dom.minidom.parseString(x)
            datafields = dom_x.getElementsByTagName("datafield")

            #remove all the FFT datafields
            for node in datafields:
                if (node.hasAttribute("tag") and  node.getAttribute("tag") == "FFT"):
                    node.parentNode.removeChild(node)
                    node.unlink()

            new_x = dom_x.toprettyxml("","\n")

            dom_y = xml.dom.minidom.parseString(y)
            new_y = dom_y.toprettyxml("","\n")

            # 'normalize' the two XML MARC files for the purpose of comparing
            new_x = expandtabs(new_x)
            new_y = expandtabs(new_y)

            new_x = new_x.replace(' ','')
            new_y = new_y.replace(' ','')

            new_x = new_x.replace('\n','')
            new_y = new_y.replace('\n','')

            # compare the two xml marcs
            self.assertEqual(new_x,new_y)

Example #4

0

Show file

File: elmsubmit_unit_tests.py Project: BessemAamira/invenio

        def test_read_text_files(self):
            """elmsubmit - reading text files"""

            f=open(os.path.join(CFG_TMPDIR, elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_2']),'r')
            email = f.read()
            f.close()

            # let's try to see if the files were properly stored:
            xml_marc = elmsubmit.process_email(email)

            dom = xml.dom.minidom.parseString(xml_marc)
            datafields = dom.getElementsByTagName("datafield")

            # get the file addresses
            file_list = []

            for node in datafields:
                if (node.hasAttribute("tag") and  node.getAttribute("tag") == "FFT"):
                    children = node.childNodes
                    for child in children:
                        if (child.hasChildNodes()):
                            file_list.append(child.firstChild.nodeValue)

            f=open(file_list[0], 'r')
            x = f.read()
            f.close()

            x.lstrip()
            x.rstrip()

            y = """second attachment\n"""

            self.assertEqual(x,y)

            f=open(file_list[1], 'r')
            x = f.read()
            f.close()

            x.lstrip()
            x.rstrip()

            y = """some attachment\n"""
            self.assertEqual(x,y)

Example #5

0

Show file

File: elmsubmit_unit_tests.py Project: BessemAamira/invenio

        def test_complex_marc(self):
            """elmsubmit - parsing complex email with multiple fields"""
            f=open(os.path.join(CFG_TMPDIR, elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_2']),'r')
            email = f.read()
            f.close()

            # let's try to reproduce the demo XML MARC file by parsing it and printing it back:
            x = elmsubmit.process_email(email)
            y = """<record>
            <datafield tag ="245" ind1="" ind2="">
            <subfield code="a">something</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Le Meur, J Y</subfield>
            <subfield code="u">MIT</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Jedrzejek, K J</subfield>
            <subfield code="u">CERN2</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Favre, G</subfield>
            <subfield code="u">CERN3</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test11</subfield>
            <subfield code="c">test31</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test12</subfield>
            <subfield code="c">test32</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test13</subfield>
            <subfield code="c">test33</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="b">test21</subfield>
            <subfield code="d">test41</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="b">test22</subfield>
            <subfield code="d">test42</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test14</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="e">test51</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="e">test52</subfield>
            </datafield>
            <datafield tag ="100" ind1="" ind2="">
            <subfield code="a">Simko, T</subfield>
            <subfield code="u">CERN</subfield>
            </datafield>
            </record>"""

            # in order to properly compare the marc files we have to remove the FFT node, it includes a random generated file path

            dom_x = xml.dom.minidom.parseString(x)
            datafields = dom_x.getElementsByTagName("datafield")

            #remove all the FFT datafields
            for node in datafields:
                if (node.hasAttribute("tag") and  node.getAttribute("tag") == "FFT"):
                    node.parentNode.removeChild(node)
                    node.unlink()


            new_x = dom_x.toprettyxml("","\n")

            dom_y = xml.dom.minidom.parseString(y)
            new_y = dom_y.toprettyxml("","\n")
            # 'normalize' the two XML MARC files for the purpose of comparing
            new_x = expandtabs(new_x)
            new_y = expandtabs(new_y)

            new_x = new_x.replace(' ','')
            new_y = new_y.replace(' ','')

            new_x = new_x.replace('\n','')
            new_y = new_y.replace('\n','')

            # compare the two xml marcs
            self.assertEqual(new_x,new_y)

Example #6

0

Show file

        def test_complex_marc(self):
            """elmsubmit - parsing complex email with multiple fields"""
            f = open(
                os.path.join(
                    CFG_TMPDIR,
                    elmsubmit_config.CFG_ELMSUBMIT_FILES['test_case_2']), 'r')
            email = f.read()
            f.close()

            # let's try to reproduce the demo XML MARC file by parsing it and printing it back:
            x = elmsubmit.process_email(email)
            y = """<record>
            <datafield tag ="245" ind1="" ind2="">
            <subfield code="a">something</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Le Meur, J Y</subfield>
            <subfield code="u">MIT</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Jedrzejek, K J</subfield>
            <subfield code="u">CERN2</subfield>
            </datafield>
            <datafield tag ="700" ind1="" ind2="">
            <subfield code="a">Favre, G</subfield>
            <subfield code="u">CERN3</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test11</subfield>
            <subfield code="c">test31</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test12</subfield>
            <subfield code="c">test32</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test13</subfield>
            <subfield code="c">test33</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="b">test21</subfield>
            <subfield code="d">test41</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="b">test22</subfield>
            <subfield code="d">test42</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="a">test14</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="e">test51</subfield>
            </datafield>
            <datafield tag ="111" ind1="" ind2="">
            <subfield code="e">test52</subfield>
            </datafield>
            <datafield tag ="100" ind1="" ind2="">
            <subfield code="a">Simko, T</subfield>
            <subfield code="u">CERN</subfield>
            </datafield>
            </record>"""

            # in order to properly compare the marc files we have to remove the FFT node, it includes a random generated file path

            dom_x = xml.dom.minidom.parseString(x)
            datafields = dom_x.getElementsByTagName("datafield")

            #remove all the FFT datafields
            for node in datafields:
                if (node.hasAttribute("tag")
                        and node.getAttribute("tag") == "FFT"):
                    node.parentNode.removeChild(node)
                    node.unlink()

            new_x = dom_x.toprettyxml("", "\n")

            dom_y = xml.dom.minidom.parseString(y)
            new_y = dom_y.toprettyxml("", "\n")
            # 'normalize' the two XML MARC files for the purpose of comparing
            new_x = expandtabs(new_x)
            new_y = expandtabs(new_y)

            new_x = new_x.replace(' ', '')
            new_y = new_y.replace(' ', '')

            new_x = new_x.replace('\n', '')
            new_y = new_y.replace('\n', '')

            # compare the two xml marcs
            self.assertEqual(new_x, new_y)