Python readALTA2015Data示例

编程语言: Python

命名空间/包名称: DocUtils.concaTextData

方法/功能: readALTA2015Data

hotexamples.com的示例: 3

Python readALTA2015Data - 已找到3个示例。这些是从开源项目中提取的最受好评的DocUtils.concaTextData.readALTA2015Data现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： fetchTranslations.py 项目： spacegoing/ALTA2015Contest

def getTrainRawData(srcFolder, fileName, keyset):
    docIndexString, docStringIndices = readALTA2015Data(srcFolder + fileName)

    # Attention: the following would cost website query limits
    docIndexBabelSynsetID, docFilteredIndexString = \
        queryBabelfySynsetID(docIndexString, docStringIndices)

    docIndexLangTrans = queryBabelNetSimpleLemma(docIndexBabelSynsetID, keyset)

    return docFilteredIndexString, docIndexLangTrans

示例#2

显示文件

            rawBnSets, indices, document)

        docIndexBabelSynsetID[d] = filteredBnSets
        docFilteredIndexString[d] = filteredStrings

    return docIndexBabelSynsetID, docFilteredIndexString


##
if __name__ == "__main__":
    from DocUtils.concaTextData import readALTA2015Data

    filepath = "/Users/spacegoing/百度云同步盘/macANU/" \
               "2cdSemester 2015/Document Analysis/sharedTask" \
               "/Code/pycharmVersion/Data/Test/Test.txt"
    docIndexString, docStringIndices = readALTA2015Data(filepath)
    rawDocBnSets = getDocBnSets(docStringIndices)

    # rawBnSets = rawDocBnSets[24]
    # indices = docStringIndices[24][1]
    # indexStrings = docStringIndices[24][0]
    # filteredBnSets, filteredStrings = filterRawBnSets(rawBnSets, indices, indexStrings)
    # print(filteredBnSets[:5])
    # print(filteredBnSets[-5:])

    docIndexBabelSynsetID, docFilteredIndexString = \
        getFilteredDocBnSets(docStringIndices, rawDocBnSets)

    import pickle

    babelfyData = [

示例#3

显示文件

文件： queryBabelfy.py 项目： spacegoing/babelNetAPI

        docIndexBabelSynsetID[d] = filteredBnSets
        docFilteredIndexString[d] = filteredStrings

    return docIndexBabelSynsetID, docFilteredIndexString


##
if __name__ == "__main__":
    from DocUtils.concaTextData import readALTA2015Data

    filepath = (
        "/Users/spacegoing/百度云同步盘/macANU/"
        "2cdSemester 2015/Document Analysis/sharedTask"
        "/Code/pycharmVersion/Data/Test/Test.txt"
    )
    docIndexString, docStringIndices = readALTA2015Data(filepath)
    rawDocBnSets = getDocBnSets(docStringIndices)

    # rawBnSets = rawDocBnSets[24]
    # indices = docStringIndices[24][1]
    # indexStrings = docStringIndices[24][0]
    # filteredBnSets, filteredStrings = filterRawBnSets(rawBnSets, indices, indexStrings)
    # print(filteredBnSets[:5])
    # print(filteredBnSets[-5:])

    docIndexBabelSynsetID, docFilteredIndexString = getFilteredDocBnSets(docStringIndices, rawDocBnSets)

    import pickle

    babelfyData = [docIndexString, docStringIndices, docIndexBabelSynsetID, docFilteredIndexString]
    outpath = (