Python LoadData._getRawDataFromText示例

编程语言: Python

类/类型: LoadData

方法/功能: _getRawDataFromText

hotexamples.com的示例: 1

Python LoadData._getRawDataFromText - 已找到1个示例。这些是从开源项目中提取的最受好评的LoadData._getRawDataFromText 来自程序包 SGAE现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

LoadData(30)

GetData(9)

LoadDta(5)

load_ic(2)

loadTrainDataFromCSV(2)

LoadDataFromFile(2)

loadTestDataFromCSV(2)

addAllOneColumn(2)

AccidentsData(1)

batch_creation(1)

SelectDataAccordingToType(1)

VehiclesData(1)

_downloadStocks(1)

_getRawDataFromText(1)

_getSymbols(1)

getTraindata(1)

downloadSymbols(1)

getTestData(1)

ProcessData(1)

historicalData(1)

loadRFBenchmarkFromCSV(1)

load_anns(1)

loadcleandata(1)

RAFDataset(1)

MergeImages(1)

Normalize(1)

LoadData_labels(1)

DataDictionary(1)

DataSet(1)

DualTrainDatasetRAF(1)

GetData_WithoutS(1)

LoadDataTrain(1)

LoadData_bagOfWords(1)

LoadData_cut_dire(1)

LoadData_vocabulary(1)

MergedData(1)

LoadJSON(1)

LoadStopWords(1)

LoadXMLFromDrug(1)

Load_Case1(1)

Load_Case2(1)

Load_Case5(1)

Load_CaseGB(1)

Covid(1)

store(1)

示例#1

0

显示文件

文件： Word2Vec.py 项目： ujwalsingh88/Test

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import PreProcessor
import LoadData


def sentence_to_wordlist(raw):
    words=raw.split();
    return words



#get raw data from Previous Task filtered Organised Preprocessed Text
print ('GetttingRawData')
rawText = LoadData._getRawDataFromText()
rawPrepProcessedText = PreProcessor.preProcessData(rawText)
print('Got RawData -ProcessingData')
#Tokenising Raw Data
tokenizer = nltk.data.load('tokenizers/punkt/english.pickle')
raw_sentences=tokenizer.tokenize(rawPrepProcessedText)
sentences=[]

#getting wrd token List tokenised Data
for raw_sentence in raw_sentences:
    if len(raw_sentence)>0:
        sentences.append(sentence_to_wordlist(raw_sentence))

#just temporary to find count no use in code
tokenCount=sum([len(sentence)for sentence in sentences])
print('Token Count----',tokenCount)