Python csr_matrix.get_shapeの例

プログラミング言語: Python

名前空間/パッケージ名: scipy.sparse.csr

クラス/型: csr_matrix

メソッド/関数: get_shape

hotexamples.comのコード掲載数: 1

Python csr_matrix.get_shape - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのscipy.sparse.csr.csr_matrix.get_shapeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

multiply(2)

nonzero(2)

todense(2)

diagonal(1)

dot(1)

get_shape(1)

tolil(1)

transpose(1)

コード例 #1

ファイルを表示

def compute_information_gain(vectorizer: CountVectorizer, word: str, dataTrain: csr_matrix, targetTrain: [int]) \
        -> float:
    """Compute information gain of given word and return value"""
    word = word.lower()
    parentEntropy = computeEntropy(targetTrain)
    numRows = dataTrain.get_shape()[0]
    wordYesSplit = {0: 0, 1: 0}
    wordNoSplit = {0: 0, 1: 0}
    for count in range(numRows):
        simpleSentence = vectorizer.inverse_transform(dataTrain[count])[0]
        if word in simpleSentence:
            wordYesSplit[targetTrain[count]] += 1
        else:
            wordNoSplit[targetTrain[count]] += 1
    wordYesArray = wordYesSplit[0] * [0] + wordYesSplit[1] * [1]
    #print("lenYesArr: {}, YesDict: {}".format(len(wordYesArray), wordYesSplit))
    wordNoArray = wordNoSplit[0] * [0] + wordNoSplit[1] * [1]
    #print("lenNoArr: {}, NoDict: {}".format(len(wordNoArray), wordNoSplit))
    yesSplitEntropy = computeEntropy(wordYesArray)
    noSplitEntropy = computeEntropy(wordNoArray)
    probYes = len(wordYesArray) / numRows
    probNo = len(wordNoArray) / numRows
    #print("parEnt: {}, YesEnt: {}, NoEnt: {}".format(parentEntropy, yesSplitEntropy, noSplitEntropy))
    #print("probYes= {}, probNo= {}".format(probYes, probNo))

    return parentEntropy - (yesSplitEntropy * probYes +
                            noSplitEntropy * probNo)