Python DataHandler Beispiele

Programmiersprache: Python

Namespace / Paketname: dataHandler.MysqlHandler

Klasse / Typ: DataHandler

Beispiele auf hotexamples.com: 8

Python DataHandler - 8 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die dataHandler.MysqlHandler.DataHandler, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

DataHandler(1)

getKeywordIndex(1)

getRssdata(1)

getStopWord(1)

getTokenTitle(1)

getUrl(1)

insertContentToken(1)

insertKeywordIndex(1)

insertRelatedDoc(1)

insertRelatedTopic(1)

insertTitleToken(1)

updateRssToken(1)

Beispiel #1

Datei anzeigen

# -*- coding: utf-8 -*-
## 7000 word word2Vec example

from dataHandler.MysqlHandler import DataHandler
import gensim

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")

document = {}
termList = dataHandler.getTokenTitle(7000)

texts = []      # docuemnt text
ids = []	# document ids
for term in termList :
    if term[1] in document :
        document[term[1]].append(term[2])
    else:
        document[term[1]] = []
        document[term[1]].append(term[2])


for key, item in document.items() :
    texts.append(item)
    ids.append(key)

Beispiel #2

Datei anzeigen

from dataHandler.MysqlHandler import DataHandler
from dataHandler.DataCollector import DataCollector

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")


def rssFetch(url_id, rssData):
    linkData = dataHandler.getRssdataByLink(rssData["link"])
    if len(linkData) == 0:
        dataHandler.insertRssData('', rssData["title"], rssData["link"],
                                  rssData["pubDate"], rssData["description"],
                                  url_id)


dataCollector = DataCollector()
urlList = dataHandler.getUrl()

for url in urlList:
    dataCollector.getRss(url[2], url[0], rssFetch)

Beispiel #3

Datei anzeigen

Datei: MorphemeProc.py Projekt: mayblue9/kisa

from analysis.Morpheme import Morpheme
from dataHandler.MysqlHandler import DataHandler

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")

morpheme = Morpheme()

rssDataList = dataHandler.getRssdata("0")


def isNumber(s):
    try:
        float(s)
        return True
    except ValueError:
        return False


def filterToken(var):
    if len(var) > 2 and isNumber(var) == False:
        return True
    return False


for rssData in rssDataList:

    if (rssData[1] != None and rssData[1] != "" and len(rssData[1]) > 2):

Beispiel #4

Datei anzeigen

## 3000 word related document 예제 by LSA

from dataHandler.MysqlHandler import DataHandler
from analysis.lsa.vector_space import VectorSpace

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")


termList = dataHandler.getTokenTitle(3000)


## document format : {rss_id : [(id. rss_id, term ).(id. rss_id, term)]}
## ex) {11882: [(1, 11882, '6자수석'), (2, 11882, '평화협정')], 11883: [(3, 11883, '문체부')]}
document = {}

index_to_keyword_mapping = {}

for term in termList :

    if term[1] in document :
        document[term[1]].append(term)
    else:
        document[term[1]] = []
        document[term[1]].append(term)

    keywordIndex = dataHandler.getKeywordIndex(term[2])
    if len(keywordIndex) > 0:

Beispiel #5

Datei anzeigen

# -*- coding: utf-8 -*-

## 7000 word related topic 예제 by LDA

from dataHandler.MysqlHandler import DataHandler
from analysis.util.DocumentUtil import DocumentUtil
from gensim import corpora, models
import gensim

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")

document = {}
termList = dataHandler.getTokenTitle(7000)

texts = []  # docuemnt text
ids = []  # document ids
for term in termList:
    if term[1] in document:
        document[term[1]].append(term[2])
    else:
        document[term[1]] = []
        document[term[1]].append(term[2])

for key, item in document.items():
    texts.append(item)
    ids.append(key)

Beispiel #6

Datei anzeigen

Datei: LDAProc.py Projekt: agune/kisa

# -*- coding: utf-8 -*-

## 7000 word related topic 예제 by LDA

from dataHandler.MysqlHandler import DataHandler
from analysis.util.DocumentUtil import DocumentUtil
from gensim import corpora, models
import gensim

import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")

document = {}
termList = dataHandler.getTokenTitle(7000)

texts = []      # docuemnt text
ids = []	# document ids
for term in termList :
    if term[1] in document :
        document[term[1]].append(term[2])
    else:
        document[term[1]] = []
        document[term[1]].append(term[2])


for key, item in document.items() :
    texts.append(item)
    ids.append(key)

Beispiel #7

Datei anzeigen

Datei: MorphemeProc.py Projekt: agune/kisa

from analysis.Morpheme import Morpheme
from dataHandler.MysqlHandler import DataHandler


import os
dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa");


morpheme = Morpheme()

rssDataList = dataHandler.getRssdata("0")


def isNumber(s):
    try:
        float(s)
        return True
    except ValueError:
        return False

def filterToken(var):
    if len(var) > 2 and isNumber(var) == False :
        return True
    return False


for rssData in rssDataList :

Beispiel #8

Datei anzeigen

Datei: Word2Vec.py Projekt: agune/kisa

# -*- coding: utf-8 -*-
## 7000 word word2Vec example

from dataHandler.MysqlHandler import DataHandler
import gensim

import os

dbUser = os.environ["DB_USER"]
dbPw = os.environ["DB_PW"]

dataHandler = DataHandler("localhost", dbUser, dbPw, "kisa")

document = {}
termList = dataHandler.getTokenTitle(7000)

texts = []  # docuemnt text
ids = []  # document ids
for term in termList:
    if term[1] in document:
        document[term[1]].append(term[2])
    else:
        document[term[1]] = []
        document[term[1]].append(term[2])


for key, item in document.items():
    texts.append(item)
    ids.append(key)