Exemplos de DAL.corpus_meta em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: pydal

Classe / Tipo: DAL

Método / Função: corpus_meta

Exemplos em hotexamples.com: 1

DAL.corpus_meta em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de pydal.DAL.corpus_meta em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

DAL(30)

define_table(30)

close(25)

commit(23)

executesql(14)

rollback(4)

__call__(2)

corpus_meta(1)

dns_zones(1)

export_to_csv_file(1)

get(1)

import_from_csv_file(1)

single_transaction(1)

Métodos Frequentes

DAL (30)

define_table (30)

close (25)

commit (23)

executesql (14)

rollback (4)

__call__ (2)

corpus_meta (1)

dns_zones (1)

export_to_csv_file (1)

Métodos Frequentes

get (1)

import_from_csv_file (1)

single_transaction (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: db_model.py Projeto: woodgear/VocabularyHunter

class DbModel: """the abstract layer of vh. make the caller need not to care about what and how to storage/fetch data Attributes: db: string the data base name,just to idenity. """ def __init__(self, db_name="vh"): self.db_name = db_name folder_path = os.getenv("VH_USER_PATH") or "./vol/vh-user" self.folder_path = folder_path self._init_db() pass def __del__(self): if hasattr(self, "db"): self.db.close() pass def _init_db(self): if not os.path.exists(self.folder_path): os.mkdir(self.folder_path) sqlite_uri = f'sqlite://{self.db_name}.sqlite' self.db = DAL(sqlite_uri, folder=self.folder_path) # TODO pydal会自动自动创建id字段为自增主键 user-id 是不是多余了 self.db.define_table('word', Field('user_id'), Field( 'word'), Field('word_type'), Field('time')) self.db.define_table('meta', Field('key'), Field('value')) self.db.meta.insert(key='db_version', value=DB_VERSION) self.db.commit() self.init_corpus_table(self.db) def _db(self): return self.db def get_all_unknow_word_by_id(self, id): """ Args: id: string user id Returns: [string] """ return [item.word for item in self.db((self.db.word.user_id == id) & (self.db.word.word_type == "unknow")).select(self.db.word.ALL)] def get_all_know_word_by_id(self, id): """ Args: id: string user id Returns: [string] """ return [item.word for item in self.db((self.db.word.user_id == id) & (self.db.word.word_type == "know")).select(self.db.word.ALL)] pass def mark_know_word_by_id(self, id, words): """ Args: id: string user id words: [string] """ for word in words: self.db.word.update_or_insert( (self.db.word.word == word) & (self.db.word.user_id == id), word=word, user_id=id, word_type="know", time=pytime.asctime(pytime.gmtime())) self.db.commit() pass def mark_unknow_word_by_id(self, id, words): """ Args: id: string user id words: [string] """ for word in words: self.db.word.update_or_insert( (self.db.word.word == word) & (self.db.word.user_id == id), word=word, user_id=id, word_type="unknow", time=pytime.asctime(pytime.gmtime())) self.db.commit() pass def init_corpus_table(self, db): """ 初始化与语料相关的表也许以后应当是横切的数据库 corpus_meta { id, # 自动生成主键之类的 md5, # corpus 应当是纯文字的感觉 type, # corpus类型设计上有 article subtitle book 之类的 struct, # 存储来此corpus的结构之后查询的时候通过这个结构和倒排索引拿到初始范围 {start:xx,end:xxx,type:"root",child:[{start:xx,end:xxx etc}] time, source, # 例如url之类的 name, } corpus { id, content, } user_corpus { user_id, corpus_id } word_invert_index { word, lemma, corpus_id position, # left-right } """ db.define_table("corpus_meta", Field("id", type="id"), Field("md5", type="string", length=255), Field("type", type="string", length=255), Field("struct", type="string", length=10240), # 应该够了 Field("time", 'datetime'), Field("source", type="string", length=1024), Field("name", type="string", length=1024), ) db.define_table("corpus", Field("corpus_id", type='reference corpus_meta'), Field("content", type="text", length=1024*1024), ) db.define_table("user_corpus", Field("user_id", type="string"), Field("corpus_id", type="reference corpus_meta") ) db.define_table("word_invert_index", Field("word", type="string"), Field("lemma", type="string"), Field("corpus_id", type="reference corpus_meta"), Field("span", type="string"), ) pass def has_article(self, article): record = self.db(self.db.corpus_meta.md5 == article["md5"]).select().first() return record != None pass def find_article_meta(self, id): record = self.db.corpus_meta(id) if record is None: return None record = record.as_dict() record["struct"] = json.loads(record["struct"]) return record def find_article(self, id, span): data = self.db(self.db.corpus.corpus_id == id).select( self.db.corpus.content[span[0]:span[1]]).first() raw = list(data._extra.as_dict().values())[0] return raw def save_article(self, article): raw_article = article["article"] corpus_meta_data = {"name": article["name"], "source": article["source"], "type": article["type"], "time": article["time"], "struct": article["struct"], "md5": article["md5"]} cropus_id = self.db.corpus_meta.insert(**corpus_meta_data) self.db.corpus.insert(corpus_id=cropus_id, content=raw_article) self.db.commit() return cropus_id pass def save_word_invert_index(self, corpus_id, words): def map_word(corpus_id, word): word["corpus_id"] = corpus_id word["span"] = json.dumps(word["span"]) return word words = [map_word(corpus_id, w) for w in words] self.db.word_invert_index.bulk_insert(words) self.db.commit() pass def connect_user_and_corpus(self, user_id, corpus_id): self.db.user_corpus.insert( **{"user_id": user_id, "corpus_id": corpus_id}) self.db.commit() pass def find_word_invert_index(self, user_id, lemma): words = self.db( (self.db.user_corpus.user_id == user_id) & (self.db.word_invert_index.corpus_id == self.db.user_corpus.corpus_id) & (self.db.word_invert_index.lemma == lemma) ).select(self.db.word_invert_index.ALL) for w in words: w = w.as_dict() del w["id"] w["span"] = json.loads(w["span"]) yield w pass