Python MyMongo Exemples

Langage de programmation: Python

Espace de nommage/Pack: my_mongo

Class/Type: MyMongo

Exemples au hotexamples.com: 3

Python MyMongo - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de my_mongo.MyMongo extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

close(3)

get(1)

get_article_attri(1)

get_article_body_text(1)

get_articles(1)

update_record(1)

Méthodes fréquemment utilisées

close (3)

get (1)

get_article_attri (1)

get_article_body_text (1)

get_articles (1)

update_record (1)

Associées

Screen

columns_from_table

Contour

get_extensions

hide_config

TracFunctionalTestEnvironment

FizzBuzzNumber

add_wsgi_intercept

filter_hubs_by_profile

ViewSorter

Related in langs

ArcDB (PHP)

PlayReadyLicenseResponseTemplate (PHP)

StateV1 (C#)

StateTo (C#)

TIME_CALL (C++)

min_heap_shift_down_ (C++)

NewClient (Go)

BlockHeader (Go)

UserAccount (Java)

DateUtil (Java)

Exemple #1

0

Afficher le fichier

Fichier : test_db.py Projet : joyce-duan/All-Things-Data-Science

def test_get_article_attri(): print '\nfunction: %s ' % inspect.stack()[0][3] my_mongo = MyMongo(dbname='nytimes') # print my_mongo.get_one_article() article_atrri, article_dt = my_mongo.get_article_attri(testing=1) print '%i items retrieved' % (len(article_atrri)) print 'title:' print zip(article_atrri)[:5] print 'publication date' print zip(article_dt)[:5] my_mongo.close() n.assert_greater(len(article_atrri), 2)

Exemple #2

0

Afficher le fichier

Fichier : topic_modeling.py Projet : joyce-duan/All-Things-Data-Science

def read_articles(): ''' read all articles as dataframe from mongodb collection 'articles' - INPUT: None - OUTPUT: df. columns: title, url, uri, body_text, ''' my_mongo = MyMongo() t0 = time.time() cur_articles = my_mongo.get_article_body_text(testing=0) articles_cleaned = {} # print '%d unique articles ' % len(articles_cleaned) clean_articles(cur_articles, articles_cleaned) print '%d unique articles with body_text' % len(articles_cleaned) t1 = time.time() # time it print "finished in %4.4fmin for %s " % ((t1 - t0) / 60, 'read/clean articles') df = pd.DataFrame([{'url': k, 'body_text': v[1]} for k, v in articles_cleaned.items()]) article_dict, article_dt = MyMongo().get_article_attri() #article_dict_all = dict(article_dict) df['title'] = df['url'].map(lambda x: article_dict.get(x, 'Unknown')) df['uri'] = df['url'].map(lambda x: parse_url(x).host) df['dt'] = df['url'].map(lambda x: article_dt.get(x, '')) my_mongo.close() return df

Exemple #3

0

Afficher le fichier

Fichier : add_body_text_mongo.py Projet : joyce-duan/All-Things-Data-Science

import sys # sys.path.append('../db') from configobj import ConfigObj config = ConfigObj('../allds.config') allds_home = config['allDS_home'] sys.path.append(allds_home + '/code/db') from my_mongo import MyMongo from httplib import BadStatusLine from boilerpipe.extract import Extractor if __name__ == '__main__': my_mongo = MyMongo() query = {'raw_html': {'$exists': 1}, 'body_text': {'$exists': 0}} cur_articles = my_mongo.get_articles(query=query) articles = list(cur_articles) print '%d articles to be processed. ' % (len(articles)) for a in articles: try: extractor = Extractor( extractor='ArticleExtractor', html=a['raw_html']) extracted_text = extractor.getText() l = extracted_text.split('\n') a_id = a['_id'] my_mongo.update_record( 'articles', a_id, 'body_text', extracted_text) # print(extracted_text)