Python Google.drop 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: google

클래스/타입: Google

메소드/함수: drop

hotexamples.com에서의 예제들: 6

Python Google.drop - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 google.Google.drop에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Google(30)

drop_duplicates(5)

reset_index(4)

dropna(3)

drop(3)

open_workbook(2)

clear_wrapper(2)

calculator(2)

auth(2)

request(1)

parse_email(1)

get_expiration_dates(1)

navigate(1)

set_channels(1)

set_channels_events(1)

get_route_data(1)

get_permissions(1)

get_orders(1)

get_option_data(1)

getData(1)

get_channels_evento(1)

get_channels(1)

getUrl(1)

add_video(1)

get(1)

find(1)

directions(1)

create_xml(1)

create_playlist(1)

create_contact(1)

columns(1)

clock(1)

averageData(1)

append(1)

set_permissions(1)

예제 #1

파일 보기

파일: companies.py 프로젝트: john2x/clearspark

    def _company_blog(self, domain, api_key="", name=""):
        #TODO get blog url
        df = Google().search('inurl:blog site:{0}'.format(domain), 1)
        print df
        if df.empty: return
        df["count"] = [len(url) for url in df.link]
        df = df.reset_index().drop('index', 1)
        df = df.drop('title', 1)
        url = df.sort('count').url.ix[0]
        df["timestamp"] = [i.split("...")[0].strip() for i in df.link_span]
        months = list(calendar.month_abbr)
        timestamps = []
        for _date in df.timestamp:
            try:
                num = months.index(_date.split(" ")[0])
            except:
                timestamps.append(0)
                continue
            _date = str(num) + " " + " ".join(_date.split(" ")[1:])
            try:
                timestamps.append(arrow.get(_date, "M D, YYYY").timestamp)
            except:
                if "day" in i:
                    num = int(i.split())
                    timestamps.append(arrow.utcnow().replace(days=num *
                                                             -1).timestamp)
                else:
                    timestamps.append(0)
        df["timestamp"] = timestamps

        data = {'data': df.to_dict('r'), 'blog_url': url}
        data["domain"] = domain
        data["api_key"] = api_key
        data["company_name"] = name
        CompanyExtraInfoCrawl()._persist(data, "blog_data", api_key)

예제 #2

파일 보기

파일: companies.py 프로젝트: john2x/clearspark

    def _company_blog(self, domain, api_key="", name=""):
        #TODO get blog url
        df = Google().search('inurl:blog site:{0}'.format(domain), 1)
        print df
        if df.empty: return
        df["count"] = [len(url) for url in df.link]
        df = df.reset_index().drop('index',1)
        df = df.drop('title', 1)
        url = df.sort('count').url.ix[0]
        df["timestamp"] = [i.split("...")[0].strip() for i in df.link_span]
        months = list(calendar.month_abbr)
        timestamps = []
        for _date in df.timestamp:
            try:
                num = months.index(_date.split(" ")[0])
            except:
                timestamps.append(0)
                continue
            _date = str(num)+" "+" ".join(_date.split(" ")[1:])
            try:
              timestamps.append(arrow.get(_date, "M D, YYYY").timestamp)
            except:
                if "day" in i:
                  num = int(i.split())
                  timestamps.append(arrow.utcnow().replace(days=num*-1).timestamp)
                else:
                  timestamps.append(0)
        df["timestamp"] = timestamps

        data = {'data': df.to_dict('r'), 'blog_url':url}
        data["domain"] = domain
        data["api_key"] = api_key
        data["company_name"] = name
        CompanyExtraInfoCrawl()._persist(data, "blog_data", api_key)

예제 #3

파일 보기

파일: companies.py 프로젝트: robinsingh1/scaling-fortnight

    def _press_releases(self, qry, company_domain=None, period=None):
        queries = [
            '"{0}" site:prnewswire.com'.format(qry),
            '"{0}" site:businesswire.com'.format(qry),
            '"{0}" site:marketwired.com'.format(qry),
            '"{0}" site:newswire.ca'.format(qry),
            '"{0}" site:reuters.com'.format(qry)
        ]

        p = Google()._multi_get(queries)
        try:
            p = p.drop_duplicates()
        except:
            """ """
        #p['date'] = [span.split('Business Wire')[-1].split('...')[0].strip() for span in p.link_span]
        p['description'] = [
            "".join(span.split('...')[1:]).strip() for span in p.link_span
        ]
        p["domain"] = company_domain
        p['date'] = [span.split('...')[0].strip() for span in p.link_span]
        p["timestamp"] = [Helper()._str_to_timestamp(i) for i in p.date]
        p['title'] = p['link_text']

        p = p.drop('link_text', 1)
        p = p.drop('url', 1)
        p = p.drop('link_span', 1)
        #for i in p.timestamp: print i
        data = p
        data["domain"] = company_domain
        data["domain"] = company_domain
        data["event_type"] = "CompanyPressEvent"
        data = data.applymap(lambda x: self._remove_non_ascii(x))
        data["event_key"] = [
            "".join(map(str, _data.values()))[:124]
            for _data in data.to_dict("r")
        ]
        _df = data.to_dict("r")
        for i in _df:
            for key in i.keys():
                if i[key] == None: del i[key]
        data = [row.dropna().to_dict() for i, row in data.iterrows()]
        r.table("events").insert(data).run(conn)
        return data

예제 #4

파일 보기

파일: companies.py 프로젝트: john2x/scaling-fortnight

    def _press_releases(self, qry, company_domain=None, period=None):
        queries = ['"{0}" site:prnewswire.com'.format(qry),
                   '"{0}" site:businesswire.com'.format(qry),
                   '"{0}" site:marketwired.com'.format(qry),
                   '"{0}" site:newswire.ca'.format(qry),
                   '"{0}" site:reuters.com'.format(qry)]

        p = Google()._multi_get(queries)
        try:
          p = p.drop_duplicates()
        except:
          """ """
        #p['date'] = [span.split('Business Wire')[-1].split('...')[0].strip() for span in p.link_span]
        p['description'] = ["".join(span.split('...')[1:]).strip() for span in p.link_span]
        p["domain"] = company_domain
        p['date'] = [span.split('...')[0].strip() for span in p.link_span]
        p["timestamp"] = [Helper()._str_to_timestamp(i) for i in p.date]
        p['title'] = p['link_text']

        p = p.drop('link_text',1)
        p = p.drop('url',1)
        p = p.drop('link_span',1)
        #for i in p.timestamp: print i
        data = p
        data["domain"] = company_domain
        data["domain"] = company_domain
        data["event_type"] = "CompanyPressEvent"
        data = data.applymap(lambda x: self._remove_non_ascii(x))
        data["event_key"] = ["".join(map(str, _data.values()))[:124]
                             for _data in data.to_dict("r")]
        _df = data.to_dict("r")
        for i in _df:
            for key in i.keys():
                if i[key] == None: del i[key]
        data = [row.dropna().to_dict() for i, row in data.iterrows()]
        r.table("events").insert(data).run(conn)
        return data

예제 #5

파일 보기

파일: companies.py 프로젝트: robinsingh1/scaling-fortnight

    def _company_blog(self, domain, period=None):
        #TODO get blog url
        if period:
            df = Google().search('inurl:blog site:{0}'.format(domain), 1, "d")
        else:
            df = Google().search('inurl:blog site:{0}'.format(domain), 1)

        if df.empty: return
        df["count"] = [len(url) for url in df.link]
        df = df.reset_index().drop('index', 1)
        df = df.drop('title', 1)
        url = df.sort('count').url.ix[0]
        df["timestamp"] = [i.split("...")[0].strip() for i in df.link_span]
        months = list(calendar.month_abbr)
        timestamps = []
        for _date in df.timestamp:
            try:
                num = months.index(_date.split(" ")[0])
            except:
                timestamps.append(0)
                continue
            _date = str(num) + " " + " ".join(_date.split(" ")[1:])
            try:
                timestamps.append(arrow.get(_date, "M D, YYYY").timestamp)
            except:
                if "day" in i:
                    num = int(i.split())
                    timestamps.append(arrow.utcnow().replace(days=num *
                                                             -1).timestamp)
                else:
                    timestamps.append(0)
        df["timestamp"] = timestamps
        data = df
        print data
        data["domain"] = domain
        data["event_type"] = "CompanyBlogEvent"
        data = data.applymap(lambda x: self._remove_non_ascii(x))
        data["event_key"] = [
            "".join(map(str, _data.values()))[:124]
            for _data in data.to_dict("r")
        ]
        data = [row.dropna().to_dict() for i, row in data.iterrows()]
        r.table("events").insert(data).run(conn)
        return data

예제 #6

파일 보기

파일: companies.py 프로젝트: john2x/scaling-fortnight

    def _company_blog(self, domain, period=None):
        #TODO get blog url
        if period:
          df = Google().search('inurl:blog site:{0}'.format(domain), 1, "d")
        else:
          df = Google().search('inurl:blog site:{0}'.format(domain), 1)

        if df.empty: return
        df["count"] = [len(url) for url in df.link]
        df = df.reset_index().drop('index',1)
        df = df.drop('title', 1)
        url = df.sort('count').url.ix[0]
        df["timestamp"] = [i.split("...")[0].strip() for i in df.link_span]
        months = list(calendar.month_abbr)
        timestamps = []
        for _date in df.timestamp:
            try:
                num = months.index(_date.split(" ")[0])
            except:
                timestamps.append(0)
                continue
            _date = str(num)+" "+" ".join(_date.split(" ")[1:])
            try:
              timestamps.append(arrow.get(_date, "M D, YYYY").timestamp)
            except:
                if "day" in i:
                  num = int(i.split())
                  timestamps.append(arrow.utcnow().replace(days=num*-1).timestamp)
                else:
                  timestamps.append(0)
        df["timestamp"] = timestamps
        data = df
        print data
        data["domain"] = domain
        data["event_type"] = "CompanyBlogEvent"
        data = data.applymap(lambda x: self._remove_non_ascii(x))
        data["event_key"] = ["".join(map(str, _data.values()))[:124]
                             for _data in data.to_dict("r")]
        data = [row.dropna().to_dict() for i, row in data.iterrows()]
        r.table("events").insert(data).run(conn)
        return data