Python upload_data Exemples, db_upload.upload_data Python Exemples

Exemple #1

0

Afficher le fichier

Fichier : download_module.py Projet : derak4210/EDM_Reporting_Scripts

def download_parse_query_log(date, source_id, sourceName, pubID, pubName):
    grouped_data = []
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=search'
    date_params = '&date=' + date
    hour_param = '&hour='
    sid_param = '&sid=' + source_id
    data = []
    for x in range(0, 23):
        #check if query logs exist
        file_name = '/home/ec2-user/DB_logs/Search_Logs/' + date + '/' + 'excitedigitalmedia_search_logs_' + source_id + '_' + date + '_' + str(
            x) + '.j'
        #file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Query_Log/PPC_Query_Log/excitedigitalmedia_search_logs_' + source_id + '_' + date + '_' + str(x) +  '.j'
        if not os.path.exists(file_name):
            if not os.path.exists('/home/ec2-user/DB_logs/Search_Logs/' +
                                  date + '/'):
                os.makedirs('/home/ec2-user/DB_logs/Search_Logs/' + date + '/')
            full_url = url + date_params + sid_param + hour_param + str(x)
            command = 'curl \'' + full_url + '\' --compressed > ' + file_name
            print("Command to be executed:\n%s" % command)
            os.system(command)

        #parse query log
        open_file = open(file_name, 'rb')

        for row in open_file:
            print("ROW: %s" % row)
            try:
                json_row = json.loads(row, encoding='utf-8')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                subid = str(json_row['subid'])
                new_row = [
                    date, source_id, pid, subid, kw, sourceName, pubName
                ]
                data.append(new_row)
            except UnicodeDecodeError:
                json_row = json.loads(row, encoding='latin-1')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                subid = str(json_row['subid'])
                new_row = [date, source_id, pid, subid, kwsourceName, pubName]
                data.append(new_row)
            except ValueError:
                try:
                    row = filter(string.printable.__contains__, row)
                    #row = strip_control_characters(row)
                    json_row = json.loads(row, encoding='latin-1')
                    pid = str(json_row['pid'])
                    kw = str(json_row['keyword'])
                    subid = str(json_row['subid'])
                    new_row = [
                        date, source_id, pid, subid, kwsourceName, pubName
                    ]
                    data.append(new_row)
                except:
                    try:
                        row = removeNonAscii(row).replace("X\"MT", "").replace(
                            "X\"", "")
                        json_row = json.loads(row, encoding='latin-1')
                        pid = str(json_row['pid'])
                        kw = str(json_row['keyword'])
                        subid = str(json_row['subid'])
                        new_row = [
                            date, source_id, pid, subid, kwsourceName, pubName
                        ]
                        data.append(new_row)
                    except:
                        traceback.print_exc()
                        continue
    grouped_data = groupdata(data)

    ##write report
    #file = open("Adlux_Search_Log_" + source_id + "_" + date + ".csv","wb")
    #wr = csv.writer(file)
    #header = ["Source ID", "Publisher ID", "Query Term", "Count"]
    #wr.writerow(header)

    #wr.writerows(grouped_data)

    #UPLOAD DATA
    upload_data(grouped_data)

Exemple #2

0

Afficher le fichier

Fichier : download_module.py Projet : derak4210/EDM_Reporting_Scripts

def download_parse_query_log(date,source_id,sourceName,pubID,pubName):
    grouped_data = []
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=search'
    date_params = '&date=' + date
    hour_param = '&hour='
    sid_param = '&sid=' + source_id
    data = []
    for x in range(0,23):
        #check if query logs exist
        file_name = '/home/ec2-user/DB_logs/Search_Logs/' + date + '/' + 'excitedigitalmedia_search_logs_' + source_id + '_' + date + '_' + str(x) +  '.j'
        #file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Query_Log/PPC_Query_Log/excitedigitalmedia_search_logs_' + source_id + '_' + date + '_' + str(x) +  '.j'
        if not os.path.exists(file_name):
            if not os.path.exists('/home/ec2-user/DB_logs/Search_Logs/' + date + '/'):
                os.makedirs('/home/ec2-user/DB_logs/Search_Logs/' + date + '/')
            full_url = url + date_params + sid_param + hour_param + str(x)
            command = 'curl \'' + full_url + '\' --compressed > ' + file_name
            print("Command to be executed:\n%s" % command)
            os.system(command)
        
        #parse query log
        open_file = open(file_name,'rb')

        for row in open_file:
            print("ROW: %s" %row)
            try:
                json_row = json.loads(row,encoding='utf-8')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                subid = str(json_row['subid'])
                new_row = [date,source_id,pid,subid,kw,sourceName,pubName]
                data.append(new_row)
            except UnicodeDecodeError:
                json_row = json.loads(row,encoding='latin-1')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                subid = str(json_row['subid'])
                new_row = [date,source_id,pid,subid,kwsourceName,pubName]
                data.append(new_row)
            except ValueError:
                try:
                    row = filter(string.printable.__contains__, row)
                    #row = strip_control_characters(row)
                    json_row = json.loads(row,encoding='latin-1')
                    pid = str(json_row['pid'])
                    kw = str(json_row['keyword'])
                    subid = str(json_row['subid'])
                    new_row = [date,source_id,pid,subid,kwsourceName,pubName]
                    data.append(new_row)
                except:
                    try:
                        row = removeNonAscii(row).replace("X\"MT","").replace("X\"","")
                        json_row = json.loads(row,encoding='latin-1')
                        pid = str(json_row['pid'])
                        kw = str(json_row['keyword'])
                        subid = str(json_row['subid'])
                        new_row = [date,source_id,pid,subid,kwsourceName,pubName]
                        data.append(new_row)
                    except:
                        traceback.print_exc()
                        continue
    grouped_data = groupdata(data)

    ##write report
    #file = open("Adlux_Search_Log_" + source_id + "_" + date + ".csv","wb")
    #wr = csv.writer(file)
    #header = ["Source ID", "Publisher ID", "Query Term", "Count"]
    #wr.writerow(header)

    #wr.writerows(grouped_data)

    #UPLOAD DATA
    upload_data(grouped_data)

Exemple #3

0

Afficher le fichier

    "daily"
    # "countries",
    ##"device_types",
    ##"keyword",
    #"products","tier"
]

for metric in reporting_metrics:
    for level in reporting_levels:
        try:
            for i in range(0, 10):
                data = download_report(date, metric, level)

                if len(data) > 0:
                    break
            print("Successfully download data for %s for date: %s" %
                  (level, date))
        except:
            print("Download Error")
            traceback.print_exc()
            error = "Download Error for %s level on %s" % (level, date)
            mail(error, level, date)
            break
        try:
            #raw_input("UPLOADING %s ROWS"%len(data))
            error = upload_data(date, metric, level, data)
            mail(error, level, date)
        except:
            #mail out success/failure
            mail(error, level, date)

Exemple #4

0

Afficher le fichier

Fichier : download_module.py Projet : derak4210/EDM_Reporting_Scripts

def download_parse_campaign_logs(date,source_id,sourceName,pubID,pubName):
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=campaign&click_type=raw'
    date_params = '&date=' + date
    sid_param = '&sid=' + source_id
    data = []
    count = 0
    #file_name = '/home/ec2-user/DB_logs/' + date + '/' + 'excitedigitalmedia_campaign_raw_click_logs' + source_id + '_' + date + '.j'
    file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Click_Logs/PPC_Click_Logs/' + date + '/excitedigitalmedia_campaign_raw_click_logs_' + source_id + '_' + date + '.j'

    #parse click log
    open_file = open(file_name,'rb')

    for row in open_file:
        print("ROW: %s" %row)
        row = row.replace('\\','')
        try:
            row = row.encode('utf-8','ignore')
            #row = unicode(row,'utf-8')
        except:
            traceback.print_exc()
            row = row.decode('utf-8','ignore')
        try:
            json_row = json.loads(row,encoding='utf-8')
            pid = str(json_row['pid'])
            kw = (json_row['keyword']).encode('utf-8')
            query = str(json_row['search_keyword'])
            subid = str(json_row['subid'])
            cid = str(json_row['cid'])
            adv_id = str(json_row['aid'])
            ip = str(json_row['ip_addr'])
            country = str(json_row['country'])
            ua = str(json_row['user_agent'])
            ref = str(json_row['ref_url'])
            ref_parse = urlparse(ref)
            if ref=='':
                ref = ''
            else:
                ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
	    gross_bid = str(json_row['gross_bid'])
            net_bid = str(json_row['bid'])
            disp_url = str(json_row['display_url'])
            search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
            search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
            click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
            click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
            new_row = [date,source_id,pid,cid,sourceName,pubName,subid,kw,query,adv_id,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
            data.append(new_row)
        except UnicodeDecodeError:
            try:

                json_row = json.loads(row,encoding='latin-1')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                query = str(json_row['search_keyword'])
                subid = str(json_row['subid'])
                cid = str(json_row['cid'])
                adv_id = str(json_row['aid'])
                ip = str(json_row['ip_addr'])
                country = str(json_row['country'])
                ua = str(json_row['user_agent'])
                ref = str(json_row['ref_url'])
        	ref_parse = urlparse(ref)
	        if ref=='':
        	    ref = ''
	        else:
	            ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
		gross_bid = str(json_row['gross_bid'])
                net_bid = str(json_row['bid'])
                disp_url = str(json_row['display_url'])
                search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
                search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
                click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
                click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
                new_row = [date,source_id,pid,cid,sourceName,pubName,subid,kw,query,adv_id,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
                data.append(new_row)
            except:
                traceback.print_exc()
        except:
            count = count + 1
            continue

    ##write report
    #file = open("ADLUX_CLICK_CAMPAIGN_LOGS_" + date + ".csv","wb")
    #wr = csv.writer(file)
    #header = ["date","sid","pid","cid","source_name","pub_name","subid","keyword","query_term","adv_id","ip","country","user_agent","referrer","gross_bid","net_bid","display_url","click_time","search_time"]
    #wr.writerow(header)

    #wr.writerows(data)

    upload_data(data,'campaign_raw',date,source_id,pubID)
    return(count)

Exemple #5

0

Afficher le fichier

Fichier : download_module.py Projet : derak4210/EDM_Reporting_Scripts

def download_parse_raw_click_log(date,source_id,sourceName,pubID,pubName):
    grouped_data = []
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=feed&click_type=raw'
    date_params = '&date=' + date
    sid_param = '&sid=' + source_id
    data = []
    count = 0

    #check if click logs exist
    file_name = '/home/ec2-user/DB_logs/' + date + '/' + 'excitedigitalmedia_feed_raw_click_logs_' + source_id + '_' + date + '.j'
    #file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Click_Logs/PPC_Click_Logs/' + date + '/excitedigitalmedia_feed_raw_click_logs_' + source_id + '_' + date + '.j'
    if not os.path.exists(file_name):
        if not os.path.exists('/home/ec2-user/DB_logs/' + date + '/'):
            os.makedirs('/home/ec2-user/DB_logs/' + date + '/')
        full_url = url + date_params + sid_param + hour_param + str(x)
        command = 'curl \'' + full_url + '\' --compressed > ' + file_name
        print("Command to be executed:\n%s" % command)
        os.system(command)
        
    #parse click log
    open_file = open(file_name,'rb')

    for row in open_file:
        print("ROW: %s" %row)
        row = row.replace('\\','')
        try:
            row = unicode(row,'utf-8')
        except:
            traceback.print_exc()
            row = row.decode('utf-8','ignore')
        try:
            json_row = json.loads(row,encoding='utf-8')
            pid = str(json_row['pid'])
            kw = str(json_row['keyword'])
            subid = str(json_row['subid'])
            fid = str(json_row['fid'])
            ip = str(json_row['ip_addr'])
            country = str(json_row['country'])
            ua = str(json_row['user_agent'])
            ref = str(json_row['ref_url'])
            ref_parse = urlparse(ref)
            if ref=='':
                ref = ''
            else:
                ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
	    gross_bid = str(json_row['gross_bid'])
            net_bid = str(json_row['bid'])
            disp_url = str(json_row['display_url'])
            search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
            search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
            click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
            click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
            new_row = [date,source_id,pid,sourceName,pubName,subid,kw,fid,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
            data.append(new_row)
        except UnicodeDecodeError:
            json_row = json.loads(row,encoding='latin-1')
            pid = str(json_row['pid'])
            kw = str(json_row['keyword'])
            subid = str(json_row['subid'])
            fid = str(json_row['fid'])
            ip = str(json_row['ip_addr'])
            country = str(json_row['country'])
            ua = str(json_row['user_agent'])
            ref = str(json_row['ref_url'])
            ref_parse = urlparse(ref)
            if ref=='':
                ref = ''
            else:
                ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
	    gross_bid = str(json_row['gross_bid'])
            net_bid = str(json_row['bid'])
            disp_url = str(json_row['display_url'])
            search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
            search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
            click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
            click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
            new_row = [date,source_id,pid,sourceName,pubName,subid,kw,fid,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
            data.append(new_row)
        except:
            try:
                row = filter(string.printable.__contains__, row)
                #row = strip_control_characters(row)
                json_row = json.loads(row,encoding='latin-1')
                pid = str(json_row['pid'])
                kw = str(json_row['keyword'])
                subid = str(json_row['subid'])
                fid = str(json_row['fid'])
                ip = str(json_row['ip_addr'])
                country = str(json_row['country'])
                ua = str(json_row['user_agent'])
                ref = str(json_row['ref_url'])
                ref_parse = urlparse(ref)
                if ref=='':
                    ref = ''
                else:
                    ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
	        gross_bid = str(json_row['gross_bid'])
                net_bid = str(json_row['bid'])
                disp_url = str(json_row['display_url'])
                search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
                search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
                click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
                click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
                new_row = [date,source_id,pid,sourceName,pubName,subid,kw,fid,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
                data.append(new_row)
            except:
                try:
                    row = row.replace('\\','')
                    row = removeNonAscii(row).replace("X\"MT","").replace("X\"","")
                    json_row = json.loads(row,encoding='latin-1')
                    pid = str(json_row['pid'])
                    kw = str(json_row['keyword'])
                    subid = str(json_row['subid'])
                    fid = str(json_row['fid'])
                    ip = str(json_row['ip_addr'])
                    country = str(json_row['country'])
                    ua = str(json_row['user_agent'])
                    ref = str(json_row['ref_url'])
	            ref_parse = urlparse(ref)
        	    if ref=='':
                	ref = ''
	            else:
        	        ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
		    gross_bid = str(json_row['gross_bid'])
                    net_bid = str(json_row['bid'])
                    disp_url = str(json_row['display_url'])
                    search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
                    search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
                    click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
                    click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
                    new_row = [date,source_id,pid,sourceName,pubName,subid,kw,fid,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time]
                    data.append(new_row)
                except:
                    traceback.print_exc()
                    count = count +1 
                    continue
    #grouped_data = groupdata(data)

    #UPLOAD DATA
    upload_data(data,'raw',date,source_id,pubID)
    return(count)

Exemple #6

0

Afficher le fichier

def download_parse_raw_logs(date, camp_name, camp_id):
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=campaign&click_type=raw'
    date_params = '&date=' + date
    camp_id_param = '&id=' + camp_id
    data = []

    file_name = '/home/ec2-user/DB_logs/Campaign_logs/' + date + '/' + 'excitedigitalmedia_campaign_raw_click_logs_' + camp_id + '_' + date + '.j'
    #file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Campaign_Stats/PPC_Campaign_Stats/' + date + '/excitedigitalmedia_campaign_' + type + '_click_logs_' + camp_id + '_' + date + '.j'

    if not os.path.exists(file_name):
        if not os.path.exists('/home/ec2-user/DB_logs/Campaign_logs/' + date +
                              '/'):
            os.makedirs('/home/ec2-user/DB_logs/Campaign_logs/' + date + '/')
        full_url = url + date_params + camp_id_param
        command = 'curl \'' + full_url + '\' --compressed > ' + file_name
        print("Command to be executed:\n%s" % command)
        os.system(command)

    #check if log is populated
    open_file = open(file_name, 'rb')
    while 'Please check back shortly' in open_file.read():
        open_file.close()
        download_log(date, camp_id, 'raw')
        open_file = open(file_name, 'rb')

    open_file = open(file_name, 'rb')
    count = 0
    for row in open_file:
        #Check if file is fully downloaded or contains error message that it is queued
        print("ROW: %s" % row)
        row = row.replace('\\', '')
        try:
            row = unicode(row, 'utf-8')
        except:
            traceback.print_exc()
            row = row.decode('utf-8', 'ignore')
        try:
            json_row = json.loads(row, encoding='utf-8')
            pid = str(json_row['pid'])
            uuid = str(json_row['uuid'])
            sid = str(json_row['sid'])
            query = (json_row['keyword']).encode('utf-8')
            kw = str(json_row['search_keyword'])
            subid = str(json_row['subid'])
            cid = str(json_row['cid'])
            adv_id = str(json_row['aid'])
            ip = str(json_row['ip_addr'])
            country = str(json_row['country'])
            ua = str(json_row['user_agent'])
            ref = str(json_row['ref_url'])
            ref_parse = urlparse(ref)
            if ref == '':
                ref = ''
            else:
                ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
            gross_bid = str(json_row['gross_bid'])
            net_bid = str(json_row['bid'])
            disp_url = str(json_row['display_url'])
            search_time = datetime.datetime.fromtimestamp(
                int(json_row['search_time']))
            search_time = search_time.strftime('%Y-%m-%d %H:%M:%S')
            click_time = datetime.datetime.fromtimestamp(
                int(json_row['click_time']))
            click_time = click_time.strftime('%Y-%m-%d %H:%M:%S')
            new_row = [
                date, sid, pid, cid, subid, kw, query, adv_id, ip, country, ua,
                ref, gross_bid, net_bid, disp_url, click_time, search_time,
                uuid, camp_name
            ]
            #new_row = [date,camp_id,camp_name,kw,query,ref]
            data.append(new_row)
        except:
            traceback.print_exc()
            count = count + 1
            continue

    print("%s ERRORS" % count)
    ##write report
    #file = open("Adlux_Campaign_Raw_Click_Log_" + camp_name + "_" + date + ".csv","wb")
    #wr = csv.writer(file)
    #header = ["date","Campaign ID","Campaign Name","keyword","query_term","referrer"]
    #wr.writerow(header)
    #print("About to write %s rows to the file" %len(data))
    #wr.writerows(data)

    upload_data(data, 'raw', date, camp_id)
    print("Remove daily click log")
    os.remove(file_name)

Exemple #7

0

Afficher le fichier

Fichier : download_module.py Projet : derak4210/EDM_Reporting_Scripts

def download_parse_raw_logs(date,camp_name,camp_id):
    url = 'http://login.db.excitedigitalmedia.com/parse_raw_data.php?auth=db73407306496d474232319f175bdf0bfd2ee360&request=campaign&click_type=raw'
    date_params = '&date=' + date
    camp_id_param = '&id=' + camp_id
    data = []
    
    file_name = '/home/ec2-user/DB_logs/Campaign_logs/' + date + '/' + 'excitedigitalmedia_campaign_raw_click_logs_' + camp_id + '_' + date + '.j'
    #file_name = 'C:/Users/Damir/SkyDrive/Visual Studio Projects/PPC_Campaign_Stats/PPC_Campaign_Stats/' + date + '/excitedigitalmedia_campaign_' + type + '_click_logs_' + camp_id + '_' + date + '.j'

    if not os.path.exists(file_name):
        if not os.path.exists('/home/ec2-user/DB_logs/Campaign_logs/' + date + '/'):
            os.makedirs('/home/ec2-user/DB_logs/Campaign_logs/' + date + '/')
        full_url = url + date_params + camp_id_param
        command = 'curl \'' + full_url + '\' --compressed > ' + file_name
        print("Command to be executed:\n%s" % command)
        os.system(command)

    #check if log is populated
    open_file = open(file_name,'rb')
    while 'Please check back shortly' in open_file.read():
        open_file.close()
        download_log(date,camp_id,'raw')
        open_file = open(file_name,'rb')
    
    open_file = open(file_name,'rb')
    count = 0
    for row in open_file:
        #Check if file is fully downloaded or contains error message that it is queued
        print("ROW: %s" %row)
        row = row.replace('\\','')
        try:
            row = unicode(row,'utf-8')
        except:
            traceback.print_exc()
            row = row.decode('utf-8','ignore')
        try:
            json_row = json.loads(row,encoding='utf-8')
            pid = str(json_row['pid'])
            uuid = str(json_row['uuid'])
            sid = str(json_row['sid'])
            query = (json_row['keyword']).encode('utf-8')
            kw = str(json_row['search_keyword'])
            subid = str(json_row['subid'])
            cid = str(json_row['cid'])
            adv_id = str(json_row['aid'])
            ip = str(json_row['ip_addr'])
            country = str(json_row['country'])
            ua = str(json_row['user_agent'])
            ref = str(json_row['ref_url'])
            ref_parse = urlparse(ref)
            if ref=='':
                ref = ''
            else:
                ref = '{uri.scheme}://{uri.netloc}/'.format(uri=ref_parse)
	    gross_bid = str(json_row['gross_bid'])
            net_bid = str(json_row['bid'])
            disp_url = str(json_row['display_url'])
            search_time = datetime.datetime.fromtimestamp(int(json_row['search_time']))   
            search_time =  search_time.strftime('%Y-%m-%d %H:%M:%S')                                                  
            click_time = datetime.datetime.fromtimestamp(int(json_row['click_time']))
            click_time =  click_time.strftime('%Y-%m-%d %H:%M:%S')
            new_row = [date,sid,pid,cid,subid,kw,query,adv_id,ip,country,ua,ref,gross_bid,net_bid, disp_url,click_time,search_time,uuid,camp_name]
            #new_row = [date,camp_id,camp_name,kw,query,ref]
            data.append(new_row)
        except:
            traceback.print_exc()
            count = count +1
            continue


    print("%s ERRORS"%count)
    ##write report
    #file = open("Adlux_Campaign_Raw_Click_Log_" + camp_name + "_" + date + ".csv","wb")
    #wr = csv.writer(file)
    #header = ["date","Campaign ID","Campaign Name","keyword","query_term","referrer"]
    #wr.writerow(header)
    #print("About to write %s rows to the file" %len(data))
    #wr.writerows(data)

    upload_data(data,'raw',date,camp_id)
    print("Remove daily click log")
    os.remove(file_name)