def _shuffle_tfs(pd): # Shuffle columns (TFs) in the priors_data utils.Debug.vprint( "Randomly shuffling prior [{sh}] TF data".format(sh=pd.shape), level=0) prior_index = pd.columns.tolist() pd = pd.sample(frac=1, axis=1, random_state=random_seed) pd.columns = prior_index return pd
def _shuffle_genes(pd): # Shuffle index (genes) in the priors_data utils.Debug.vprint( "Randomly shuffling prior [{sh}] gene data".format( sh=pd.shape), level=0) prior_index = pd.index.tolist() pd = pd.sample(frac=1, axis=0, random_state=random_seed) pd.index = prior_index return pd
spam = oni.query('CLASS == 1') #membagi tabel spam nospam = oni.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( oni['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = oni.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(d_train_att, d_train_label)
spam = izza.query('CLASS == 1') #membagi tabel spam nospam = izza.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( izza['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = izza.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(d_train_att, d_train_label)
spam = ps.query('CLASS == 1') #membagi tabel spam nospam = ps.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( ps['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = ps.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(d_train_att, d_train_label)
spam = fahmi.query('CLASS == 1') #membagi tabel spam nospam = fahmi.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( fahmi['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = fahmi.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(d_train_att, d_train_label)
#untuk membagi tabel spam nospam = gani.query('CLASS == 0') #untuk membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer() #menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(gani['CONTENT']) #melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = gani.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto')
spam = izal.query('CLASS == 1') #membagi tabel spam nospam = izal.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( izal['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = izal.sample(frac=1) d_train = dshuf[:300] d_test = dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label = d_train['CLASS'] d_test_label = d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(d_train_att, d_train_label)
#%% Soal 3 import pandas as fanny #untuk import library pandas berguna untuk mengelola dataframe fanny = fanny.read_csv("F://Semester 6/Artificial Intelligence/Tugas 4/src/Youtube03-LMFAO.csv") #membaca file dengan format csv spam=fanny.query('CLASS == 1') #membagi tabel spam nospam=fanny.query('CLASS == 0')#membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(fanny['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata= vectorizer.get_feature_names() dshuf = fanny.sample(frac=1) d_train=dshuf[:300] d_test=dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label=d_train['CLASS'] d_test_label=d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma = 'auto') clfsvm.fit(d_train_att, d_train_label)
#%% Soal 3 import pandas as ainul #untuk import library pandas berguna untuk mengelola dataframe ainul = ainul.read_csv("Youtube03-LMFAO.csv") #membaca file dengan format csv spam=ainul.query('CLASS == 1') #membagi tabel spam nospam=ainul.query('CLASS == 0')#membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(ainul['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata= vectorizer.get_feature_names() dshuf = ainul.sample(frac=1) d_train=dshuf[:300] d_test=dshuf[300:] d_train_att = vectorizer.fit_transform(d_train['CONTENT']) d_train_att d_train_label=d_train['CLASS'] d_test_label=d_test['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma = 'auto') clfsvm.fit(d_train_att, d_train_label)
spam = hans.query('CLASS == 1') #membagi tabel spam nospam = hans.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( hans['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = hans.sample(frac=1) love = dshuf[:300] fixs = dshuf[300:] love_att = vectorizer.fit_transform(love['CONTENT']) love_att love_label = love['CLASS'] fixs_label = fixs['CLASS'] #%% Soal 4 from sklearn import svm clfsvm = svm.SVR(gamma='auto') clfsvm.fit(love_att, love_label)