@author: ONIWALDUS """ #%% Soal 1 import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd pd = pd.read_csv("csv_oni.csv") #membaca file csv #%% Soal 2 d_train = pd[:450] #membagi data training menjadi 450 d_test = pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia #%% Soal 3 import pandas as oni #untuk import library pandas berguna untuk mengelola dataframe oni = oni.read_csv("Youtube03-LMFAO.csv") #membaca file dengan format csv spam = oni.query('CLASS == 1') #membagi tabel spam nospam = oni.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( oni['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = oni.sample(frac=1)
"D:/LEC/IT SMT VI/ARTIFICIAL INTELLIGENCE/Chapter 4/src/csv_izza.csv" ) #membaca file csv #%% Soal 2 d_train = pd[:450] #membagi data training menjadi 450 d_test = pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia #%% Soal 3 import pandas as izza #untuk import library pandas berguna untuk mengelola dataframe izza = izza.read_csv( "D:/LEC/IT SMT VI/ARTIFICIAL INTELLIGENCE/Chapter 4/src/Youtube03-LMFAO.csv" ) #membaca file dengan format csv spam = izza.query('CLASS == 1') #membagi tabel spam nospam = izza.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( izza['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = izza.sample(frac=1)
#%% Soal 2 d_train = pd[:450] #untuk membagi data training menjadi 450 d_test = pd[450:] #untuk membagi data menjadi 50 atau sisa dari data yang tersedia #%% Soal 3 import pandas as gani #untuk import library pandas berguna untuk mengelola dataframe gani = gani.read_csv( "C:/Users/muham/Downloads/Compressed/KB3C-master/KB3C-master/src/1174071/4/Youtube03-Shakira.csv" ) #untukmembaca file dengan format csv spam = gani.query('CLASS == 1') #untuk membagi tabel spam nospam = gani.query('CLASS == 0') #untuk membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer() #menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(gani['CONTENT']) #melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names()
@author: FannyShafira """ #%% Soal 1 import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd pd = pd.read_csv("F://Semester 6/Artificial Intelligence/Tugas 4/src/csv_fanny.csv") #membaca file csv #%% Soal 2 d_train=pd[:450] #membagi data training menjadi 450 d_test=pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia #%% Soal 3 import pandas as fanny #untuk import library pandas berguna untuk mengelola dataframe fanny = fanny.read_csv("F://Semester 6/Artificial Intelligence/Tugas 4/src/Youtube03-LMFAO.csv") #membaca file dengan format csv spam=fanny.query('CLASS == 1') #membagi tabel spam nospam=fanny.query('CLASS == 0')#membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(fanny['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata= vectorizer.get_feature_names() dshuf = fanny.sample(frac=1) d_train=dshuf[:300] d_test=dshuf[300:]
@author: Ainul """ #%% Soal 1 import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd pd = pd.read_csv("csv_ainul.csv") #membaca file csv #%% Soal 2 d_train=pd[:450] #membagi data training menjadi 450 d_test=pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia #%% Soal 3 import pandas as ainul #untuk import library pandas berguna untuk mengelola dataframe ainul = ainul.read_csv("Youtube03-LMFAO.csv") #membaca file dengan format csv spam=ainul.query('CLASS == 1') #membagi tabel spam nospam=ainul.query('CLASS == 0')#membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform(ainul['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata= vectorizer.get_feature_names() dshuf = ainul.sample(frac=1) d_train=dshuf[:300] d_test=dshuf[300:]
@author: Handi """ #%% Soal 1 import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd pd = pd.read_csv("csv.csv") #membaca file csv #%% Soal 2 love = pd[:450] #membagi data training menjadi 450 fixs = pd[450:] #membagi data menjadi 450 atau sisa dari data yang tersedia #%% Soal 3 import pandas as hans #untuk import library pandas berguna untuk mengelola dataframe hans = hans.read_csv("Youtube03-LMFAO.csv") #membaca file dengan format csv spam = hans.query('CLASS == 1') #membagi tabel spam nospam = hans.query('CLASS == 0') #membagi tabel no spam from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana vectorizer = CountVectorizer( ) #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi. dvec = vectorizer.fit_transform( hans['CONTENT'] ) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten dvec #Untuk menampilkan hasil dari code sebelumnya Daptarkata = vectorizer.get_feature_names() dshuf = hans.sample(frac=1)