Beispiel #1
0
@author: ONIWALDUS
"""

#%% Soal 1
import pandas as pd  #digunakan untuk mengimport library pandas dengan alias pd
pd = pd.read_csv("csv_oni.csv")  #membaca file csv

#%% Soal 2
d_train = pd[:450]  #membagi data training menjadi 450
d_test = pd[450:]  #membagi data menjadi 50 atau sisa dari data yang tersedia

#%% Soal 3
import pandas as oni  #untuk import library pandas berguna untuk mengelola dataframe
oni = oni.read_csv("Youtube03-LMFAO.csv")  #membaca file dengan format csv

spam = oni.query('CLASS == 1')  #membagi tabel spam
nospam = oni.query('CLASS == 0')  #membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer  #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer(
)  #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(
    oni['CONTENT']
)  #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec  #Untuk menampilkan hasil dari code sebelumnya

Daptarkata = vectorizer.get_feature_names()

dshuf = oni.sample(frac=1)
Beispiel #2
0
    "D:/LEC/IT SMT VI/ARTIFICIAL INTELLIGENCE/Chapter 4/src/csv_izza.csv"
)  #membaca file csv

#%% Soal 2

d_train = pd[:450]  #membagi data training menjadi 450
d_test = pd[450:]  #membagi data menjadi 50 atau sisa dari data yang tersedia

#%% Soal 3

import pandas as izza  #untuk import library pandas berguna untuk mengelola dataframe
izza = izza.read_csv(
    "D:/LEC/IT SMT VI/ARTIFICIAL INTELLIGENCE/Chapter 4/src/Youtube03-LMFAO.csv"
)  #membaca file dengan format csv

spam = izza.query('CLASS == 1')  #membagi tabel spam
nospam = izza.query('CLASS == 0')  #membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer  #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer(
)  #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(
    izza['CONTENT']
)  #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec  #Untuk menampilkan hasil dari code sebelumnya

Daptarkata = vectorizer.get_feature_names()

dshuf = izza.sample(frac=1)
Beispiel #3
0
#%% Soal 2
d_train = pd[:450]
#untuk membagi data training menjadi 450
d_test = pd[450:]
#untuk membagi data menjadi 50 atau sisa dari data yang tersedia

#%% Soal 3
import pandas as gani
#untuk import library pandas berguna untuk mengelola dataframe
gani = gani.read_csv(
    "C:/Users/muham/Downloads/Compressed/KB3C-master/KB3C-master/src/1174071/4/Youtube03-Shakira.csv"
)
#untukmembaca file dengan format csv

spam = gani.query('CLASS == 1')
#untuk membagi tabel spam
nospam = gani.query('CLASS == 0')
#untuk membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer
#import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer()
#menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(gani['CONTENT'])
#melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec  #menampilkan hasil dari code sebelumnya

Daptarkata = vectorizer.get_feature_names()
Beispiel #4
0
@author: FannyShafira
"""

#%% Soal 1
import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd
pd = pd.read_csv("F://Semester 6/Artificial Intelligence/Tugas 4/src/csv_fanny.csv") #membaca file csv 

#%% Soal 2
d_train=pd[:450] #membagi data training menjadi 450
d_test=pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia

#%% Soal 3
import pandas as fanny #untuk import library pandas berguna untuk mengelola dataframe
fanny = fanny.read_csv("F://Semester 6/Artificial Intelligence/Tugas 4/src/Youtube03-LMFAO.csv") #membaca file dengan format csv

spam=fanny.query('CLASS == 1') #membagi tabel spam
nospam=fanny.query('CLASS == 0')#membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(fanny['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec #Untuk menampilkan hasil dari code sebelumnya

Daptarkata= vectorizer.get_feature_names()

dshuf = fanny.sample(frac=1)

d_train=dshuf[:300]
d_test=dshuf[300:]
Beispiel #5
0
@author: Ainul
"""

#%% Soal 1
import pandas as pd #digunakan untuk mengimport library pandas dengan alias pd
pd = pd.read_csv("csv_ainul.csv") #membaca file csv 

#%% Soal 2
d_train=pd[:450] #membagi data training menjadi 450
d_test=pd[450:] #membagi data menjadi 50 atau sisa dari data yang tersedia

#%% Soal 3
import pandas as ainul #untuk import library pandas berguna untuk mengelola dataframe
ainul = ainul.read_csv("Youtube03-LMFAO.csv") #membaca file dengan format csv

spam=ainul.query('CLASS == 1') #membagi tabel spam
nospam=ainul.query('CLASS == 0')#membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer () #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(ainul['CONTENT']) #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec #Untuk menampilkan hasil dari code sebelumnya

Daptarkata= vectorizer.get_feature_names()

dshuf = ainul.sample(frac=1)

d_train=dshuf[:300]
d_test=dshuf[300:]
Beispiel #6
0
@author: Handi
"""

#%% Soal 1
import pandas as pd  #digunakan untuk mengimport library pandas dengan alias pd
pd = pd.read_csv("csv.csv")  #membaca file csv

#%% Soal 2
love = pd[:450]  #membagi data training menjadi 450
fixs = pd[450:]  #membagi data menjadi 450 atau sisa dari data yang tersedia

#%% Soal 3
import pandas as hans  #untuk import library pandas berguna untuk mengelola dataframe
hans = hans.read_csv("Youtube03-LMFAO.csv")  #membaca file dengan format csv

spam = hans.query('CLASS == 1')  #membagi tabel spam
nospam = hans.query('CLASS == 0')  #membagi tabel no spam

from sklearn.feature_extraction.text import CountVectorizer  #untuk import countvectorizer berfungsi untuk memecah data tersebut menjadi sebuah kata yang lebih sederhana
vectorizer = CountVectorizer(
)  #ntuk menjalankan fungsi tersebut, pada code ini tidak ada hasilnya dikarenakan spyder tidak mendukung hasil dari instasiasi.

dvec = vectorizer.fit_transform(
    hans['CONTENT']
)  #untuk melakukan pemecahan data pada dataframe yang terdapat pada kolom konten
dvec  #Untuk menampilkan hasil dari code sebelumnya

Daptarkata = vectorizer.get_feature_names()

dshuf = hans.sample(frac=1)