pySpark pavyzdžiai

Pastaba: pasidaryti repozitorijos Fork'ą. Tuomet vietoje daraliu/p160m132-examples-spark repozitorijos pavadinimas taps studentoBitbucketVartotojoVardas/p160m132-examples-spark. Tuomet ją reikėtų klonuoti į savo Ubuntu Linux virtualią mašiną, pvz. /home/vagrant/labs direktoriją.

examples_datafiles.ipynb

.xls, .xlsx, .sas7bdat formato failų skaitymas ir konvertavimas į .csv formato failus naudojant Python.
.csv formato failų skaitymas ir rašymas naudojant Apache Spark.

examples_kmeans.ipynb

K-vidurkių modelio apmokymas panaudojant pyspark.mllib.clustering.KMeans ir pyspark.clustering.KMeansModel.
K-vidurkių modelio apmokymas panaudojant pyspark.ml.clustering.KMeans ir naudojant pyspark.ml.pipeline.Pipeline bei kitus pyspark.ml komponentus.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
data		data
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
examples_datafiles.html		examples_datafiles.html
examples_datafiles.ipynb		examples_datafiles.ipynb
examples_datafiles.py		examples_datafiles.py
examples_gmm.ipynb		examples_gmm.ipynb
examples_kmeans.html		examples_kmeans.html
examples_kmeans.ipynb		examples_kmeans.ipynb
examples_kmeans.py		examples_kmeans.py
examples_sparksql.ipynb		examples_sparksql.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data

data

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

examples_datafiles.html

examples_datafiles.html

examples_datafiles.ipynb

examples_datafiles.ipynb

examples_datafiles.py

examples_datafiles.py

examples_gmm.ipynb

examples_gmm.ipynb

examples_kmeans.html

examples_kmeans.html

examples_kmeans.ipynb

examples_kmeans.ipynb

examples_kmeans.py

examples_kmeans.py

examples_sparksql.ipynb

examples_sparksql.ipynb

Repository files navigation

pySpark pavyzdžiai

examples_datafiles.ipynb

examples_kmeans.ipynb

About

Releases

Packages

Languages

License

AndriusDap/p160m132-examples-spark

Folders and files

Latest commit

History

Repository files navigation

pySpark pavyzdžiai

examples_datafiles.ipynb

examples_kmeans.ipynb

About

Resources

License

Stars

Watchers

Forks

Languages