Opis | Big Data |
Trajanje | 5 dana |
Predznanje | poznavanje pythona, alogritama |
Tko treba slušati | - |
SADRŽAJ:
Finding Similar Items (SimHash, MinHash,LSH (Locality Sensitive Hashing), Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini (Spark, Hadoop)),Finding Frequent sets (Apriori, PCY,SON, primjeri implementacije u pythonu, Recommender Systems (Content-based Recommendation,, Collaborative Filtering, Matrix Factorization,Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini (Spark, Hadoop)), Alternativa – Stream Analysis (Sliding windows, Bloom Filter,Flajolet-Martin, Alon-Matias-Szegedy, Datar-Gionis-Indyk-Motwani,Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini, Mining Large graphs (Link Analysis, Community Detection, Clustering,), Dimensionality Recuction, Principal component Analysis, Singular Value Decomposition, CUR Decomposition (Primjeri implementacije u pythonu i nekoj raspodijelčjenoj okolini (Spark, Hadoop).