Nauka programowania w SAS i R vs Java?

Ile trwa mniej więcej nauka programowania w tych językach? Trudne do nauczenia? Opłaca się ich uczyć? w UK jest sporo ofert pracy pod to i z niezłymi zarobkami, u nas mniej i nie wiem z jakimi zarobami(może ktoś wie?) dlatego mam wątpliwości… Wiem, że zawód jaki można wykonywać ze znajomością tych języków w UK to “Data Scientist”, a u nas Analityk/Architekt/Programista Baz Danych.

By być Data Scientist, trzeba jeszcze ogarniać hardą matmę, a nie tylko kodzić umieć.

Tak jak enedil napisał, aby zostać ‘Data Scientist’ to nie wystarczy tylko umiejętność programowania ale jest pomocna i, w wielu przypadkach, niezbędna. Programy to tylko narzędzia. Do wyłuskania wiedzy z danych potrzebne są na każdym poziomie. Od planowania eksperymentu, poprzez zbieranie danych, przetważanie (przekodowanie, wzbogadzanie, standaryzacja), opisywanie, modelowanie i interpretację. Najważniejsza jest wiedza jak użyć tych programów do każdego z tych zadań.

Nauczyć się pisać programy w języku takim jak SAS 4GL czy R jest w miarę łatwo i szybko. Oba kojarzone są ze statystyką, analityką i ogólnie pojętym przetważaniem danych.

Jako że R jest projektem opensource i wyrosło wokół niego bardzo duże grono sympatykó to jest do niego cała masa darmowych kursów i książek. Wystarczy pogooglać.

Z SAS 4GL nie jest aż tak różowo ale też nie najgorzej. Do pisania programów została udostępniona darmowa wersja SASa o nazwie SAS University Edition. Jeśli chodzi o zasoby do nauki to też nie jest tragicznie. SAS udostępnia dwa darmowe szkolenia w trybie e-learning: Podstaw programowani w SAS 4GL i Statystyka. A darmowe kursy stworznone przez społeczność też się znajdą.

Porównywanie który lepszy nie ma sensu. Oba są bardzo dobre ale każdy ma swoje wady i zalety. Osobiście znam oba i polecam uczyć się obu ponieważ daje to większe możliwości na rynku pracy.

W SAS organizowane są często dni otwarte takie jak ten. Można wpaść, zapoznać się z oprogramowaniem i czym zajmuje się firma.

 

OK, dzięki splpif. Zastanawiam się czego warto się uczyć… SAS i R czy Java? Pod względem rynku pracy i frajdy z programowania? Pyta przyszła studentka Informatyki i Ekonometrii.

Samochód wyścigowy czy traktor, co lepiej kupić? :wink: Odpowiedź zależy od tego w co chcesz później iść. Bolidem nie zaorasz pola, a traktorem się nie pościgasz. Moim zdaniem warto spróbować jednego i drugiego, wyrobić sobie własne zdanie i stwierdzić które bardziej nas kręci :) 

Jeśli chcesz przerabiać dane typu Big Data, to raczej tylko Java (i potem Hadoop, Mahout, Spark i inne cuda-wianki). Problem w R jest taki, że np. podstawowy typ danych (czyli wektor) ma taką nieprzyjemną własność, że maksymalny jego rozmiar użyteczny to może być około 10-20% RAM (czyli że jeśli wektor zajmuje już cały RAM, to jego użyteczna pojemność to jakieś 10-20% tego RAM). A w Javie takich ograniczeń nie ma. Poza tym w R spotkałem się z tym, że jeśli przetwarzasz dane w wielkim wektorze, który ma np. 3-5 kolumn, to jest OK. Ale jak tego samego rozmiaru wektor  ma np. kilkadziesiąt kolumn, to czasem przetwarzanie jest bardzo wolne.

Ograniczenia R są powoli przezwyciężane za pomocą słynnych, licznych pakietów, ale na dzień dzisiejszy polecam R do typowych badań statystycznych lub fazy modelowania procesu Big Data. Natomiast do ciężkich robót Big Data (jak już wiadomo co do natury danych przetwarzanych i wiadomo to np. po eksperymentach w R) - tylko Java.