Projekt R - Wprowadzenie
R-project to samodzielna aplikacja i środowisko programistyczne obsługujące język statystyczny R. R to język programowania ogólnego przeznaczenia i bezpłatne, licencjonowane przez BSD środowisko programowe do wizualnego tworzenia podstawowych aplikacji i obliczeń statystycznych. Jest szeroko stosowany przez eksploratorów danych i badaczy statystycznych do opracowywania dynamicznej analizy danych i aplikacji statystycznych. Pakiety statystyczne używane przez R pomagają w analizowaniu dużych zestawów danych za pomocą kilku metod statystycznych i obliczeniowych.
R to bezpłatna aplikacja, którą można pobrać z Internetu w celu pobrania wymaganych komponentów i uruchomienia oprogramowania do obliczeń statystycznych. Głównymi zaletami oprogramowania R-project w porównaniu z innymi bezpłatnymi pakietami do obliczeń statystycznych jest to, że można je uruchomić na wszystkich głównych systemach operacyjnych, posiada dużą bazę danych obejmującą prawie wszystkie obszary obliczeń statystycznych, jest wieloplatformowy z wieloma dostępne opcje implementacji, może obsługiwać analizę danych w czasie rzeczywistym, a nawet implementować czas do algorytmów statystycznych. Kolejną zaletą R-project w porównaniu z innymi podobnymi pakietami bezpłatnego oprogramowania jest jego szybkość i najszybsza wydajność spośród wszystkich pakietów do obliczeń statystycznych. Jest to oprogramowanie typu open source, więc może być z łatwością używane przez osoby z różnych środowisk bez wcześniejszego doświadczenia w programowaniu. Jest napisany w języku wysokiego poziomu (R), który ułatwia manipulowanie i rozszerzanie.
Pakiet R może być używany do analizowania, manipulowania i prognozowania rynków finansowych. Aby analizować i wizualizować zestawy danych, musisz mieć pewną wiedzę na temat statystyk, takich jak prawdopodobieństwo, funkcja przedziału, tempo wzrostu słojów, wartość średnia, zestaw danych odchyleń, oszacowanie maksymalnego prawdopodobieństwa, wartość t, wartość chi-kwadrat, niezależność i testy istotności . Musisz także mieć pewną wiedzę z algebry liniowej i dobre umiejętności matematyczne. Najlepszym podejściem do wnioskowania statystycznego jest użycie pakietów R lattice i lasso. Pakiety Lasso i lattice zapewniają potężną metodę regresji logistycznej, drzew decyzyjnych i sieci neuronowych dla danych wielowymiarowych.