مثال 1:
دستور زیر نحوه محاسبه میانگین را برای 100 داده تصادفی از توزیع نرمال استاندارد نشان می دهد.
set.seed(10)
x <- rnorm(100)
mean(x)
#output
[1] -0.1365489
mean(x, na.rm = T)
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)
mean(x,na.rm = TRUE)
[1] 8.22
#output
[1] 8.22
میانگین پیراسته در R
از اگر بخواهیم از اول و آخر داده ها، داده های ناقص پرت رو حذف کنیم و میانگین بگیریم، از میانگین پیراسته استفاده می کنیم.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
mean(x,trim = 0.3)
[1] 5.55
#output
[1] 5.55
میانگین وزنی
# Sample vector
z <- c(5, 7, 8)
# Weights (should sum up to 1)
wts <- c(0.2, 0.2, 0.6)
# Weighted mean
weighted.mean(z, w = wts) # 7.2
میانگین هندسی
# Sample vector
w <- c(10, 20, 15, 40)
# Geometric mean
exp(mean(log(w))) #18.6121
# Alternative (which includes the na.rm argument)
# install.packages("psych")
library(psych)
geometric.mean(w) #18.6121
میانه در R
میانه نقطه وسط در توزیع نمرات است.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
median(x)
[1] 5.6
مد در R
در R برای مد تابع خاصی وجود ندارد، بخاطر همین ما باید خودمون تابع تعریف کنیم.
# vector of marks
marks <- c(97, 78, 57,78, 97, 66, 87, 64, 87, 78)
# define mode() function
mode = function() {
# calculate mode of marks
return(names(sort(-table(marks)))[1])
}
# call mode() function
mode()
#output
[1] "78"
منبع
https://blog.faradars.org/anomaly-detection-using-r/
دوره های آموزشی ما برای کنکور ارشد و دکتری رشته های روانشناسی، مشاوره، علوم تربیتی، پرستاری, مدیریت آموزشی و علوم شناختی کاربرد دارد.