Важные вещи в изучении статистики. На первом этапе мы должны понять основы математики для статистики на примере среднего, медианы, режима, в этой статье будет объяснено, что будет реализовано в алгоритме Python. Таким образом, объяснение в статье очень простое для людей, которые хотят знать среднее значение, медиану и моду с помощью алгоритма Python.
Среднее
пример значения 7, 8, 9, 10
формула среднего
Средний ручной расчет, как указано выше, теперь перейдите к реализации pyhton.
def findMean(a): # count range of array as n n = len(a) # initialize sum with 0 sum = 0 # loop in range of array for i in range( 0, n): sum += a[i] # result variable hold float value result = float(sum/n) # return result return result # array a = [ 7, 8, 9, 10 ] # display result of mean print("Mean =", findMean(a))
Медиана
Значение, отделяющее верхнюю половину от нижней половины выборки данных, легко воспринимаемое как среднее значение.
17 частей числа, среднее значение равно 19, если разделить на 2 части, средняя последовательность будет равна 9, содержащим число 19.
Если медиана имеет четное число, вы должны добавить значение 2 и разделить их следующим образом ((19 + 21)/2) = 20
Вычисление медианы вручную, как указано выше, теперь перейдите к реализации pyhton.
def findMedian(a): # First we sort the array sorted(a) # count range of array as n n = len(a) # check for even case if (n % 2 != 0): median_even = float(a[n/2]) return median_even elif (n % 2 == 0): median_odd = float((a[int((n-1)/2)] + a[int(n/2)])/2.0) return median_odd else: return "its not array" a = [ 9, 10, 10, 11, 13, 15, 16, 19, 19, 21, 23, 28, 30, 33, 34, 36, 44 ] b = [10, 10, 11, 13, 15, 16, 19, 19, 21, 23, 28, 30, 33, 34, 36, 44] print("Median Even Value=", findMedian(a)) print("Median Odd Value=", findMedian(b))
Режим
наиболее часто встречающееся значение в python. Я использовал статистику библиотеки из библиотеки python по умолчанию.
значение 1, 2, 3, 3, 4, 4, 4, 5, 5, 6
import statistics # declaring a simple data-set consisting of real valued # positive integers. set1 =[1, 2, 3, 3, 4, 4, 4, 5, 5, 6] # In the given data-set # Count of 1 is 1 # Count of 2 is 1 # Count of 3 is 2 # Count of 4 is 3 # Count of 5 is 2 # Count of 6 is 1 # We can infer that 4 has the highest population distribution # So mode of set1 is 4 # Printing out mode of given data-set print("Mode of given data set is % s" % (statistics.mode(set1)))
ссылка
https://www.udemy.com/datascience/
https://id.wikipedia.org/wiki/Median