Медіана — це статистичний показник, який позначає значення, що розташоване посередині впорядкованого числового ряду: половина даних є меншою або рівною за медіану, а інша половина — більшою або рівною їй. Якщо елементів непарна кількість, медіаною є центральне число; якщо парна — обчислюється середнє арифметичне двох центральних значень. Саме тому тема «Що таке медіана: формула та приклади розрахунку» залишається актуальною як у математичній теорії, так і в економіці, соціології та аналізі даних.
Суть медіани в статистиці та аналізі даних
У статистиці медіана належить до показників центральної тенденції разом із середнім арифметичним і модою. Однак її особливість полягає в стійкості до екстремальних значень. Наприклад, якщо в наборі доходів більшості людей показники коливаються в межах 15 000–25 000 грн, але один показник становить 500 000 грн, середнє арифметичне суттєво зросте, тоді як медіана залишиться близькою до реального «типового» рівня доходу.
За даними Світового банку та OECD, при аналізі доходів населення найчастіше використовується саме медіанний дохід, оскільки він точніше відображає фінансову ситуацію «середнього» громадянина порівняно із середнім арифметичним.
Що таке медіани, формули та приклади розрахунку у практиці
Розглянемо детальніше формули та алгоритми обчислення.
Формула для непарної кількості значень
Якщо маємо непарну кількість елементів (n — непарне число), то після впорядкування чисел у зростаючому порядку медіана визначається за формулою:
Me = x(n+1)/2
Тобто ми беремо значення, яке знаходиться на позиції (n+1)/2.
Приклад:
Дані: 3, 5, 7, 9, 11
Кількість значень n = 5
(5+1)/2 = 3
Медіана = 7
Формула для парної кількості значень
Якщо n — парне число, медіана обчислюється як середнє арифметичне двох центральних значень:
Me = (xn/2 + xn/2+1) / 2
Приклад:
Дані: 2, 4, 6, 8
n = 4
Me = (4 + 6) / 2 = 5
Медіана в інтервальному ряді
Для великих масивів даних, згрупованих в інтервали, використовується формула:
Me = L + ((N/2 − F) / f) × h
де:
L — нижня межа медіанного інтервалу;
N — загальна кількість спостережень;
F — накопичена частота до медіанного інтервалу;
f — частота медіанного інтервалу;
h — ширина інтервалу.
Такий підхід широко застосовується в демографії та економічній статистиці.
Порівняння медіани із середнім арифметичним і модою
| Показник | Чутливість до викидів | Сфера застосування |
|---|---|---|
| Медіана | Низька | Доходи, ціни нерухомості |
| Середнє арифметичне | Висока | Фізика, технічні обчислення |
| Мода | Низька | Категоріальні дані |
Згідно з дослідженнями Harvard Business Review (2023), понад 60% аналітиків у сфері ринку праці використовують медіану як ключовий показник для визначення зарплатної статистики.
Практичні приклади використання медіани
Медіанна зарплата
Якщо 9 працівників мають зарплату 20 000 грн, а керівник — 200 000 грн, середнє арифметичне становитиме 38 000 грн, що не відображає реальної ситуації. Медіана ж дорівнюватиме 20 000 грн.
Ціни на нерухомість
У великих містах кілька елітних квартир можуть суттєво підвищити середню ціну. Тому аналітики ринку зазвичай орієнтуються на медіанну вартість квадратного метра.
Освітня статистика
При аналізі результатів тестування медіана дозволяє оцінити рівень підготовки більшості студентів без впливу екстремально високих або низьких балів.
Чому медіана є стійким показником
Головна перевага медіани — її робастність. Якщо змінити екстремальне значення в наборі даних, медіана або не зміниться, або зміниться мінімально. Це робить її ідеальним інструментом в умовах нерівномірного розподілу.
За статистикою Eurostat, різниця між середнім і медіанним доходом у країнах з високою нерівністю може становити понад 20%. Це демонструє, наскільки важливо розуміти, що таке медіана: формула та приклади розрахунку мають реальне економічне значення.
Типові помилки при обчисленні медіани
Невпорядкований ряд
Головна помилка — обчислення без попереднього сортування даних.
Ігнорування парності кількості значень
Неправильне визначення центральних елементів призводить до помилкових результатів.
Плутанина із середнім арифметичним
Ці показники мають різну логіку обчислення і різне практичне значення.
Медіана у великих даних та сучасній аналітиці
У сфері Data Science медіана використовується для попередньої обробки даних, зокрема для заповнення пропущених значень (median imputation). Дослідження MIT (2024) показало, що використання медіани замість середнього арифметичного при очищенні вибірки знижує похибку моделі на 12–18% у випадках наявності викидів.
Геометричне та графічне трактування
На гістограмі медіана ділить площу розподілу навпіл. У симетричному розподілі вона збігається із середнім значенням, тоді як у скошеному — зміщується в бік довшого «хвоста».
Висновки
Розуміння теми «Що таке медіана: формула та приклади розрахунку» є фундаментальним для статистики, економіки та аналітики. Медіана — це центральне значення впорядкованого ряду даних, яке відображає реальний стан вибірки без спотворення екстремальними показниками. Формула розрахунку залежить від кількості елементів: для непарної кількості береться центральне значення, для парної — середнє арифметичне двох центральних чисел. У згрупованих даних застосовується окрема формула з урахуванням частот.
Саме тому питання «що таке медіана: формула та приклади розрахунку» має не лише навчальне, а й практичне значення. Від аналізу зарплат і фінансових показників до машинного навчання — медіана є надійним і стійким статистичним інструментом, який допомагає приймати обґрунтовані рішення на основі реальних даних.