Статистика

From Wikiversity

Основи статистичного моделювання[edit]

Статистичні моделі використовують для діагностики стану об'єктів управління, при вивченні причинно-наслідкового механізму формування варіації та динаміки економічних явищ і процесів, при прогнозуванні та прийнятті оптимальних управлінських рішень. Оволодіння арсеналом методів статистичної обробки даних з використанням комп'ютерних технологій є важливою складовою професійної підготовки. Розглянуто основні характеристики моделювання та напрями використання. З цією метою, обґрунтовано необхідність виокремлення часових рівнів управління з розмежуванням цілей та засобів їх досягнення, показників і виконувачів завдань. В основі обробки й аналізу даних лежать різноманітні математичні методи, що здебільшого є незмінними вже протягом багатьох десятиліть.Підготовка даних до аналізу. Це важливий етап роботи. Сучасна технологія обробки даних починається саме з етапу підготовки даних до аналізу, метою якого є приведення даних до виду, що дозволяє провести наступну їхню обробку. Як правило, він включає: занесення даних, попереднє перетворення даних, візуалізацію даних з метою формування подання про досліджуваний матеріал. Звичайно при проведенні медичного дослідження прагнуть урахувати максимальну кількість характеристик, які відіграють важливу роль при аналізі досліджуваного питання. При цьому дослідження складається з декількох серій спостережень, при яких в ідентичних умовах реєструються параметри окремих об'єктів. Маючи справу із серією спостережень, варто прагнути виразити їх у простій формі, що дозволила б безпосередньо або шляхом наступних обчислень зробити з них висновки. Всі дані доцільно звести в єдину таблицю, в якій по рядках розташовані різні об'єкти спостереження, а по стовпцях - параметри. Всередині цієї таблиці об'єкти можуть бути об'єднані в кілька груп відповідно до загальної ознаки. Однак на сьогоднішній день практично відпадає необхідність у попередньому структуруванні, побудові необхідних вибірок, ранжируванні тощо. Всі ці завдання в сучасних пакетах автоматизовані й виконуються безпосередньо при реалізації вибраного методу аналізу. На етапі підготовки даних дуже важливим моментом є візуалізація або перегляд даних. Треба відзначити, що графічне подання даних значно полегшує попередній аналіз інформації, метою якого є формування подання аналізованих даних і попередній вибір методів аналізу, за допомогою яких обчислюються елементарні статистичні характеристики (середнє значення, помилка середнього, середньоквадратичне відхилення), визначаються залежності між даними та статистично достовірні відмінності між групами тощо. Вибір і реалізація методу аналізу у зв 'язку з їх різноманіттям може виявитися завданням нетривіальним. Однак, використання комп'ютерного аналізу даних легко дозволяє спробувати вирішити завдання кількома подібними методами й вибрати той, котрий дає найкращий результат. І дійсно, у сучасних пакетах прикладних програм занесені дані досить просто обробити з використанням різних процедур, а потім можна вибрати метод, що дає найкращі результати. При цьому слід зазначити, що один раз занесені дані можуть бути оброблені різними методами й різними програмами. Заключним етапом технології аналізу даних є інтерпретація і подання результатів аналізу. Дуже важливе значення мають повнота й рівень опису як самого аналізу, так і його результатів та їхньої інтерпретації. Читач повинен мати можливість ясно уявляти собі всю послідовність обробки даних, оцінити адекватність обраних методів аналізу й обґрунтованість сформульованих висновків. Так, при інтерпретації результатів статистичної обробки даних завжди необхідно пам'ятати про їхній імовірнісний зміст. Він полягає в тому, що не завжди отримані результати є точними, а лише статистичними оцінками істотних значень. Крім того, при перевірці статистичних гіпотез необхідно пам'ятати про статистичну значимість, тому що дослідження, як правило, проводяться лише на якійсь вибірці з генеральної сукупності. Питання поширення отриманих висновків тісно пов'язане з репрезентативністю аналізованих вибірок.

Найефективнішим способом оптимізації управлінських рішень є моделювання. Застосування моделей менеджменту та їх реалізація в практичній діяльності підприємства дозволять менеджерам набути певних навиків і знань з моделювання управлінських процесів та приймати економічно обґрунтовані рішення. Запропоновано етапи моделювання управлінських процесів на підприємстві. Вони охоплюють процес формулювання управлінської задачі, розроблення моделі менеджменту, розрахунок та перевірку моделі на практиці, прийняття управлінського рішення та оцінювання реалізованого управлінського рішення на основі прийнятої моделі менеджменту. Здійснено класифікацію методів та моделей менеджменту. Показано прикладне використання моделей менеджменту в практичній роботі керівникаметоди менеджменту, моделі менеджменту, управлінські рішення, моделювання управлінських процесів. Чисто математичні моделі, в яких взаємозв'язки між вхідними та вихідними даними зафіксовані цілком детерміністично, можуть бути важливими теоретичними інструментами, але вони непрактичні для опису спостереженнь, експериментів чи опитувань. Для таких явищ дослідники зазвичай вводять в модель, окрім детерміністичних, також стохастичні елементи. Коли невизначеність реалізації призводить до включення випадкових компонентів, отримані моделі називаються стохастичними моделями. Отже, статистична модель — це стохастична модель, що містить параметри, які є невідомими константами, і їх необхідно оцінити, спираючись на припущення про модель та спостереження. Переваги статистичних моделей:Випадковість часто вводиться в систему для досягнення певного балансу або різноманітності. Наприклад, випадкове призначення лікування експериментальним одиницям дозволяє отримати об'єктивні висновки про ефективність лікування. Як ще один приклад, вибір особи для вибірки опитування за випадковими механізмами забезпечує різноманітність вибірки.Навіть якщо детерміністична модель може бути сформульована для досліджуваного явища, стохастична модель може забезпечити простіший і зрозуміліший опис. Наприклад, в принципі, можливо зафіксувати результат підкидання монетки детерміністичною моделлю, беручи до уваги властивості монети, спосіб підкидання, умови середовища, в якому рухається монета, і поверхні, на яку вона приземлиться тощо. В результаті для опису простого результату — герб або число, потрібна дуже складна модель. Альтернативно, результат підкидання монетки можна описати як результат стохастичного процесу — імовірності, з якою випаде герб.Часто достатньо описати середньостатистичну поведінку процесу, а не кожну конкретну реалізацію. Наприклад, могла бути розроблена модель регресії, яка б зв'язувала ріст рослин з наявністю поживних речовин. Явна мета моделі може полягати у визначенні того, як змінюється середньостатистичне зростання рослин з наявністю поживних речовин, а не прогнозування зростання окремої рослини. Підтримка поняття усереднення в моделі полягає в характері очікуваних значень, що описують типову поведінку при наявності випадковості. Це, у свою чергу, вимагає, щоб модель містила стохастичні компоненти. Формально статистична модель являє собою абстрактну схему відношень між величинами, що характеризують властивості реального процесу. Вибір же цих властивостей і розробка схем відношень між ними здійснюється неформальним шляхом. На основі апріорного аналізу природи процесу формулюються гіпотези щодо окремих його властивостей і закономірностей. Гіпотези перевіряються на фактичних даних.

Важливість навчання технології обробки й аналізу даних визначається інтенсивністю міжнародних контактів у галузі освіти, науки, техніки, виробництва, масштабністю науково-технічної співпраці та культурних обмінів, що посилюють необхідність знання.

Удосконалювання технічних засобів призводить до зміни технології обробки даних. Ще недавно обробка даних здійснювалася вручу, найбільш трудомістким процесом був етап самих статистичних обчислень і розрахунків за різними формулами. І цілком природно, що на цьому етапі була зосереджена увага фахівців, а тому пропонувалися різні спрощені варіанти розрахунків, більш прості методи, спеціально пристосовані для ручного рахунку тощо. Потім, з появою перших комп'ютерних пакетів, технологія ґрунтувалася на принципі командного рядка й вимагала досить пристойних знань не лише статистики, а й володіння комп'ютером на рівні програміста. На сьогодні обробка й аналіз будь-якої інформації стають не просто неможливими, а й недопустимими без використання комп'ютерів і відповідного сучасного програмного забезпечення.Статистична модель — абстрактна схема відношень між величинами, що характеризують властивості реального процесу, розробка якої здійснюється неформальним шляхом. Статистична модель являє собою процес генерування даних, часто в значно ідеалізованій формі.У статистичній моделі поєднується інформація двох типів:апріорі логічно обґрунтованих гіпотез щодо природи та характеру властивостей процесу, співвідношень і взаємозв'язків між ними;емпіричних даних, які характеризують ці властивості.Статистична модель визначається за допомогою математичних рівнянь, які відносяться до однієї чи кількох випадкових величин і інших невипадкових змінних. В цілому, статистичні моделі є частиною фундаменту статистичного висновування. Статистичне моделювання це математично-формалізований спосіб апроксимації випадкового явища чи процесу. Об'єктом моделювання виступає статистична сукупність, в якій реалізується закономірність. При наявності даних, отриманих зі спостережень, можна обчислити статистичні відношення між величинами, використовуючи регресійний аналіз, або статистичні методи. Статистична модель являє собою особливий клас математичної моделі. Статистичну модель від інших математичних моделей відрізняє те, що статистична модель не є детермінованою. Таким чином, у статистичній моделі, визначеної за допомогою математичних рівнянь, деякі зі змінних не мають конкретних значень, проте натомість мають розподіл ймовірностей, тобто деякі змінні є стохастичними. Дві статистичні моделі є вкладеними, якщо перша модель може бути перетворена у другу шляхом накладення обмежень на параметри першої моделі. Наприклад, множину всіх розподілів Гауса має, вкладену в нього, множину розподілу Гауса з нульовим сподаванням: ми обмежуємо сподівання в множині всіх розподілів Гауса, щоб отримати розподіл з нульовим середнім розподілом. Статистичні моделі часто використовуються навіть тоді, коли змодельований фізичний процес є детермінованим. Моделі можуть бути зіставлені один з одним для порівняння за допомогою пошукового аналізу даних або перевірки статистичних гіпотез. У пошуковому аналізі різноманітність моделей формулються і оцінюються залежно від того, наскільки добре кожна з моделей описує дані. При перевірці статистичних гіпотез раніше сформулювана модель/моделі порівнюються з існуючими. Загальні критерії для порівняння моделей включають коефіцієнт детермінації, коефіцієнт Баєса, і перевірка відношенням правдоподібності. Статистичні моделі мають цілі:передбачення,отримання інформації,опис стохастичних структур.

Методи і моделі багатовимірного регресійного аналізу[edit]

В основі обробки й аналізу даних лежать математичні методи, що здебільшого є незмінними вже протягом багатьох десятиліть. Відповідно незмінними залишаються й загальні принципи та послідовність дій при обробці даних, проте технологія обробки даних міняється, і досить істотно. Листок паперу, олівець та калькулятор, якими користувалися раніше, відійшли в минуле, їм на зміну приходять нові сучасні технічні засоби, які удосконалюються надзвичайно швидкими темпами. В останні роки обробка й аналіз будь-якої інформації стають не просто неможливими, а й недопустимими без використання комп'ютерів і відповідного сучасного програмного забезпечення. Комп'ютерний аналіз медичних даних припускає деяке математичне перетворення даних за допомогою певних програмних засобів, а отже користувачу необхідно мати уявлення не лише про математичні методи обробки даних, а й про відповідні програмні засоби. Незважаючи на те, що статистичні методи за останні півстоліття істотно не змінилися, завдяки використанню комп'ютерів значно розширилося коло застосовування цих методів.

Однак для того, щоб глибоко знати статистичні методи, необхідна спеціальна математична підготовка в обсязі вузівського курсу, що нереально для лікаря, оскільки підготовка в галузі прикладної статистики у медичних вузах для лікарів-дослідників явно недостатня. Звичайно, ці прогалини слід заповнити і необхідні уявлення про основні статистичні методи медичним працівникам необхідно мати. В [1-3], в яких описані статистичні методи. В ньому досить повно і детально і, найголовніше, зрозумілою для медиків мовою викладені різні аспекти обробки й аналізу медичних даних, наводяться медичні приклади використання тих або інших методів. Основні математичні методи обробки й аналізу даних, які найчастіше використовуються при типових дослідженнях. Основні математичні методи обробки й аналізу даних, які використовуються при типових дослідженнях

Основні пакети аналізу даних Statgraphics Plus, SAS, SPSS, Statistica, Excel тощо Windows Удосконалювання технічних засобів призводить до зміни технології обробки даних. У ті порівняно недавні часи, коли обробка даних здійснювалася вручну, найбільш трудомістким процесом був етап самих статистичних обчислень і розрахунків за різними формулами. І цілком природно, що на цьому етапі була зосереджена увага фахівців, а тому пропонувалися різні спрощені варіанти розрахунків, більш прості методи, спеціально пристосовані для ручного рахунку тощо. Потім, з появою перших комп'ютерних пакетів, тех - нологія ґрунтувалася на принципі командного рядка й вимагала досить пристойних знань не лише статистики, а й володіння комп'ютером на рівні програміста. Далі розвиток пішов шляхом використання меню готових процедур, що різко знизило вимоги як до знання статистики, так і до володіння комп'ютером. Останнім часом продовжується поліпшення інтерфейсу з користувачем, активніше використовується графічний підхід, особливо важливого значення набуває візуалізація даних, що ще більше полегшує обробку даних. Завдяки використанню комп'ютерів, обчислювальний етап став найменш трудомістким, полегшилися й інші етапи обробки даних. На перше місце по відносній трудомісткості вийшли такі етапи, як: освоєння статистичного пакета, підготовка даних до аналізу, попередній аналіз даних; інтерпретація результатів. Все це в цілому привело до зміни технології обробки й аналізу даних. При цьому для застосування основних методів обробки даних від виконавця потрібно лише виконання певних статистичних правил і грамотне використання обраного ним пакета.

Методи обробки й аналізу, які використовуються для реалізації поставлених завдань Опитувальники, анкети, тести Обстеження стану здоров'я; думка того, кого обстежують; історії хвороби Виявлення прихованих взаємозв'язків Кореляційний аналіз, метод автоматичної класифікації тощо Факторний аналіз Скринінгові обстеження Дискримінантний аналіз, кластерний аналіз, методи розпізнавання образів Історії хвороби Клінічні обстеження, лікування та реабілітація хворих; ускладнення при лікуванні. Дослідження ефективності різних процедур, вивчення зв'язків між процедурами та їхніми наслідками Кореляційний аналіз, дисперсійний аналіз, регресійний аналіз Методи оцінювання гіпотез, регресійний аналіз Медико-статистичні дані Дослідження захворюваності, динаміка захворюваності, виявлення періодичності захворюваності Методи аналізу випадкових процесів, спектральний аналіз, математичне моделювання Експерименти Лабораторні експерименти й досліди на тваринах при заданих умовах Методи планування експериментів, регресійний аналіз, дисперсійний аналіз, багатомірний статистичний аналіз, методи математичного моделювання Клінічні дослідження Порівняльні лікувальні дослідження, аналіз виживаності й спадковості з урахуванням належності пацієнта до певної групи, вивчення дозування препаратів Розробка методів діагностики Дисперсійний аналіз, регресійний аналіз, дискримінантний аналіз, методи оцінювання гіпотез Дискримінантний аналіз, кластерний аналіз, методи розпізнавання образів Дослідження механізмів дії патогенних факторів Дисперсійний аналіз, регресійний аналіз, методи математичного моделювання Клінічні лабораторні дані Зберігання, збір і передача клінічної інформації, аналіз якості й надійності лабораторних досліджень, догляду за пацієнтами Дисперсійний аналіз, регресійний аналіз людської діяльності.

Статистичне моделювання та прогнозування розглядає: • методологічні принципи статистичного моделювання та пропргнозування, перевірки гіпотез і верифікації прогнозів; • моделі багатовимірних оцінок і моделі класифікацій; • різноманітні моделі динаміки, комплексне їх використання при прогнозуванні; • модифікації множинної регресії; адаптація основних засад регресійного аналізу до специфіки об'єктів моделювання та інформаційної бази; • моделі багатофакторного прогнозування за даними взаємозв'язаних динамічних рядів; • моделювання причинних комплексів системами рівнянь Для кожного типу моделей розглядаються принципи формування інформаційної бази, вибору процедур аналізу, інтерпретації результатів. Методологія обробки даних у системі Statistica ґрунтується на електронних таблицях типу МS Ехсеl. Акцентуючи увагу на параметрах моделей, таблиці з результатами аналізу і графіки наводяться у стандартному вигляді. Специфікація включених у модель ознак і змістовна інтерпретація параметрів моделі розкривається в коментарях до таблиць і графіків. Для ймовірнісної оцінки параметрів моделей у таблицях результатів пропонуються фактичні рівні істотності р-level. З метою самостійної перевірки гіпотез щодо властивостей процесу чи адекватності моделі в цілому в наведено фрагменти таблиць статистичних критеріїв У статистичному моделюванні сукупність розглядається як вибірка — класична чи гіпотетична. Класична вибірка — це частина реальної генеральної сукупності, відібрана для обстеження за принципами вибіркового методу. Гіпотетична генеральна сукупність оперує не кількістю елементів, а кількістю можливих наслідків функціонування об'єкта моделювання в одних і тих самих умовах. Фактичні дані, що є результатом обстеження сукупності, розглядаються як випадкові реалізації стохастичного, непередбачуваного процесу. Це дає підстави для ймовірнісного оцінювання результатів моделювання. Завдання ймовірнісного оцінювання — встановити, наскільки виявлена закономірність позбавлена випадкових впливів, наскільки вона характерна для того комплексу умов, у яких функціонує об'єкт моделювання. Якісна своєрідність і неповторність статистичних сукупностей потребує інтерпретації цих оцінок щодо конкретних умов простору і часу. В окремих випадках імовірнісне оцінювання результатів суцільного спостереження недоречне, скажімо, при визначенні рейтингів окремих елементів сукупності. Проте мета конкретного дослідження не може відкинути правомірність використання таких оцінок. Побудова моделі ґрунтується на основі певних правил та алгоритмів, які визначають порядок розрахунків і математичних дій, необхідних для обробки інформації. На етапі математичної формалізації моделі обґрунтовується алгебраїчна форма розрахунків, відношення між властивостями процесу описуються символами та знаками, порядок розрахунків — блок-схемами. Прогнозування передбачає систему наукових доведень, використання методів і прийомів з різним ступенем формалізації, узгодженість окремих висновків і оцінок щодо майбутнього розвитку процесу.

Нелінійні моделі у статистичному аналізі[edit]

Внаслідок багатогранності й складності за своєю структурою економічних процесів обмежуватися розглядом лише лінійних моделей стає неможливим, оскільки економічні залежності переважно не можуть бути описані лінійними рівняннями. Якщо між економічними показниками існують нелінійні співвідношення, то вони описуються за допомогою нелінійних математичних функцій.На сьогодні більшість процесів в економіці та фінансах є нелінійними та нестаціонарними. Такі процеси характеризуються значною кількістю складностей та особливостей, що необхідно враховувати, при моделюванні та прогнозуванні відповідних процесів. Такого роду процеси містять тренд або змінну дисперсію. Під трендом будемо розуміти загальну тенденцію при різнонаправленому русі, яка визначена загальною спрямованістю змін показників часового ряду. Виділяють два типи тренду: детермінований та стохастичний. Процеси з трендами та змінною дисперсією особливо характерні для фінансовоекономічних процесів, які будуть використані у якості об’єкту дослідження. Наступною проблемою, при побудові фінансово-економічних процесів є наявність в них нелінійностей. Нелінійність означає наявність непередбачуваних змін у напрямі розвитку процесів. Вона може проявлятись як підвищеною реакцію на зміну одних факторів, так і повною нечутливістю до інших. Перша книга, в якій були частково описані принципи та етапи побудови моделей нестаціонарних процесів, була опублікована у кінці 1986 року [Дрейпер Н., Смит Г. Прикладной регрессионный анализ (т.2). - М.: Финансы и статистика, 1986. - 366 с.]. Потім була опублікована книга [Бідюк, П. І. Аналіз часових рядів. Навчальний посібник [Текст] / П. І. Бідюк, В. Д. Романенко, О.Л. Тимощук.- К.: Політехніка, 2010. -317 с] у якій була наведена методика побудови моделей нелінійних нестаціонарних процесів буда доповнена декількома етапами, які полягали у застосування комбінованих методів регресійного та статистичного аналізу, також була наведена прогнозуюча функція для деяких лінійних моделей , застосування якої дає змогу покращити якість точкового прогнозу. Статей, в яких були б подальші дослідження щодо модифікації сформованої методики за допомогою методів інтелектуального аналізу даних для покращення точкових оцінок прогнозу, отриманих шляхом використання моделей процесів, які були побудовані з використання даної методики та формування ймовірнісних оцінок прогнозу не було знайдено. Внаслідок цього, можна зробити висновок, що запропонована тематика є доволі новою. Беручи до уваги вищевказане, можна зробити висновок, що доповнення методики побудови нелінійних нестаціонарних процесів методами інтелектуального аналізу даних дало б змогу розширити спектр економічних та фінансових процесів, які підлягають моделюванню та підвищити адекватність побудованих моделей. Дослідження присвячене аналізу використання мережі Байєса для покращення точкових оцінок прогнозів моделей, які побудовані з використанням даної методики.

На сьогоднішній день число пакетів для обробки інформації досягає кількох десятків, серед яких зарубіжні пакети, такі, як: SYSTAT, STATGRAPHICS, BMDP, SPSS, SAS, CSS, Statistica, а також: STADIA, ЕВРІСТА, тощо. Основну частину наявних пакетів для обробки даних можна віднести до трьох категорій: спеціалізовані пакети, пакети загального призначення і професійні пакети. Спеціалізовані пакети, як правило, містять методи з одного-двох розділів статистики або методи, що Однак, досить часто заздалегідь важко визначити, який метод дасть найкращий результат. Тому варто передбачити можливість застосування різних способів обробки даних, що при використанні комп'ютерного аналізу стає набагато простішим. Що стосується другого завдання, а саме - освоєння пакета аналізу, за допомогою якого буде здійснюватися обробка й аналіз даних, то слід зазначити, що це один з найбільш трудомістких етапів обробки даних. Сьогодні вже ніхто не проводить статистичний аналіз експериментальних даних вручну, зараз з цією метою використовуються різноманітні комп'ютерні пакети прикладних програм. Більшість комп'ютерних статистичних програм не є чисто медичними прикладними програмами, оскільки більшість методів статистичного аналізу є універсальними й можуть застосовуватися не лише в різних галузях медичної статистики, і використовуються в конкретній предметній галузі. Спеціалізовані пакети застосовуються для вирішення вузького кола завдань з використанням спеціальних методів статистичного аналізу. Експлуатація цих програм вимагає високого рівня підготовки користувача в галузях певних розділів статистики. Пакети загального призначення або універсальні (Statistica, SPSS, Діастат, STADIA, STATGRAPHICS, SYSTAT, Excel) є найбільш зручними для користувача-початківця завдяки відсутності орієнтації на специфічну предметну галузь, широкому діапазону статистичних методів і дружньому інтерфейсу користувача. Вони більш доступні для практики й можуть використовуватися широким колом фахівців різного профілю. Практично всі задачі, що стосуються обробки й аналізу медико-біологічних досліджень, можуть бути вирішені за допомогою універсальних пакетів, зокрема Statistica та Excel. Професійні пакети призначені для користувачів, які мають справу із надзвичайно великими обсягами даних або вузько спеціалізованими методами аналізу. Особливістю будь-якого пакета статистичних програм є видача великої кількості інформації, що описує результат статистичного аналізу. Практично всі статистичні пакети забезпечують широкий набір засобів візуалізації даних: побудова графіків, дво- і тривимірних діаграм, а часто і різноманітні засоби ділової графіки. Statgraphics розроблявся для роботи в середовищі DOS, a потім був адаптований до операційної системи Windows і отримав нову назву Statgraphics Plus. За своїми характеристиками пакет займає проміжне місце між SPSS і Statistica. Пакет SPSS переводився для роботи в Windows. Пакет добре відпрацьований, наближається за своїми можливостями до професійних пакетів, і реалізація статистичних процедур добре пристосована до практичної роботи. Пакет Statistica спеціально створювався для роботи в середовищі Windows. Відрізняється найбільш розвиненим інтерфейсом і багатими графічними можливостями. Електронна таблиця Excel найбільш поширена і, як правило, використовується при найпростішому статистичному аналізі даних. Важливою перевагою пакета Excel є його русифікованість, а також доступність, оскільки він встановлюється автоматично при інсталяції пакета MS Office. Тому пакет Excel найчастіше використовується при оформленні результатів роботи. Слід зазначити, що всі ці пакети постійно оновлюються і з кожним роком з'являються їх нові версії. При виборі пакета для аналізу даних можна виділити два аспекти: а) початковий вибір пакета аналізу; б) поточний вибір при переході на більш сучасний, більш потужний пакет. Підходи в обох випадках дещо відрізняються. Що стосується характеристик пакета, то тут варто розглянути такі аспекти: а) обчислювальні можливості, б) зручність роботи, в) складність освоєння. Обчислювальні можливості. У випадку, коли необхідно обробляти медичні дані помірних обсягів (до декількох тисяч спостережень) стандартними статистичними методами, найкраще використовувати універсальні пакети. Якщо дивитися з позицій дослідника, то статистичні пакети за своїми обчислювальними можливостями повністю відповідають можливим потребам (Statistica, SPSS, SAS, Statgraphics Plus, Systat та інші пакети, що працюють в операційній системі Windows). За складністю освоєння пакети дещо розрізняються і тут варто віддати перевагу русифікованим пакетам або пакетам, з яких є доступна література або є можливість пройти курс навчання. Варто зауважити, що без крайньої необхідності (неможливість забезпечити необхідну обробку даних) не бажано змінювати обраний і освоєний пакет аналізу, тому що це призведе до значного збільшення витрат праці. Прагнення до постійного відновлення, установки найостанніших версій пакетів - як правило віднімає багато сил, не дозволяє виробитися корисним стереотипам дій, у той же час не приводить до суттєвого зростання можливостей. іншого, боку уподобання до застарілих пакетів найчастіше не дозволяє повною мірою використовувати можливості сучасної техніки і програмного забезпечення. Існує деякий емпіричний оптимум, що може визначатися зразковим терміном експлуатації пакета в 2-3 роки, після закінчення котрого доцільно здійснювати перехід до більш сучасних пакетів. Аналіз даних з використанням статистичного пакета включає наступні розділи: Планування дослідження. Підготовка даних до аналізу. 3. Вибір методу аналізу і його реалізація. Інтерпретація та подання результатів. Планування дослідження. Найкращим випадком є такий, коли ще до проведення дослідження існує певна ясність щодо передбачуваних до використання надалі методів обробки даних. У цьому випадку, як правило, вдається спланувати дослідження з урахуванням наступної обробки даних і уникнути ситуацій, коли виявляється, що якісь спостереження були зайвими, а якихось не вистачає для реалізації обраних методів аналізу.

Таким чином, реалізована методика моделювання забезпечує отримання адекватних моделей за умови відповідності даних вимогам інформативності та повноти. Застосування мережі Байєса як методу інтелектуального аналізу дає можливість підвищити рівень адекватності моделей та отримати оцінки короткострокового прогнозу більш високої точності. Мережа Байєса дає змогу отримати ймовірнісну оцінку короткострокових прогнозів. Розглянуту методику моделювання доцільно доповнити тестами на аналіз нелінійностей та типу не стаціонарності досліджуваних процесів. Доцільно увести комбінований критерій аналізу адекватності моделей для реалізації автоматизованого режиму вибору кращої моделі. Доповнити наведену методику моделювання альтернативними методами заповнення пропусків даних і методами оцінювання параметрів нелінійних моделей. В Україні найбільш поширена і, як правило, використовується при найпростішому статистичному аналізі даних електронна таблиця Excel. Важливою перевагою пакета Excel в Україні є його русифікованість, а також доступність, оскільки він встановлюється автоматично при інсталяції пакета MS Office. Тому пакет Excel найчастіше використовується при оформленні результатів роботи.

Задачі оптимізації у статистичному моделюванні[edit]

Для побудови функції приналежності використовуються експертні судження про ступінь схильності того чи іншого потенційно можливого події до того, щоб бути реалізованим. В цьому випадку застосовується апарат нечіткої логіки [1]. Для побудови нестохастичної (ігрової) моделі задається лише безліч окремих значень наслідків ризикової події, потенційно що може бути реалізованим. Як опису використовуються математичні і статистичні ігри, теорія корисності, тощо [2]. Проведений аналіз дозволить систематизувати знання про існуючі математичні моделі оцінки та аналізу ризиків. Наявні знання дозволять в подальшому розробити комплексну математичну модель аналізу та оцінки ризиків при управління проектами та програмами в складних системах.

Основну частину наявних пакетів для обробки даних можна віднести до трьох категорій: спеціалізовані пакети, пакети загального призначення і професійні пакети. Пакети загального призначення або універсальні є найбільш зручними для користувача-початківця завдяки відсутності орієнтації на специфічну предметну галузь, широкому діапазону статистичних. Професійні пакети призначені для користувачів, які мають справу з надзвичайно великими обсягами даних або вузько спеціалізованими методами аналізу. Особливістю будь- якого пакета статистичних програм є видача великої кількості інформації, що описує результат статистичного аналізу.

Статистико-аналітичні та інформаційні технології для моделювання складних систем[edit]

Удосконалювання технічних засобів призводить до зміни технології обробки даних. Ще недавно обробка даних здійснювалася вручу, найбільш трудомістким процесом був етап самих статистичних обчислень і розрахунків за різними формулами. І цілком природно, що на цьому етапі була зосереджена увага фахівців, а тому пропонувалися різні спрощені варіанти розрахунків, більш прості методи, спеціально пристосовані для ручного рахунку тощо. Потім, з появою перших комп'ютерних пакетів, технологія ґрунтувалася на принципі командного рядка й вимагала досить пристойних знань не лише статистики, а й володіння комп'ютером на рівні програміста. На сьогодні обробка й аналіз будь-якої інформації стають не просто неможливими, а й недопустимими без використання комп'ютерів і відповідного сучасного програмного забезпечення. Основні пакети для обробки інформації, серед яких і зарубіжні пакети, такі, як: SYSTAT, STATGRAPHICS, BMDP, SPSS, SAS, CSS, Statistica, а також: STADIA, ЕВРІСТА, використовуються в університетах України, удосконалювання технічних засобів призводить до зміни технології обробки даних. В Україні найбільш поширена і, як правило, використовується при найпростішому статистичному аналізі даних електронна таблиця Excel. Важливою перевагою пакета Excel є доступність, оскільки він встановлюється автоматично при інсталяції пакета MS Office. Тому пакет Excel найчастіше використовується при оформленні результатів роботи.

Навчальні предмети, які викладаємо: прикладні статистичні методи обчислень, регресійний аналіз та асимптотична статистика, основи наукових досліджень в статистиці, фінансовий аналіз і теорія фінансів, економетрика, методи економічних обчислень, основи економіки і бізнесу, планування вибіркових обстежень. Впровадження відповідних програм для обробки та аналізу даних, методичних рекомендацій щодо їх використання та вдосконалення при підготовці здобувачів вищої освіти в Україні дозволить покращити якість освіти. Проведений аналіз дозволяє виділити такі закономірності розвитку методики навчання на сучасному етапі: диференціація змісту освіти, форм, методів та прийомів залежно від цілей та очікуваних результатів навчання; стійкі тенденції скорочення перекладних методів; інтеграція елементів різноманітних методик у сучасній системі навчання; посилення ролі взаємодії викладача і студента в навчальному процесі; активне використання технічних засобів навчання. Враховуючи, що в сучасних умовах система вищої освіти перебуває на етапі пошуку нових шляхів подальшого розвитку, особливої уваги потребує вивчення прогресивних ідей щодо професійної підготовки фахівців в інших країнах.

Основні пакети для обробки інформації, серед яких і зарубіжні пакети, такі, як: SYSTAT, STATGRAPHICS, BMDP, SPSS, SAS, CSS, Statistica,Застосування комп'ютерної техніки робить достатньо складні методи аналізу даних більш доступними. Впровадження відповідних програм для обробки та аналізу даних, методичних рекомендацій щодо їх використання та вдосконалення при підготовці здобувачів вищої освіти в Україні дозволить покращити якість освіти.

Висновок[edit]

Завдяки сучасних комп'ютерних технологій докорінно змінився процес обробки й аналізу медичних даних. Застосування комп'ютерної техніки робить достатньо складні методи аналізу даних більш доступними. Вже не потрібно вручну виконувати трудомісткі розрахунки, будувати таблиці і графіки - всю цю роботу взяв на себе комп'ютер, а людині залишилася лише творча робота: постановка задач, вибір методів їх вирішення та інтерпретація результатів.

Література[edit]

1. Огірко О. І., Галайко Н. В. Теорія ймовірності та математична статистика: навчальний посібник. Львів: ЛьвДУВС, 2018. 292 с.

2. Кухарський В. М. Комп'ютерне моделювання засобами FEMLAB. — Львів: Видавничий центр ЛНУ імені Івана Франка. — 2008.

3. Єріна А. М. Статистичне моделювання та прогнозування: Навч. посібник. — К.: КНЕУ. — 2001.

4. Єріна А. М. Статистичне моделювання та прогнозування: Навч. посібник. — К.: КНЕУ, 2001. — 170 с. http://www.gmdh.net/articles/theory/StatModeling.pdf

5. Кунченко-Харченко В.І., Огірко О.І. Нелінійна статистична обробка негаусівських сигналів та алгоритми оцінювання інформаційних параметрів нечітких сигналів. "ОБРОБКА СИГНАЛІВ І НЕГАУСІВСЬКИХ ПРОЦЕСІВ".Зб.VI Міжнароднa науково-практичнa конференція ОСНП-2017. 24 – 26 травня 2017 р., Черкаський державний технологічний університет, м. Черкаси.C.107-119

6. Згуровский М. З., Бидюк П. И., Терентьев А. Н. Методы построения байесовских сетей на основе оценочных функций // Кибернетика и системный анализ, 2008, № 2, с. 81-88.

7. Статистика: Підручник/ А. В. Головач, А. М. Єріна, В. О. Козирєв та ін.; За ред. А. В. Головача, А.М. Єріної, О.В. Козирєва.: – К.:Вища школа, 1993. – 623 с.

8. Box, G. E. P. and Jenkins, G. M. (1976). Time Series Analysis: Forecasting and Control, Revised Edition, Holden-Day, San Francisco.

9. Дудка Б. Р. Реалізація методики побудови моделей часових рядів // Київ: ІПСА НТУУ «КПІ», «Системні науки та кібернетика», 2016.

10. https://uk.wikipedia.org/wiki/Огірко_Ігор_Васильович

11. https://artificial-intelligence-blog.web.app Для студентів старших років навчання. Основною метою є ознайомлення студентів з основами проведення наукових досліджень. Огірко І.В.