Трьохфакторна нелінійна регресійна модель для оцінювання розміру PHP-застосунків з відкритим кодом
Вантажиться...
Дата
2020
Автори
Приходько, С. Б.
Приходько, Н. В.
Фаріонова, Т. А.
Ворона, М. В.
Prykhodko, S. B.
Prykhodko, N. V.
Farionova, T. A.
Vorona, M. V.
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Метою роботи є створення множинної нелінійної регресійної моделі для оцінювання розміру PHP-застосунків із відкритим кодом на основі багатовимірного нормалізуючого перетворення за змінними, що визначаються за діаграмою класів. Трьохфакторну нелінійну регресійну модель для оцінювання розміру PHP-застосунків із відкритим кодом побудовано на основі нормалізації чотиривимірного негаусівського набору даних: кількість строк коду (LOC); кількість класів (Classes); сума кількості класів, на які впливає даний клас (Afferent Coupling), і кількості класів, із яких даний клас отримує ефекти (Efferent Coupling), та кількість методів (Methods) із 44 застосунків, розташованих на сайті GitHub (https://github.com) за допомогою інструменту PhpMetrics (https://phpmetrics.org/). Нормалізація цього набору даних здійснена за допомогою і двох одновимірних перетворень: у вигляді десяткового логарифму та перетворення Джонсона для сімейства SB. Використання чотиривимірного перетворення в порівнянні з одновимірними дозволяє врахувати кореляцію між змінними, що призводить до покращення нормалізації даних, яка пов’язана з виконанням статистичної гіпотези щодо відповідності їх розподілу чотиривимірному розподілу Гаусу, з подальшим підвищенням достовірності відповідного оцінювання. Виконано порівняння побудованої нелінійної моделі з лінійною регресійною моделлю і нелінійними регресійними моделями на основі десяткового логарифму і одновимірного перетворення Джонсона. Нелінійна модель, що побудована, в порівнянні з іншими регресійними моделями (як лінійними, так і нелінійними) має більше значення множинного коефіцієнту детермінації, менше значення середньої величини відносної похибки та менші ширини інтервалу передбачення нелінійної регресії. Цей результат може бути пояснений найкращою багатовимірною нормалізацією і тим, що немає підстав відкидати нульову гіпотезу про те, що чотиривимірний розподіл для нормалізованих даних, який нормалізується за допомогою чотиривимірного перетворення Джонсона для сімейства SB, є таким самим, як і чотиривимірний нормальний розподіл.
Опис
Трьохфакторна нелінійна регресійна модель для оцінювання розміру PHP-застосунків з відкритим кодом = Three-factor non-linear regression model to estimate the size of open source PHP-based applications / С. Б. Приходько, Н. В. Приходько, Т. А. Фаріонова, М. В. Ворона // Вчені записки ТНУ. Сер. Технічні науки. – Київ : ТНУ ім. В. І. Вернадського, 2020. – Т. 31 (70), ч. 1, № 1. – С. 124–131.
Ключові слова
нелінійна регресійна модель, інтервал передбачення, оцінювання розміру програми, PHP-застосунок, нормалізуюче перетворенн, негаусівські дані, nonlinear regression model, prediction interval, software size estimation, PHP application, normalizing transformation, non-Gaussian data