Чотирьохфакторна нелінійна регресійна модель для оцінювання розміру Java-застосунків з відкритим кодом
Вантажиться...
Дата
2020
Автори
Приходько, С. Б.
Приходько, Н. В.
Смикодуб, Т. Г.
Prykhodko, S. B.
Prykhodko, N. V.
Smykodub, T. G.
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Метою роботи є створення множинної нелінійної регресійної моделі для оцінювання розміру Java-застосунків з відкритим кодом на основі багатовимірного нормалізуючого перетворення за значеннями змінних, що можуть бути визначені за діаграмою класів. Чотирьохфакторну нелінійну регресійну модель для оцінювання розміру Java-застосунків з відкритим кодом побудовано на основі нормалізації за допомогою п’ятивимірного перетворення Джонсона для сімейства SB негаусівського набору даних: кількості строк коду (LOC); кількості класів (Classes); кількості статичних методів (NOSM); метрики, що характеризує відсутність згуртованості методів (Lack of Cohesion of Methods, LCOM), та кількості викликів унікального методу в класі (the Response for Class, RFC) з 38 застосунків, розташованих на сайті GitHub (https://github.com) за допомогою інструменту CK (https://github. com/mauricioaniche/ck). Також нормалізацію цього набору даних було здійснено і за допомогою двох одновимірних перетворень: у вигляді десяткового логарифму та перетворення Джонсона для сімейства SB. Використання п’ятивимірного перетворення порівняно з одновимірними дозволяє врахувати кореляцію між змінними, що призводить до покращення нормалізації даних, яка пов’язана з виконанням статистичної гіпотези щодо відповідності їх розподілу п’ятивимірному розподілу Гаусу, з подальшим підвищенням достовірності відповідного оцінювання. Виконано порівняння побудованої нелінійної моделі з лінійною регресійною моделлю і нелінійними регресійними моделями на основі десяткового логарифму і одновимірного перетворення Джонсона. Нелінійна модель, що побудована, порівняно з іншими регресійними моделями (як лінійними, так і нелінійними) має більші значення множинного коефіцієнту детермінації та відсотка прогнозування на рівні величини відносної похибки, який дорівнює 0,25, менші значення середньої величини відносної похибки та ширини інтервалу передбачення нелінійної регресії. Цей результат може бути пояснений найкращою багатовимірною нормалізацією і тим, що немає підстав відкидати нульову гіпотезу про те, що п’ятивимірний розподіл для нормалізованих даних, який нормалізується за допомогою п’ятивимірного перетворення Джонсона для сімейства SB, є таким самим, як і п’ятивимірний нормальний розподіл.
Опис
Приходько, С. Б. Чотирьохфакторна нелінійна регресійна модель для оцінювання розміру Java-застосунків з відкритим кодом = Four-factor non-linear regression model to estimate the size of open source Java-based applications / С. Б. Приходько, Н. В. Приходько, Т. Г. Смикодуб // Вчені записки ТНУ ім. В. І. Вернадського. Сер. Технічні науки. – Київ, 2020. – № 2, т. 31 (70), ч. 1. – С. 157–162.
Ключові слова
нелінійна регресійна модель, інтервал передбачення, оцінювання розміру програми, Java-застосунок, нормалізуюче перетворення, негаусівські дані, nonlinear regression model, prediction interval, software size estimation, Java application, normalizing transformation, non-Gaussian data