Constructing Groupings by Use of STATISTICA Software Package

Journal Title: Статистика України - Year 2018, Vol 83, Issue 4


STATISTICA software package for statistical analysis incorporates a wide range of advanced statistical methods. Quite often they are preceded by aggregating statistical survey data, which main component is their grouping. Although this phase of statistical data processing is relatively simple, the manual process of aggregation can be time-consuming given the need to process large data arrays, not mentioning a high probability of errors. Therefore, the all-purpose STATISTICA software package is a logical and reasonable tool for grouping of data.     The article shows the grouping algorithm in STATISTICA software package, with focus on setup when constructing tables of frequencies of discrete and continual characters. Various options of grouping are scrutinized, with providing examples of their visualization.     A large number of STATISTICA parameters offers ample opportunities for constructing user tables, but users often are not aware of these options or do not know how they can be applied. Yet, the apparently simple grouping process in STATISTICA software package can sometimes require the knowledge of fine mechanisms for its setup. The article gives a detailed description of the mechanisms for creating interval margins when applying the parameter “approximate number of intervals”. The standard algorithm for selection is analyzed, allowing a user to limit the number of groups in a grouping. STATISTICA allows for using a number of grouping parameters, enabling to produce more convenient results or filter them. Thus, setting the clicker for label field “Grouping” in the position “Integer Categories” (integer intervals (categories)) initiates the grouping only for integer values of a variable, by excluding the observations containing its fractional values. When only standard parameters are used, it will be impossible to form uneven or open intervals.  This issue is out of focus in specialized literature and Internet sources. The article shows the algorithm for constructing open intervals by user-set conditions and the process of creating these conditions. This option allows for forming both closed and open intervals by solving all the problems in time of grouping. Because creating such conditions is time consuming, they should be preserved if they are required for further use. Setting up of STATISTICA software with missing data is analyzed. Its application will be advisable when a grouping for two or more variables is constructed. In this case, a separate sheet with a grouping is to be created in the worksheet for each variable.      

Authors and Affiliations

V. S. Fetisov


Related Articles

Створення статистичного підґрунтя для оцінки особливостей інноваційних старт-апів України*

Окреслено ситуацію з розвитком старт-апів в Україні. Обгрунтовано необхідність створення статистичного формуляру спостереження за інноваційною діяльністю вітчизняних старт-ап компаній. Представлено розроблену авторами пр...

Incomes and Expenditures of Ukrainian Households from 2015 till Earlier Half of 2016

Principles of organization and practice of the surveys devoted to living conditions of households, conducted by the State Statistics Service of Ukraine, are studied. Change in the households’ incomes and expenditures fro...

Аналіз непараметричних і параметричних критеріїв перевірки статистичних гіпотез. Частина I. Критерії узгодження Пірсона і Колмогорова

Рассмотрены статистические критерии согласования, используемые для проверки гипотез о законах распределения генеральной совокупности. С единой позиции всесторонне проанализированы известные непараметрические критерии Пир...

Smart-місто як новий об’єкт статистичних досліджень: визначення терміна

У статті розглянуто та проаналізовано різні варіанти трактування терміна ‘^тагї-місто”. Зроблено висновок, що до сьогодні єдине визначення цього терміна ще не сформовано. Різноманітність варіантів трактування цього термі...

Комплексна оцінка показників статики, динаміки та інтенсивності розвитку регіонів України за 2015 р.

Запропоновано методику визначення рейтингу регіонів за показниками статики, динаміки та інтенсивності соціально-економічного розвитку регіонів України у 2015 р. на основі методу комплексних статистичних коефіцієнтів...

Download PDF file
  • EP ID EP564031
  • DOI 10.31767/su.4(83)2018.04.14
  • Views 157
  • Downloads 0

How To Cite

V. S. Fetisov (2018). Constructing Groupings by Use of STATISTICA Software Package. Статистика України, 83(4), 121-129.