“Big Data” as an Information Source and a Toolkit for Official Statistics: Capacities, Problems, Prospects

Journal Title: Статистика України - Year 2016, Vol 75, Issue 4

Abstract

Issues are discussed, related with potential use by official statistics of the so called “Big Data”, which refers to data extracted from websites, mobile phones, cash machines in retail sales networks, traffic surveillance cameras etc. These data are nicknamed as “big” mainly due to large scopes, not enabling for their processing by standard statistical tools but requiring special software and techniques. It is argued that “Big Data” have advantages such as timeliness, wide coverage of targeted population segments; their collection does not require special questionnaires or surveys, training or recruiting numerous paid personnel like supervisors or interviewers. When “Big Data” are used, accuracy requirements can be loosened, analysis of phenomena and processes can be made by quite simple procedures. As scopes of these data are increasing incessantly, often second by second, the only thing to do is to process them in a proper way, to analyze and use the output information. It is emphasized that use of “Big Data” is complicated due to the need to address problems like indeterminacy of the covered data sets; bias of estimates; accessibility of data, because they are mostly collected by private companies or belong to them; protection of private data, storage of large scopes of “Big Data” and their processing; statistical incorporation of numerous large data sets; risks of potential manipulation with data etc. Arguments are given that applied and official statistics have prototypes of tools capable to solve a major part of the above problems, once properly developed and adapted. They include methods for calibration of survey results, statistical aggregation of data, or model-based assessment of data. As regard “cloud” technologies for data storage and processing, their use can solve the problems of weak capacity of data carriers in statistical offices, and the problems of storage of private and confidential data. Results of studies conducted by leading statisticians of our days demonstrate that official statistics has no alternatives to use of “Bid Data”. The sooner this advanced field of statistics and information technologies comes in focus of the State Statistics Service, universities and research institutions, the easier new information sources and new statistical toolkit can be integrated in the official statistics within the forthcoming ten or fifteen years.

Authors and Affiliations

V. Н. Sarioglo

Keywords

Related Articles

Організація та методика проведення моніторингу середньої освіти в Україні

Обгрунтовано доцільність проведення статистичного моніторингу середньої освіти. Сформульовано визначення цього поняття та окреслено спектр функцій, покладених на систему моніторингу. Запропоновано комплексний підхід до п...

Статистична оцінка впливу структурних факторів на господарську діяльність сільськогосподарських підприємств

Розглянуто проблеми діяльності сільськогосподарських підприємств та підвищення її ефективності. Здійснено статистичне вивчення структури та структурних зрушень узагальнюючого показника господарської діяльності - обсягу в...

Статистические классификации в сельском хозяйстве: методология применения

Рассмотрено применение статистических классификаций в сельском хозяйстве. Изложены подходы к решению проблем обеспечения сопоставимости показателей при переходе от предшествующих к следующим версиям статистических класси...

Statistical Estimation of the Awareness of the Working Age Population about Harmful Consumption of Alcohol as a Risk Factor of Cardiovascular Diseases

The article is devoted to the analysis of awareness of the working age population about alcohol abuse as a risk factor for cardiovascular diseases according to the results of a sociological study. The goal is to identif...

Удосконалення законодавчих актів України у сфері статистики

На основі вивчення законодавчих актів України у сфері статистики визначено повноваження державних органів щодо прийняття рішень про затвердження методології та звітно-статистичної документації, у тому числі про адміністр...

Download PDF file
  • EP ID EP569197
  • DOI -
  • Views 189
  • Downloads 0

How To Cite

V. Н. Sarioglo (2016). “Big Data” as an Information Source and a Toolkit for Official Statistics: Capacities, Problems, Prospects. Статистика України, 75(4), 12-19. https://europub.co.uk/articles/-A-569197