| Русский Русский | English English |
   
Главная Current Issue
19 | 04 | 2024
10.14489/vkit.2021.09.pp.043-052

DOI: 10.14489/vkit.2021.09.pp.043-052

Подвесовский А. Г., Карпенко Е. В., Лагерев Д. Г., Бабурин А. Н.
АНСАМБЛЬ МОДЕЛЕЙ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА СОЦИОЛОГИЧЕСКИХ ДАННЫХ
(с. 43-52)

Аннотация. Предложен подход к обработке социологической информации, основанный на использовании методов интеллектуального анализа данных в целях обработки результатов анкетного опроса. Рассмотрены структура и особенности представления данных анкетирования респондентов. Обсуждены преимущества и целесообразность их обработки на основе объединения различных методов интеллектуального анализа в рамках ансамбля моделей. Структура ансамбля моделей основана на комбинировании и совместном использовании ассоциативных правил, алгоритмов кластеризации и деревьев решений, что позволяет совместно обрабатывать числовые и категориальные данные, содержащиеся в ответах респондента на вопросы анкеты, а также обеспечивает возможность интерпретации результатов кластеризации данных. Приведены результаты применения построенного ансамбля моделей для обработки и анализа данных социологического опроса, проводившегося в рамках ежегодного проекта мониторинга наркоситуации в Брянской области в 2013 – 2018 гг.

Ключевые слова:  социологическое исследование; интеллектуальный анализ данных; ассоциативные правила; кластеризация; деревья решений; ансамбль моделей.

 

Podvesovskii A. G., Karpenko E. V., Lagerev D. G., Baburin A. N.
ENSEMBLE MODELS FOR INTELLIGENT ANALYSIS OF SOCIOLOGICAL DATA
(pp. 43-52)

Abstract. The paper investigates an approach to sociological information processing based on the use of intelligent data analysis methods applied to the task of processing the results of a questionnaire survey. The advantages of intelligent analysis of sociological data in comparison with traditional statistical processing are discussed, as well as the implementation features and applicability limits of various intelligent data analysis methods in solving problems of association, clustering and classification. Structure and features of representation of respondents’ survey data are considered, the appropriateness is substantiated and the advantages of their processing based on the combination of various methods of intelligent analysis within an ensemble of models are discussed. A structure of an ensemble of models is proposed based on the combination and joint use of association rules, clustering algorithms and decision trees, which makes it possible to jointly process numerical and categorical data contained in the respondent’s answers to the questionnaire and also to interpret the results of data clustering. The paper describes the results of using the constructed ensemble of models for processing and analyzing the data of a sociological survey conducted as part of the annual project for monitoring the drug abuse situation in the Bryansk region in 2013 – 2018. The use of an ensemble of intelligent data analysis models for processing the results of a sociological survey not only makes it possible to detect patterns in them that cannot be otherwise detected by traditional methods of statistical processing, but also contributes to an increase in the reliability, completeness and coherence of the analysis results, due to which the analyst creates a holistic systemic picture of the studied social phenomenon or process.

Keywords: Sociological research; Intelligent data analysis; Association rules; Clustering; Decision trees; Ensemble models.

Рус

А. Г. Подвесовский (Брянский государственный технический университет, Брянск, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Е. В. Карпенко (Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации. Брянский филиал, Брянск, Россия),
Д. Г. Лагерев, А. Н. Бабурин (Брянский государственный технический университет, Брянск, Россия)

 

Eng

A. G. Podvesovskii (Bryansk State Technical University, Bryansk, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
E. V. Karpenko (The Russian Presidential Academy of National Economy and Public Administration. Bryansk Branch, Bryansk, Russia),
D. G. Lagerev, A. N. Baburin (Bryansk State Technical University, Bryansk, Russia)

 

Рус

1. Горшков М. К., Шереги Ф. Э. Прикладная социология: методология и методы: учеб. пособие. М., 2012. 404 с.
2. Михайленко Е. К. Социологические исследования как инструмент повышения качества власти // Мониторинг общественного мнения: Экономические и социальные перемены. 2016. № 2. С. 79 – 91.
3. Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям. 2-е изд., испр. СПб: Питер, 2013. 704 с.
4. Мосягин А. Б. Использование методологии Data Mining при решении задач обработки социальных данных // Мониторинг общественного мнения. 2015. № 2(126). С. 138 – 140.
5. Мальцева А. В., Шилкина Н. Е., Махныткина О. В. Data Mining в социологии: опыт и перспективы проведения исследования // Социологические исследования. 2016. № 3. С. 35 – 44.
6. Лагерев Д. Г. Проект «Мониторинг наркоситуации». Ч. 1: задача и исходные данные [Электронный ресурс]: URL: https://basegroup.ru/community/articles/monitoring-narko-1 (дата обращения: 20.07.2021).
7. Agrawal R., Srikant R. Fast Algorithms for Mining Association Rules // Proceedings of the 20th VLDB Conference. Santiago, Chile, 12 – 15 September 1994. P. 487 – 499.
8. Николенко С. И., Тулупьев А. Л. Самообучающиеся системы. М.: МЦНМО, 2009. 288 с.
9. Кластеризация [Электронный ресурс]. URL: https://wiki.loginom.ru/articles/clustering.html (дата обращения: 20.07.2021).
10. Кохонен Т. Самоорганизующиеся карты. М.: БИНОМ. Лаборатория знаний, 2008. 655 с.
11. Кластеризация категорийных данных: масштабируемый алгоритм CLOPE [Электронный ресурс]. URL: https://loginom.ru/blog/clope (дата обращения: 20.07.2021).
12. Yang Y., Guan H., You. J. CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data // Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Edmonton, Canada. 23 – 26 July 2002. P. 682 – 687.
13. Деревья решений (Decision trees) [Электронный ресурс]. URL: https://wiki.loginom.ru/articles/decision-trees.html (дата обращения: 20.07.2021).
14. Результаты мониторинга наркоситуации в Брянской области за 2018 год [Электронный ресурс]. URL: https://depbez.ru/anti-drug-commission-drug-prevention (дата обращения: 05.04.2021).
15. Подвесовский А. Г., Лагерев Д. Г. Опыт решения учебных и практических задач на аналитической платформе Deductor [Электронный ресурс]. URL: https://basegroup.ru/system/files/events/lagerev.pdf. (дата обращения: 20.07.2021).
16. Deductor. Продвинутая аналитика без программирования [Электронный ресурс]. URL: https://basegroup.ru/deductor/description (дата обращения: 20.07.2021).

Eng

1. Gorshkov M. K., Sheregi F. E. (2012). Applied Sociology: Methodology and Methods: a textbook. Moscow. [in Russian language]
2. Mihaylenko E. K. (2016). Sociological research as a tool for improving the quality of power. Monitoring obshchestvennogo mneniya: Ekonomicheskie i sotsial'nye peremeny, (2), pp. 79 – 91. [in Russian language]
3. Paklin N. B., Oreshkov V. I. (2013). Business Intelligence: From Data to Knowledge. 2nd ed. Saint Petresburg: Piter. [in Russian language]
4. Mosyagin A. B. (2015). Using the Data Mining methodology when solving problems of processing social data. Monitoring obshchestvennogo mneniya, 126(2), pp. 138 – 140. [in Russian language]
5. Mal'tseva A. V., Shilkina N. E., Mahnytkina O. V. (2016). Data Mining in Sociology: Experience and Research Prospects. Sotsiologicheskie issledovaniya, (3), pp. 35 – 44. [in Russian language]
6. Lagerev D. G. Drug Situation Monitoring Project. Part 1: task and initial data. Available at: https://basegroup.ru/community/articles/monitoring-narko-1 (Accessed: 20.07.2021). [in Russian language]
7. Agrawal R., Srikant R. (1994). Fast Algorithms for Mining Association Rules. Proceedings of the 20th VLDB Conference, pp. 487 – 499. Santiago.
8. Nikolenko S. I., Tulup'ev A. L. (2009). Self-learning systems. Moscow: MTsNMO. [in Russian language]
9. Clustering. Available at: https://wiki.loginom. ru/articles/clustering.html (Accessed: 20.07.2021). [in Russian language]
10. Kohonen T. (2008). Self-organizing cards. Moscow: BINOM. Laboratoriya znaniy. [in Russian language]
11. Clustering categorical data: the scalable CLOPE algorithm. Available at: https://loginom.ru/ blog/clope (Accessed: 20.07.2021). [in Russian language]
12. Yang Y., Guan H., You. J. (2002). CLOPE: A Fast and Effective Clustering Algorithm for Transactional Data. Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 682 – 687. Edmonton.
13. Decision trees. Available at: https://wiki. loginom.ru/articles/decision-trees.html (Accessed: 20.07.2021). [in Russian language]
14. Results of monitoring the drug situation in the Bryansk region for 2018. Available at: https://depbez.ru/ anti-drug-commission-drug-prevention (Accessed: 05.04.2021). [in Russian language]
15. Podvesovskiy A. G., Lagerev D. G. Experience in solving educational and practical problems on the analytical platform Deductor. Available at: https://basegroup.ru/system/files/events/lagerev.pdf. (Accessed: 20.07.2021). [in Russian language]
16. Deductor. Advanced analytics without coding. Available at: https://basegroup.ru/deductor/description (Accessed: 20.07.2021). [in Russian language]

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2021.09.pp.043-052

и заполните  форму 

Отправляя форму вы даете согласие на обработку персональных данных.

.

 

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

10.14489/vkit.2021.09.pp.043-052

and fill out the  form  

 

.

 

 

 
Search
Баннер
Баннер
Rambler's Top100 Яндекс цитирования