|
Аннотация.
Статья посвящена актуальной проблеме построения вполне интерпретируемых линейных регрессий с помощью аппарата частично булевого линейного программирования. Технология решения таких задач подразумевает в настоящее время применение решателя LPSolve. Цель данной работы состоит в проведении сравнительного анализа эффективности двух методов построения вполне интерпретируемых линейных регрессий: метода всех возможных регрессий с использованием пакета Gretl и основанного на задаче частично булевого линейного программирования метода с использованием решателя COPT. В результате решения 250-ти оптимизационных задач по выборкам большого объема производительность решателя COPT во всех случаях оказалась выше (иногда в сотни раз). Уточнена эффективность основанного на решении задач частично булевого линейного программирования метода.
Ключевые слова:
регрессионный анализ, линейная регрессия, интерпретируемость, отбор информативных регрессоров, метод наименьших квадратов, задача частично булевого линейного программирования, эффективность.
DOI 10.14357/20718632260114
EDN RVRAJB
Стр. 154-166.
Литература
1. Afzal S., Shokri A., Ziapour B.M., Shakibi H., Sobhani B. Building energy consumption prediction and optimization using different neural network-assisted models; comparison of different networks and optimization algorithms // Engineering Applications of Artificial Intelligence. 2024. Vol. 127. P. 107356. https://doi.org/10.1016/j.engappai.2023.107356 2. Ma X., Zou B., Deng J., Gao J., Longley I., Xiao S., Guo B., Wu Y., Xu T., Xu X., Yang X., Wang X., Tan Z., Wang Y., Morawska L., Salmond J. A comprehensive review of the development of land use regression approaches for modeling spatiotemporal variations of ambient air pollution: A perspective from 2011 to 2023 // Environment international. 2024. Vol. 183. P. 108430. https://doi.org/10.1016/j.envint.2024.108430 3. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998. 1005 с. 4. Носков С.И. Технология моделирования объектов с нестабильным функционированием и неопределенностью в данных. Иркутск: Облинформпечать, 1996. 320 с. 5. Koch T., Berthold T., Pedersen J., Vanaret C. Progress in mathematical programming solvers from 2001 to 2020 // EURO Journal on Computational Optimization. 2022. Vol. 10. P. 100031. https://doi.org/10.1016/j.ejco.2022.100031 6. Eifler L., Gleixner A. A computational status update for exact rational mixed integer programming // Mathematical Programming. 2023. Vol. 197. No. 2. P. 793–812. https://doi.org/10.1007/s10107-021-01749-5 7. Scavuzzo L., Aardal K., Lodi A., Yorke-Smith N. Machine learning augmented branch and bound for mixed integer linear programming // Mathematical Programming. 2024. P. 1–44. https://doi.org/10.1007/s10107-024-02130-y 8. Konno H., Yamamoto R. Choosing the best set of variables in regression analysis using integer programming // Journal of Global Optimization. 2009. Vol. 44. P. 273–282. https://doi.org/10.1007/s10898-008-9323-9 9. Ahari S.A., Kocuk B. A mixed-integer exponential cone programming formulation for feature subset selection in logistic regression // EURO Journal on Computational Optimization. 2023. Vol. 11. P. 100069. https://doi.org/10.1016/j.ejco.2023.100069 10. Lee H., Park Y.W. Integrated subset selection and bandwidth estimation algorithm for geographically weighted regression // Pattern Recognition. 2025. Vol. 165. P. 111589. https://doi.org/10.1016/j.patcog.2025.111589 11. Базилевский М.П. Сведение задачи отбора информативных регрессоров при оценивании линейной регрессионной модели по методу наименьших квадратов к задаче частично-булевого линейного программирования // Моделирование, оптимизация и информационные технологии. 2018. Т. 6. № 1 (20). С. 108–117. EDN: XOFRXV. 12. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 303 с. 13. Базилевский М.П. Программа построения вполне интерпретируемых элементарных и неэлементарных квазилинейных регрессионных моделей // Труды Института системного программирования РАН. 2023. Т. 35. № 4. С. 129–144. EDN: KTOSCW. https://doi.org/10.15514/ISPRAS-2023-35(4)-7 14. Базилевский М.П. Применение математического программирования для выбора оптимальных структур многомерных линейных регрессий // Информационные технологии и вычислительные системы. 2024. № 4. С. 32–45. EDN: BBFOVP. https://doi.org/10.14357/20718632240404 15. Базилевский М.П. Сравнительный анализ эффективности методов построения вполне интерпретируемых линейных регрессионных моделей // Моделирование и анализ данных. 2023. Т. 13. № 4. С. 59–83. EDN: VXFGBO. https://doi.org/10.17759/mda.2023130404 16. Lpsolve. Mixed integer linear programming solver [Электронный ресурс]. URL: https://sourceforge.net/projects/lpsolve/ (дата обращения: 07.07.2025). 17. Ge D., Huangfu Q., Wang Z., Wu J., Ye Y. Cardinal Optimizer (COPT) user guide [Электронный ресурс]. URL: https://guide.coap.online/copt/en-doc (дата обращения: 07.07.2025). 18. Knowledge Extraction based on Evolutionary Learning [Электронный ресурс]. URL: https://sci2s.ugr.es/keel/dataset.php?cod=93 (дата обращения 07.07.2025). 19. UCI Machine Learning Repository [Электронный ресурс]. URL: https://archive. ics.uci.edu/dataset/464/superconductivty+data (дата обращения 07.07.2025). 20. UCI Machine Learning Repository [Электронный ресурс]. URL: https://archive. ics.uci.edu/dataset/437/residential+building+data+set (дата обращения 07.07.2025). 21. UCI Machine Learning Repository [Электронный ресурс]. URL: https://archive. ics.uci.edu/dataset/203/yearpredictionmsd (дата обращения 07.07.2025).
|