 |
Е. В. Дегтярева, Е. Н. Крючкова "Модели и методы автоматического сравнительного семантического анализа научных текстов" |
 |
Аннотация.
В статье изложен общий подход к реализации алгоритмов сравнительного анализа научных текстов как с позиции их общего содержания, так и с позиции динамической последовательности семантики фрагментов текста. Предлагаемые алгоритмы сравнительного анализа научных текстов основаны на кластеризации семантических графов, построенных методом объединения информации, извлеченной из текста публикации с общедоменной семантикой научной области. Обсуждаются подходы к выделению динамической подпоследовательности семантически схожих фрагментов, приводятся схемы вычисления коэффициентов корреляции. Приведенные в статье результаты экспериментов статического и динамического сравнительного анализа публикаций в области математики сопровождаются графическим иллюстративным материалом.
Ключевые слова:
аспектно-ориентированный анализ, научный лексикон, семантический граф, классификация научных текстов.
DOI 10.14357/20718632250302
EDN KYTZUH
Стр. 13-21.
Литература
1. Бручес Е. П., Батура Т. В. Метод автоматического извлечения терминов из научных статей на основе слабоконтролируемого обучения // Вестник НГУ, Серия: Информационные технологии. 2021. Т.19, №2. С. 5–16. 2. Морозов Д. А., Глазкова А. В., Тютюльников М. А., Иомдин Б. Л. Генерация ключевых слов для аннотаций русскоязычных научных статей // Вестник НГУ, Серия: Лингвистика и межкультурная коммуникация. 2023. Т. 21, № 1. С. 54–66. 3. Altmami N., Menai M. Automatic Summarization of Scientific Articles: A Survey // Journal of King Saud University - Computer and Information Sciences, 2020, v. 34, pp. 1011-1028. 4. Benites F. Information Retrieval and Knowledge Extraction for Academic Writing // Digital Writing Technologies in Higher Education. 2023. P. 303-315. 5. Qurashi A. W., Holmes V., Johnson A. P. Document Processing: Methods for Semantic Text Similarity Analysis // International Conference on INnovations in Intelligent SysTems and Applications, Serbia. 2020. P. 1-6. 6. Sanchez-Gomez J. M., Vega-Rodríguez M. A., Pérez C. J. The impact of term-weighting schemes and similarity measures on extractive multi-document text summarization // Expert Systems with Applications. 2021. V. 169. 7. Seki K. Cross-lingual text similarity exploiting neural machine translation models // Journal of Information Science. 2021. V. 47, no. 3. P. 404–418. 8. Ji M., Zhang X. A Short Text Similarity Calculation Method Combining Semantic and Headword Attention Mechanism // Scientific Programming. 2022. URL: https://onlinelibrary.wiley.com/doi/10.1155/2022/8252492. 9. Inan E. SimiT: A Text Similarity Method Using Lexicon and Dependency Representations // New Generation Computing. 2020. V. 38, no. 3. P. 509–530. 10. Islam A., Inkpen D. Semantic text similarity using corpusbased word similarity and string similarity // ACM Transactions on Knowledge Discovery from Data, 2008. URL:https://www.academia.edu/4418471/Semantic_text_similarity_using_ corpus_based_word_similarity_and_string_similarity. 11. Вопилова Е.В., Крючкова Е.Н. Методы автоматического анализа динамики изложения информации в текстах на основе адаптируемых словарей научных терминов // Программная инженерия. 2024. Т. 15, №4. С. 206-215. 12. Вопилова Е.В., Крючкова Е.Н. Методы и алгоритмы автоматического извлечения информации из научных текстов для создания тезауруса научной терминологии // Интеллектуальные системы. Теория и приложения. 2024. Т. 28, №4. 13. Виноградов И.М. (ред.) Математическая энциклопедия в 5 томах, Москва, Сов. Энциклопедия, 1977. 14. Загребина С.А., ред. Вестник Южно-Уральского университета, серия «Математика. Механика. Физика». 2022. Т. 14, №2-4. URL: https://vestnik.susu.ru/mmph/. 15. Математический сборник: научный журнал, учредитель Математический институт им. В.А. Стеклова Российской академии наук. 2019. URL: http://www.mathnet.ru/msb.
|