ВИБІР МАТЕМАТИЧНОГО АПАРАТУ ДЛЯ ПОБУДОВИ ВЕКТОРНОЇ МОДЕЛІ ТЕКСТОВИХ ПОВІДОМЛЕНЬ ДЛЯ НАВЧАННЯ ГЛИБОКОЇ НЕЙРОННОЇ МЕРЕЖІ ПРОГНОЗУВАННЮ НЕСПРИЯТЛИВИХ АВІАЦІЙНИХ ПОДІЙ В ПОЛЬОТІ
DOI:
https://doi.org/10.26906/SUNZ.2019.2.018Ключові слова:
безпека польотів, прогнозування, векторна модель текстових повідомлень, глибока нейронна мережа, CBOW, TF-ICFАнотація
В роботі проводиться дослідження і вибір математичного апарату для побудови словника і векторної моделі текстових повідомлень для навчання глибокої гібридної нейронної мережі прогнозуванню несприятливих авіаційних подій в польоті. Для визначення вагових значень слів в текстових повідомленнях про несприятливі авіаційнї події в польоті при формуванні словника аналізуються вагові моделі на основі мір TF-IDF, TF-RF і TF-ICF. У якості методів векторного представлення текстової інформації в роботі досліджуються: «мішок слів», латентно-семантичний аналіз (Latent semantic analysis (LSA)), моделі векторного уявлення Word2Vec, Global Vectors (GloVe) та Doc2Vec. В результаті аналізу вказаних моделей і методів в якості базового підходу до формування словника уніграмм (біграмм) пропонується використовувати міру TF-ICF, а в якості моделі векторного уявлення слів (словосполучень) пропонується використовувати модель CBOW.Завантаження
Посилання
Григорків В.С. Нейронні мережі та їхнє використання для прогнозування тенденцій ринку нерухомості // В.С. Григорків, О.І. Ярошенко, Н.В. Філіпчук / Науковий вісник НЛТУ України. – 2012. – Вип. 22.5. – С. 328-33.
Y. Kim. Convolutional neural networks for sentence classification. arXiv:1408.5882 [cs.CL], 2014.
C. Olah. Neural networks, recurrent neural networks, convolutional neural networks. Ел. ресурс/ http://colah.github.io.htm/
Крейнес М. Г. Модели текстов и текстовых коллекций для поиска и анализа информаци // М. Г. Крейнес / Матем. модел. эколого-экономич. систем: экономика ТРУДЫ МФТИ. – 2017. – Том 9( 3). – С. 132-142.
Reed J.W., Jiao Y., Potok T.E., Klump B.A., Elmore M.T., Hurson A.R. TF-ICF: A New Term Weighting Scheme for Clustering Dynamic Data Streams // In: Proc.Machine Learning and Applications (ICMLA '06). 2006. pp. 258–263.
П.Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из даннях / пер. с англ А.А.Слинкина. ̶ М.: ДМК Пресс, 2015. ̶ 400 с.
Mikolov T. Distributed representations of words and phrases and their compositionality / T.Mikolov, I.Sutskever, K.Chen, G.S. Corrado, J. Dean // Advances in neural information processing systems. 2013. P. 3111–3119.
Борисов Е.С.Автоматизированная обработка текстов на естественном языке, с использованием инструментов языка Python /Електронний ресурс/ http://mechanoid.kiev.ua/ml-text-proc.htm.