МАТНЛАРНИ ВЕКТОРЛАШНИ TF_IDF КВАНТ АЛГОРИТМИ
Keywords:
квант TF_IDF, матн таснифи, машинали ўқитиш, Decision Tree, Random Forest, Naive Bayes, матнли шикоятларAbstract
Ушбу мақолада матнли маълумотларни векторлашда квант ҳисоблашга асосланган TF_IDF алгоритмидан фойдаланиш таклиф этилган. Квант TF_IDF алгоритми ҳар бир сўз квант ҳолатларини векторлар орқали ифодалашга имкон беради. Тажрибалар учун реал шикоятлар тўплами олинган бўлиб, хизмат турлари бўйича таснифланган. Классик ва квант TF_IDF алгоритми орқали шакллантирилган белгилар асосида Decison Tree, Random Forest ва Naive Bayes усулларида таснифлаш амалга оширилган. Натижада квант TF_IDF алгоритми классик алгоритмига нисбатан ўртача 11,9 % юқори аниқликни таъминлашини кўрсатди. Таниб олишда эса Decision Tree усули энг юқори (94 %) аниқликни таъминлади. Тадқиқот квант векторлаш алгоритмларини классик векторлаш алгоритмларига нисбатан самарали ишлашини кўрсатди ҳамда табиий тилни қайта ишлаш вазифаларида истиқболли ечим эканлигини кўрсатди.
References
Cambria E., Schuller B., Xia Y., Havasi C. New Avenues in Opinion Mining and Sentiment Analysis // IEEE Intelligent Systems. – 2013. – Vol. 28, No. 2. – P. 15–21.
N. A. Niyozmatova, N. S. Mamatov, B. I. Otaxonova, A. N. Samijonov and K. K. Erejepov, "Classification Based On Decision Trees And Neural Networks," 2021 International Conference on Information Science and Communications Technologies (ICISCT), Tashkent, Uzbekistan, 2021, pp. 01-04, doi: 10.1109/ICISCT52966.2021.9670345.
Babomuradov O. O. J. et al. Text documents classification in Uzbek language //International journal of recent technology and engineering. – 2019. – Т. 8. – №. 2S11. – С. 3787-3789.
Manning C. D., Raghavan P., Schütze H. Introduction to Information Retrieval. – Cambridge University Press, 2008.
Babomuradov, O. J., Mamatov, N. S., Boboyev, L. B., & Otaxonova, B. I. (2019). Classification of texts using decision trees algorithms. Descendants of Muhammad al-Khwarizmi, 4(10).
Бабомурадов О. Ж. и др. Қарор дарахти алгоритмидан фойдаланиб матнларни таснифлаш //Мухаммад ал-Хоразмий авлодлари. – 2019. – №. 4 (10). – С. 22.
Mamatov N. S. et al. Algorithm for analysis of texts in Uzbek language //Artificial Intelligence and Information Technologies. – CRC Press, 2025. – С. 511-515.
Ниёзматова Н. А. и др. Матнларни таснифлашда информатив белгилар мажмуасини аниқлаш усуллари.
Ahmadi M. et al. Leveraging Large Language Models for Cybersecurity: Enhancing SMS Spam Detection with Robust and Context-Aware Text Classification //arXiv preprint arXiv:2502.11014. – 2025.
Das M. et al. A comparative study on tf-idf feature weighting method and its analysis using unstructured dataset //arXiv preprint arXiv:2308.04037. – 2023.
Mamatov N. S. et al. Algorithm for analysis of texts in Uzbek language //Artificial Intelligence and Information Technologies. – CRC Press, 2025. – С. 511-515.
Sebastiani F. Machine Learning in Automated Text Categorization // ACM Computing Surveys. – 2002. – Vol. 34, No. 1. – P. 1–47.
Тургунов Б. Х. У. и др. АЛГОРИТМЫ ОТДЕЛЕНИЯ ФАКТОВ ОТ ИНФОРМАЦИИ НА УЗБЕКСКОМ ЯЗЫКЕ ИЗ ЗАЯВЛЕНИЙ, ПОЛУЧЕННЫХ ОТ ВИРТУАЛЬНЫХ ПРИЕМНЫХ //Universum: технические науки. – 2023. – №. 12-2 (117). – С. 9-11.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Ниёзматова Нилуфар Аълохановна, Турғунова Нафисахон Махаммаджон қизи

This work is licensed under a Creative Commons Attribution 4.0 International License.