بناء موارد أساسية لتحليل الآراء والمشاعر الواردة في التعليقات باللغة العربية

ابراهيم حبيبي, عبد الحميد الجيهاد

Abstract


المستخلص - نهدف من هذه الورقة إبراز خطوات بناء بعض الموارد اللسانية التي من شأنها أن توظف في بناء البرمجيات والتطبيقات الخاصة بتحليل الآراء والمشاعر الواردة في المواقع ثم تقييمها، من بين الموارد التي قمنا ببنائها معجم متخصص يضم كلمات تستعمل في إبداء الآراء والتعبير عن المشاعر، ثم لائحة حروف المعاني التي تؤثر في تغيير توجيه التعابير العربية، بالإضافة إلى المدونة المعتمدة في اختبار برمجيات تحليل الآراء والمشاعر. وللتمكن من بناء الموارد السابقة الذكر، فقد ركزنا في البداية على المنهج الوصفي لرصد متطلبات بناء نظم تحليل الآراء والمشاعر، كما اعتمدنا على المنهج اليدوي والمنهج الآلي في إعداد كل من المعجم، ولائحة الحروف، والمدونة، فتمكنا من تشكيل معجم قارب 21453 مدخل معجمي، وإعداد لائحة ضمت 9784 حرفا، وجمع ما يقارب 100630 وسم منها %25 يدويا.

Keywords


تحليل الآراء والمشاعر، مدونة تحليل الآراء والمشاعر، نظرية الأبريسال، الحقول المعجمية، تأثير حروف المعاني،

Full Text:

PDF

References


A. Partington, “Corpora and discourse, a most congruous beast,” Corpora Discourse, pp. 11–20, Jan. 2004.

“NRC Emotion Lexicon.” http://saifmohammad.com/WebPages/NRC-Emotion-Lexicon.htm (accessed Mar. 29, 2020).

A. Abdaoui et al., “ADVANSE: Sentiment, Opinion and Emotion Analysis in French Tweets,” in DEFT: Défi Fouille de Texte, Caen, France, Jun. 2015, Accessed: Dec. 16, 2018. [Online]. Available: https://hal.archives-ouvertes.fr/hal-01222629.

A. Abdaoui, J. Azé, S. Bringay, and P. Poncelet, “FEEL: a French Expanded Emotion Lexicon,” Lang. Resour. Eval., vol. 51, no. 3, pp. 833–855, Sep. 2017.

http://www.lirmm.fr/~abdaoui/FEEL.csv (accessed Mar. 29, 2020).

T. Wilson, J. Wiebe, and P. Hoffmann, “Recognizing Contextual Polarity: An Exploration of Features for Phrase-Level Sentiment Analysis,” Comput. Linguist., vol. 35, pp. 399–433, Sep. 2009.

“MPQA Resources.” http://mpqa.cs.pitt.edu/ (accessed Mar. 29, 2020).

A. Bayoudhi, H. Koubaa, H. Ghorbel, and L. Hadrich Belguith, “Vers un lexique arabe pour l’analyse des opinions et des sentiments,” in Proc of the 5th International Conference on Arabic Language Processing CITALA, 2014, vol. 14.

A. Esuli and F. Sebastiani, “SentiWordNet: a high-coverage lexical resource for opinion mining,” Evaluation, vol. 17, pp. 1–26, 2007.

A. Esuli, “Automatic generation of lexical resources for opinion mining: models, algorithms and applications,” in ACM SIGIR Forum, 2008, vol. 42, pp. 105–106.

S. Alhazmi, “Arabic SentiWordNet in Relation to SentiWordNet 3.0,” p. 11, 2013.

A. karima and G. Y. Tlili, “L’application de la théorie de l’Appraisal pour l’identification de l’opinion dans le texte arabe.,” Int. Conf. Arab. Lang. Process., 2014, [Online]. Available: http://www.citala.org/citala2014/papers/paper_50.pdf.[13] A. Amar and A. Lachkar, “Vers la Construction d’un Lexique d’Appraisal en Langue Arabe pour l’Analyse des Sentiments dans les Réseaux Sociaux,” Ressour. Langagières L’arabe Pour TAL Constr. Stand. Gest. Exploit., p. 6, 2015.

S. Kiritchenko, S. Mohammad, and M. Salameh, “SemEval-2016 Task 7: Determining Sentiment Intensity of English and Arabic Phrases,” 2016, pp. 42–51.

R. Duwairi, R. Marji, N. Sha’ban, and S. Rushaidat, “Sentiment Analysis in Arabic tweets,” in 2014 5th International Conference on Information and Communication Systems, ICICS 2014, Apr. 2014, pp. 1–6.

F. T. AL-Khawaldeh, “A Study of the Effect of Resolving Negation and Sentiment Analysis in Recognizing Text Entailment for Arabic,” p. 5.

M. Rushdi-Saleh, M. T. Martín-Valdivia, L. A. Ureña-López, and J. M. Perea-Ortega, “OCA: Opinion corpus for Arabic,” J. Am. Soc. Inf. Sci. Technol., vol. 62, no. 10, pp. 2045–2054, Oct. 2011.

M. Nabil, M. Aly, and A. Atiya, “Astd: Arabic sentiment tweets dataset,” in Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 2015, pp. 2515–2519.

A. Mountassir, H. Benbrahim, and I. Berrada, “A cross-study of Sentiment Classification on Arabic corpora,” in Research and Development in Intelligent Systems XXIX, 2012, pp. 259–272.

A. Mountassir, H. Benbrahim, and I. Berrada, “An empirical study to address the problem of unbalanced data sets in sentiment classification,” in Systems, Man, and Cybernetics (SMC), 2012 IEEE International Conference on, 2012, pp. 3298–3303.

Asmaa MOUNTASSIR, “Arabic Sentiment Classification: Addressing the problems of Unbalanced Data sets and Huge Dimensionality,” Université Mohamed V, Rabat – Maroc, ENSIAS, 2015.

M. Abdul-Mageed, M. T. Diab, and S. Kübler, “SAMAR: Subjectivity and sentiment analysis for Arabic social media,” Comput. Speech Lang., vol. 28, pp. 20–37, 2014.

M. Abdul-Mageed, M. Diab, and S. Kübler, “SAMAR: Subjectivity and sentiment analysis for Arabic social media,” Comput. Speech Lang., vol. 28, no. 1, pp. 20–37, Jan. 2014.

M. Abdul-Mageed and M. T. Diab, “AWATIF: A Multi-Genre Corpus for Modern Standard Arabic Subjectivity and Sentiment Analysis.,” in LREC, 2012, pp. 3907–3914.

H. ElSahar and S. R. El-Beltagy, “Building Large Arabic Multi-domain Resources for Sentiment Analysis,” in CICLing, 2015.

E. Refaee and V. Rieser, “An Arabic Twitter Corpus for Subjectivity and Sentiment Analysis,” in LREC, 2014.

A. Assiri, A. Emam, and H. Al-Dossari, “Saudi twitter corpus for sentiment analysis,” Int. J. Comput. Electr. Autom. Control Inf. Eng. World Acad. Sci. Eng. Technol., vol. 10, pp. 242–245, 2016.

H. S. Ibrahim, S. M. Abdou, and M. Gheith, “MIKA: A tagged corpus for modern standard Arabic and colloquial sentiment analysis,” in 2015 IEEE 2nd International Conference on Recent Trends in Information Systems (ReTIS), Jul. 2015, pp. 353–358.

B. Liu, “Sentiment analysis and opinion mining,” Synth. Lect. Hum. Lang. Technol., vol. 5, no. 1, pp. 1–167, 2012.

N. Boudad, R. Faizi, R. Oulad Haj Thami, and R. Chiheb, “Sentiment analysis in Arabic: A review of the literature,” Ain Shams Eng. J., Jul. 2017.

F. H. H. Mahyoub, M. A. Siddiqui, and M. Y. Dahab, “Building an Arabic Sentiment Lexicon Using Semi-supervised Learning,” J. King Saud Univ. - Comput. Inf. Sci., vol. 26, no. 4, pp. 417–424, Dec. 2014.

S. R. El-Beltagy and A. Ali, “Open issues in the sentiment analysis of Arabic social media: A case study,” in 2013 9th International Conference on Innovations in Information Technology (IIT), Mar. 2013, pp. 215–220,

S. L. Lo, E. Cambria, R. Chiong, and D. Cornforth, “Multilingual sentiment analysis: from formal to informal and scarce resource languages,” Artif. Intell. Rev., vol. 48, no. 4, pp. 499–527, Dec. 2017.

M. A. K. Halliday and C. M. I. M. Matthiessen, An introduction to functional grammar, 3rd ed. London : New York: Arnold ; Distributed in the United States of America by Oxford University Press, 2004.

J. R. Martin and P. R. R. White, The language of evaluation: appraisal in English. New York: Palgrave Macmillan, 2005.

A. Mourad and K. Darwish, “Subjectivity and Sentiment Analysis of Modern Standard Arabic and Arabic Microblogs,” in Proceedings of the 4th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, Atlanta, Georgia, 2013, pp. 55–64, Accessed: Dec. 18, 2018. [Online]. Available: http://aclweb.org/anthology/W13-1608.

R. Mihalcea, C. Banea, and J. Wiebe, “Learning Multilingual Subjective Language via Cross-Lingual Projections,” in Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, Prague, Czech Republic, 2007, pp. 976–983, Accessed: Dec. 18, 2018. [Online]. Available: http://aclweb.org/anthology/P07-1123.

“أبجد.” https://www.abjjad.com/ (accessed Mar. 29, 2020).

“Goodreads | Meet your next favorite book.” https://www.goodreads.com/ (accessed Mar. 29, 2020).

“Hespress - هسبريس جريدة إلكترونية مغربية.” https://www.hespress.com/ (accessed Mar. 29, 2020).

“Using ParseHub – ParseHub Help Center.” https://help.parsehub.com/hc/en-us/categories/202638628-Using-ParseHub (accessed Mar. 29, 2020).

لطيفة ابراهيم النجار, دور البنية الصرفية في وصف الظاهرة النحوية وتقعيدها, الأولى. عمان - الأردن: دار البشير, 1994.

ميثاق علي عبد الزهرة الصيمري and عدنان عبد الكريم جمعـة, “أبنية المشتقات في نهج البلاغة دراسة دلالية,” جزء من متطلبات نيل درجة ماجستير في اللغة العربية وآدابها, كلية الآداب, البصرة, 2002.

“وحي القلم.” https://www.goodreads.com/work/best_book/2960155 (accessed Mar. 29, 2020).

محمد محي الدين عبد الحميد, دروس التصريف. بيروت - لبنان: المكتبة العصرية للطباعة والنشر, 1995.

إبراهيم الشمسان أبو أوس, أبنية الفعل دلالاتها وعلاقاتها, الأولى. جدة: دار المدني, 1407.

S. SARL, “قاموس معاجم قاموس عربي عربي, معجم عربي عربي.” https://www.maajim.com (accessed Mar. 29, 2020).

B. Heerschop, P. van Iterson, A. Hogenboom, F. Frasincar, and U. Kaymak, “Analyzing Sentiment in a Large Set of Web Data While Accounting for Negation,” in Advances in Intelligent Web Mastering – 3, vol. 86, Berlin, Heidelberg: Springer, Berlin, Heidelberg, 2011, pp. 195–205.