Gii thiu cc hng nghin cu Nhm nghin

  • Slides: 13
Download presentation
Giới thiệu các hướng nghiên cứu Nhóm nghiên cứu NLP@MMLab UIT - NLP 1

Giới thiệu các hướng nghiên cứu Nhóm nghiên cứu NLP@MMLab UIT - NLP 1

Người hướng dẫn o Trưởng nhóm n TS. Nguyễn Lưu Thùy Ngân o Giảng

Người hướng dẫn o Trưởng nhóm n TS. Nguyễn Lưu Thùy Ngân o Giảng viên Khoa học Máy tính o Trưởng phòng Đào tạo Đại học o Thành viên n Nguyễn Văn Kiệt o Bộ môn Khoa học và Kỹ thuật Thông tin o Lĩnh vực nghiên cứu n n Xử lý văn bản Khai thác thông tin từ văn bản Dịch tự động Hệ thống hỏi đáp UIT - NLP 2

1. Phân tích ngữ pháp tiếng Việt (Vietnamese parsing) o o Phân tích ngữ

1. Phân tích ngữ pháp tiếng Việt (Vietnamese parsing) o o Phân tích ngữ pháp tiếng Việt là kỹ thuật nền tảng của nhiều ứng dụng XLNNTN. Mục tiêu n Nghiên cứu các thuật toán phân tích ngữ pháp tiếng Việt. n Các loại phân tích cú pháp: Dependency Structure, Phrase. Structure, CCG. Đề tài cử nhân/thạc sĩ: n Cài đặt thử nghiệm một số thuật toán phân tích ngữ pháp tiên tiến. Tham khảo n n Kiet Van Nguyen, Ngan Luu Thuy Nguyen, Error Analysis for Vietnamese Dependency Parsing, The 7 th International Conference on Knowledge and System Engineering(KSE), 10 -2015, Hochiminh, Vietnam. Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Utilizing State-of-the-art Parsers to Diagnose Problems in Treebank Annotation for a Less Resourced Language, The 7 th Linguistic Annotation Workshop & Interoperability with Discourse(LAW 7), 08 -2013, Sofia, Bulgaria UIT - NLP 3

2. Hỗ trợ viết tiếng Anh (Writing assistance) o Mục tiêu: Nghiên cứu các

2. Hỗ trợ viết tiếng Anh (Writing assistance) o Mục tiêu: Nghiên cứu các kỹ thuật ứng dụng XLNNTN để hỗ trợ người nước ngoài viết tiếng Anh. o Số lượng đề tài: 2. o Đề tài cử nhân/thạc sĩ § § § Thuật toán sửa lỗi chính tả, ngữ pháp (grammar checking). Thuật toán sửa lỗi văn phong (style checking). Xây dựng phần mềm hỗ trợ. o Tham khảo § Ngan Nguyen, Yusuke Miyao, Alignment-based Annotation of Proofreading Texts toward Professional Writing Assistance, The 6 th International Joint Conference on Natural Language Processing(IJCNLP 2013), 2013, Nagoya, Japan UIT - NLP 4

3. Phân tích cảm xúc (Sentiment Analysis) o Mục tiêu: + Nghiên cứu kỹ

3. Phân tích cảm xúc (Sentiment Analysis) o Mục tiêu: + Nghiên cứu kỹ thuật rút trích quan điểm từ văn bản. + Ứng dụng phân tích cảm xúc vào một số lĩnh vực: Thương mại điện tử, giáo dục, mạng xã hội. o Số lượng đề tài: 2. o Đề tài cử nhân/thạc sĩ §Ứng dụng phân tích cảm xúc và việc xây dựng hệ thống đánh giá phản hồi của sinh viên. §Phân tích cảm xúc các post trên mạng xã hội. §Phân tích quan điểm từ các post trên forum. §Hệ thống lắng nghe đánh giá trên một số sản phẩm/chương trình: điện thoại di động, laptop, gameshow. UIT - NLP 5

4. Dịch tự động Việt-Nhật (Vietnamese. Japanese machine translation) o Mục tiêu: Nghiên cứu

4. Dịch tự động Việt-Nhật (Vietnamese. Japanese machine translation) o Mục tiêu: Nghiên cứu kỹ thuật dịch tự động Việt-Nhật, Nhật-Việt. o Số lượng đề tài: 2. o Yêu cầu thêm: Biết căn bản tiếng Nhật hoặc sẵn sàng học thêm tiếng Nhật. o Đề tài cử nhân/thạc sĩ § § Xây dựng dữ liệu song ngữ phục vụ nghiên cứu Cài đặt thử nghiệm các thuật toán dịch tự động UIT - NLP 6

5. Hệ thống hỏi đáp tự động (Question Answering) o Mục tiêu: Xây dựng

5. Hệ thống hỏi đáp tự động (Question Answering) o Mục tiêu: Xây dựng hệ thống hỏi đáp trên một lĩnh vực cụ thể. o Số lượng đề tài: 2. o Đề tài cử nhân § § § Xây dựng dữ liệu phục vụ nghiên cứu – Question Treebank. Tiếp cận theo cú pháp (syntax) và ngữ nghĩa (semantic). Tiếp cận theo Linked Data. UIT - NLP 7

6. Yêu cầu đối với sinh viên o Yêu cầu chung đối với các

6. Yêu cầu đối với sinh viên o Yêu cầu chung đối với các bạn sinh viên: n Đăng kí từ đầu học kỳ 5. Có thể sớm hơn càng tốt. n Có kĩ năng lập trình tốt: C++, Java, hoặc Python. n Tiếng Anh đọc hiểu được. n Ham học hỏi, kiên trì. n Tuân thủ kỉ luật làm việc của nhóm. n Nếu có kiến thức nền tảng về xử lí ngôn ngữ tự nhiên, nhận dạng, máy học là một lợi thế. UIT - NLP 8

7. Lợi ích o Học tập và nghiên cứu theo kế hoạch. o Được

7. Lợi ích o Học tập và nghiên cứu theo kế hoạch. o Được cấp và sử dụng máy ảo với cấu hình cao. o Có cơ hội viết báo khoa học tham gia các hội nghị khoa học/tạp chí trong và ngoài nước. UIT - NLP 9

8. Thông tin liên hệ o Cô Nguyễn Lưu Thùy Ngân § Email: ngannlt@uit.

8. Thông tin liên hệ o Cô Nguyễn Lưu Thùy Ngân § Email: ngannlt@uit. edu. vn o Thầy Nguyễn Văn Kiệt § Email: kietnv@uit. edu. vn § Số điện thoại: 098. 660. 4744 UIT - NLP 10

Công trình đã công bố (1) o o o o o International Journals 1.

Công trình đã công bố (1) o o o o o International Journals 1. Ngan Nguyen, Jin-Dong Kim, Makoto Miwa, Takuya Matsuzaki, Tsujii Junichi, Protein Coreference Resolution by Simple Semantic Classification, BMC Bioinformatics(BMC Bioinformatics), 3. 02, 2012, 1471 -2105 2. Jin-Dong Kim, Nguyen Ngan, Yue Wang Yue, Junichi Tsujii, Toshihisa Takagi, Akinori Yonezawa, The Genia Event and Protein Coreference tasks of Bio. NLP Shared Task 2011, BMC Bioinformatics (BMC Bioinformatics ), 13, 8, 2012 National Journals International Conferences/Workshops 1. Kiet Van Nguyen, Ngan Luu Thuy Nguyen, Error Analysis for Vietnamese Dependency Parsing, The 7 th International Conference on Knowledge and System Engineering(KSE), 10 -2015, Hochiminh, Vietnam 2. Nhi-Thao-Thi Tran, Minh Quoc Nghiem and Ngan Luu-Thuy Nguyen, Improving Vietnamese Sentence Compression by Segmenting Meaning Chunks, The 7 th International Conference on Knowledge and System Engineering(KSE), 10 -2015, Hochiminh, Vietnam 3. Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Utilizing State-of-the-art Parsers to Diagnose Problems in Treebank Annotation for a Less Resourced Language, The 7 th Linguistic Annotation Workshop & Interoperability with Discourse(LAW 7), 08 -2013, Sofia, Bulgaria 4. Ngan Nguyen, Yusuke Miyao, Alignment-based Annotation of Proofreading Texts toward Professional Writing Assistance, The 6 th International Joint Conference on Natural Language Processing(IJCNLP 2013), 2013, Nagoya, Japan 5. Xinjian Li, Tian Ran, Ngan Nguyen, Yusuke Miyao và Aizawa Akiko, Question Answering System for Solving Entrance Exams in QA 4 MRE, Conference and Labs of the Evaluation Forum 2013(CLEF 2013), 09 -2013, Valencia, Spain UIT - NLP 11

Công trình đã công bố (2) o o o o National Journals/International Conferences/Workshops 6.

Công trình đã công bố (2) o o o o National Journals/International Conferences/Workshops 6. Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Comparing Different Criteria for Vietnamese Word Segmentation, Workshop on South and Southeast Asian Natural Language Processing (SSANLP 2012 ), 2012, Bombay, India 7. Ngan Nguyen, Jin-Dong Kim và Junichi Tsujii, Overview of the Protein Coreference Task in Bio. NLP Shared Task 2011, Proceedings of Bio. NLP Shared Task 2011 Workshop, 06 -2011, Portland, Oregon, United States 8. Yoshinobu Kano, Ngan Nguyen, Rune Sætre, K. Yoshida, Y. Miyao, Yoshimasha Tsuruoka, Yuichiro Matsubayashi, Sophia Ananiadou và Junichi Tsujii, Filling the Gaps Between Tools and Users: A Tool Comparator, Using Protein-Protein Interactions as an Example, The Pacific Symposium on Biocomputing(PSB), 01 -2008, Hawaii, United States 9. Yoshinobu Kano, Ngan Nguyen, Rune Sætre, Keiichiro Fukamachi, Kazuhiro Yoshida, Yusuke Miyao, Yoshimasa Tsuruoka, Sophia Ananiadou và Jun'ichi Tsujii, Sharable type system design for tool interoperability and combinatorial comparison, The First International Conference on Global Interoperability for Language Resources (ICGL), 01 -2008, -, Hong Kong 10. Yoshinobu Kano, Ngan Nguyen, Rune Sætre, K. Yoshida, K. Fukamachi, Yusuke Miyao, Yoshimasha Tsuruoka, Sophia Ananiadou and Junichi Tsujii, Towards Data And Goal Oriented Analysis: Tool Inter-Operability And Combinatorial Comparison, The 3 rd International Joint Conference on Natural Language Processing (IJCNLP 2008), 2008, Hyderabad, India 11. Nguyen Ngan, Jin-Dong Kim and Junichi Tsujii, Challenges in Pronoun Resolution System for Biomedical Text, The 6 th edition of the Language Resources and Evaluation(LREC), 052008, Marrakech, Morocco 12. Ngan Nguyen, Jin-Dong Kim, Exploring Domain Differences for the Design of a Pronoun Resolution System for Biomedical Texts, The 22 nd International Conference on Computational Linguistics 2008(COLING 2008), 2008, Manchester, United Kingdom UIT - NLP 12

Công trình đã công bố (3) o o o o National Journals/International Conferences/Workshops 13.

Công trình đã công bố (3) o o o o National Journals/International Conferences/Workshops 13. Quang Do, Ngan Nguyen, Dien Dinh, An Advanced Approach in English-Vietnamese Syntactic Tree Transfer, Recent Advances in Natural Language Processing(RANLP), 09 -2005, Borovets, Bulgaria 14. Dien Dinh, Ngan Nguyen, Quang Do, Nam Van, A Hybrid Approach to Word Order Transfer in English to Vietnamese Machine Translation, Machine Translation Summit IX(MT Summit), 09 -2003, Louisiana, United States 15. Dien Dinh , Ngan Nguyen, Quang Do, Word Alignment in English-Vietnamese Bilingual Corpus, International Conference on East-Asian Language Processing and Internet Information Technology (EALPIIT), 01 -2002, Hà Nội, Vietnam National Conferences/Workshops 1. Ngan Nguyen, Ngan Nguyen và Yusuke Miyao, A Corpus for Studies on Academic Writing Assistance, The 27 th Annual Conference of the Japanese Society for Artificial Intelligence 2013(JSAI 2013), 052013, Nagoya, Japan 2. Ngan Nguyen, Yusuke Miyao, Jin-Dong Kim và Jun'ichi Tsujii, Machine Learning-Based Pronoun Resolution for Biomedical Text, The 14 th Natural Language Processing Conference(NLP 2008), 03 -2008, Tokyo, Japan UIT - NLP 13