logo

Đề tài Luận văn Cao học công nghệ thông tin năm học 2007-2008 tại ĐHBK TP HCM

Kỹ thuật đánh giá khả năng trùng khớp. của hai phần mềm từ đó dự đoán khả ... thuộc thời gian, các hệ thống quản lý dữ liệu y học 3 chiều phụ thuộc thời gian, ...
Đề tài Luận văn Cao học CNTT năm học 2007-2008 tại ĐHBK TP HCM GVHD: TS. Nguyễn Hứa Phùng Đề 1: Software Verification là kỹ thuật xác định xem một phần mềm thỏa mãn các yêu cầu thiết kế. Kỹ thuật này đòi hỏi xác định một phương pháp mô tả các yêu cầu thiết kế và một cơ chế suy diễn để thực hiện quá trình chứng minh. Yêu cầu: Sinh viên cần có kiến thức cơ bản về logic toán Giai đoạn làm đề cương: - Tìm hiểu lý thuyết về software verification - Tìm hiểu một số phương pháp mô tả hiện có - Tìm hiểu các cơ chế suy diễn hiện có - Xác định phạm vi nghiên cứu Giai đoạn làm luận văn: - Phát triển một mô hình thích hợp - Hiện thực chương trình - Thử nghiệm Đề 2: Plagiarism Detection là kỹ thuật phát hiện sao cắp phần mềm. Kỹ thuật đánh giá khả năng trùng khớp của hai phần mềm từ đó dự đoán khả năng sao cắp. Giai đoạn làm đề cương: - Tìm hiểu về các kỹ thuật Plagiarism Detection hiện có - Tìm hiểu một số phần mềm hiện có - Xác định phạm vi nghiên cứu Giai đoạn làm luận văn: - Phát triển một mô hình thích hợp - Hiện thực chương trình - Thử nghiệm Đề 3: Tìm hiểu mô hình vi xử lý họ ARM và phát triển trình biên dịch cho ARM dựa trên gcc. Giai đoạn làm đề cương: - Tìm hiểu về đặc tính của vi xử lý họ ARM - Tìm hiểu cơ chế sinh trình biên dịch của gcc - Tìm hiểu các đặc tả hiện có của ARM trên gcc - Xác định phạm vi nghiên cứu Giai đoạn làm luận văn: - Đề xuất một giải pháp thích hợp - Hiện thực chương trình - Thử nghiệm GVHD: TS. Quản Thành Thơ Đề 1: Xây dựng một chương trình dạy học lái xe thông minh dựa trên luật. Sinh viên đăng ký: Lê Anh Vũ Đề 2: Xây dựng một kiến trúc cập nhật động nội dung trang Web theo hướng tiếp cận sử dụng các dịch vụ Web có ngữ nghĩa thông qua các mô tả bằng ngôn ngữ tự nhiên Sinh viên đăng ký: Nguyễn Bảo Toàn Đề 3: Xây dựng chương trình phát hiện các mẫu quảng cáo được lặp lại nhiều lần trong các chương trình MP3 podcasting Đồng hướng dẫn: Tiến sĩ Nguyễn Minh Nhựt (Đại học Công nghệ Nanyang, Singapore) Sinh viên đăng ký: Phan Thanh Cao GVHD: PGS. TS. Cao Hoàng Trụ Hướng nghiên cứu: Web ngữ nghĩa 1. Gom cụm mờ tài liệu theo thực thể có tên và từ khoá Tham khảo: Cao, T.H. & Do, H.T. & Hong, D.T. & Quan, T.T. (2008), Fuzzy Named Entity-Based Document Clustering. In Proc. of the 17th IEEE International Conference on Fuzzy Systems. 2. Nhận diện quan hệ giữa các thực thể có tên trên văn bản Tham khảo: Cao Duy Trường (2008). Dịch câu truy vấn tiếng Anh sang đồ thị khái niệm: cách tiếp cận ít phụ thuộc cú pháp. Luận văn Cao học, Khoa KH&KT Máy tính, ĐHBK TP.HCM. 3. Dịch câu truy vấn tiếng Anh có liên từ luận lý, tính từ, và lượng từ sang đồ thị khái niệm Tham khảo: Cao Duy Trường (2008). Dịch câu truy vấn tiếng Anh sang đồ thị khái niệm: cách tiếp cận ít phụ thuộc cú pháp. Luận văn Cao học, Khoa KH&KT Máy tính, ĐHBK TP.HCM. GVHD: TS. Đặng Trần Khánh Đề tài 1: Đặng Trần Trí Bảo mật dựa trên trực quan hóa cho các ứng dụng chia sẻ tài nguyên ngang hàng. (Security Visualization for Peer-to-Peer Resource Sharing Applications) Yêu cầu: Trực quan hóa các vấn đề bảo mật trong hệ thống là một hướng nghiên cứu mới và đang thu hút được sự quan tâm rất lớn của cộng đồng các nhà/nhóm nghiên cứu về bảo mật trên thế giới. Trong đề tài này, học viên phải nghiên cứu về security visualization và ứng dụng vào việc xây dựng một framework hỗ trợ bảo mật dựa trên security visualization cho các ứng dụng chia sẻ tài nguyên ngang hàng (peer-to-peer). Sau đó cần áp dụng các kết quả nghiên cứu vào một bài toán và môi trường cụ thể (vd resource sharing for a group of peer-to-peer users using Windows Vista, …). Đề tài 2: Đàm Khánh Quốc Minh Bảo vệ tính riêng tư trong các dịch vụ dựa trên vị trí với thiết bị di động. (Privacy-Preserving in Location Based Services) Yêu cầu: Nghiên cứu về LBS và bài toán bảo vệ tính riêng tư trong các ứng dụng LBS. Áp dụng các kết quả nghiên cứu để đề xuất/cải tiến một giải pháp hiệu quả nhằm bảo vệ tính riêng tư cho một ứng dụng LBS cụ thể (vd LBS for mobile banking, LBS for mobile marketing, LBS for tourist information systems, …). Đề tài 3: Hà Hồng Sơn Tìm kiếm lỗ hổng bảo mật trong các hệ cơ sở dữ liệu. (Detecting Security Breaches in Database Systems) Yêu cầu: Nghiên cứu các phương pháp tìm kiếm lỗ hổng bảo mật trong các hệ cơ sở dữ liệu. Áp dụng các kết quả nghiên cứu để đề xuất/cải tiến một giải pháp hiệu quả cho việc tìm kiếm lỗ hổng bảo mật trong một DBMS cụ thể (vd Oracle 11g hoặc SQL Server 2008). GVHD: TS. Phạm Trần Vũ Đề 1. Nghien cuu phat trien co che bien soan tu dong Workflow to Web Services Sv thuc hien: Bui Dung Anh Tuan Đề 2. Nghien cuu phat trien co che single sign-on tu moi truong Web cho VN-Grid Sv. Thai Thi Thu Thuy GVHD: TS. Nguyễn Văn Minh Mẫn Key Theme: Algebraic Methods for Pattern Recognition & Industrial Statistics PROJECT 1. MULTIPLE REGRESSION FOR SELECTING MEANINGFUL PREDICTOR VARIABLES: A CASE STUDY WITH BRIDGE MONITORING DATA Graduate: Tran Vinh Tan (CSE2007) A/ Introduction. The Lab of Applied Mechanics (LAM) of The University of Technology – VNU-HCM (HCMUT) has recently obtained a huge amount real data from continuously monitoring bridges in HCMC. One of the very beginning task of statistically data mining this data is finding efficient methods to delete out useless sensors, select only meaningful sensors, the ones could provide damage-sensitive features. This task contributes the first step of the Data Normalization phase of Damage Prognosis (DP). DP can be defined as the estimate of remaining useful life of a system (e.g. engineered structure, civil-mechanical system or service one...). B/ Description. Few general questions in DP problems are: a) what are the loading conditions that cause the concerning damage? b) What techniques/technologies should be used to assess the damage? c) Are statistical methods useful for DP and how? In civil-mechanical systems such as bridges, detection of the relationship between concerning factors and possibly recorded damages mathematically requires reading rightly available sources of information, finding best regression models to be used in further analysis. A key demand then arise: select only meaningful sensors for fitting best regression models. C/ The project aim and scope: • conducting this first step of Data Normalization (from bridge data monitored): study logistic regression and relevant techniques of Statistical Pattern Recognition to choose the meaningful sensors • designing and implementing a pilot software: combine R, a statistical software with Java; then validate with practical data provided by LAM • Extra request: if time allows, investigate parameter estimation of channel identification in the MISO case (multi- input single-output) by Algebraic Geometry method. PROJECT 2. CONSTRUCTIONS OF HADAMARD MATRICES AND DESIGNS Graduate: A/ Introduction. Hadamard matrices are specific matrices with all (-1,1)-entries such that the rows and columns are mutually pairwise orthogonal. That is the inner product of any pair of rows (or any pair of columns) equals to 0. B/ Description. Hadamard matrices have been found importantly useful in commodity manufacturing as well as in signal processing, not mention in theoretic studies. We investigate the constructions of Hadamard matrices and their corresponding balanced designs by using tools of numeric theory, combinatorics, algebra and computing. C/ The project aim and scope: • studying specific constructions of Hadamard matrices, • making a web-service providing Hadamard designs; • and if time allows, learning how to extend the work to computing balanced ternary designs using discrete mathematics such as finite geometries, numeric theory, as well as algeraic combinatorics and computing. Scope of our investigation. Restrict to specific mathematical constructions to all Hadamard matrices and designs with run size at most 664. Furthermore, the research is aimed at studying some specific mathematical techniques for computing ternary designs with run size at most 100, if time allows. These binary and ternary designs are used intensively in (Offline) Industrial Manufacturing, in Pharmaceutics, Agriculture, and in Software Testing. WORKING AND REPORTING ARRANGEMENTS Graduates are expected to inform their progress to the advisor(s) by oral presentation and written report, about once for each 2 months at the SAM seminar (www.cse.hcmut.edu.vn/~mnguyen/G-seminars.html). GVHD: PGS. TS. Dương Tuấn Anh Ñeà 1: (SV. Huyønh Thò Thu Thuûy) Phaùt hieän nhöõng maãu baát thöôøng (unusual pattern) treân döõ lieäu chuoãi thôøi gian Ñeà 2: (SV. Voõ Leâ Quy Nhôn) Gom cuïm döõ lieäu chuoãi thôøi gian (time series clustering) döïa vaøo pheùp bieán ñoåi wavelet. Ñeà 3: (SV. Phaïm Ñaêng Ninh) Tìm kieám töông töï (similarity search) treân döõ lieäu chuoãi thôøi gian döïa vaøo pheùp bieán ñoåi wavelet, vôùi hai ñoä ño töông töï: Euclid và xoắn thôøi gian ñoäng (dynamic time warping). Ñeà 4: (SV. Phaïm Hoàng Thaùi) Nâng cao hiệu quả tìm kieám töông töï treân döõ lieäu chuoãi thôøi gian vôùi ñoä ño töông töï xoaén thôøi gian động (dynamic time warping) Ñeà 5: (SV. Nguyeãn Coâng Thöông) Phaân lôùp döõ lieäu chuoãi thôøi gian (Time series classification) GVHD: TS. Võ Thị Ngọc Châu Đề 1 – Phát triển hệ CSDL quan hệ đối tượng phụ thuộc thời gian kép (Bi-temporal object relational database system development) Abstract: As realized up to now, the temporal aspects of facts are ubiquitous in the modeled world. Nowadays, temporal data support is of increasing interest in commercial DBMS products. However, their existing built-in support for (bi-)temporal data is limited and still unavailable widely to database users. This fact leads to the motivation for bitemporal object relational database system development. As expected, the achieved bi-temporal object relational database system will allow bi-temporal database application development to be supported in such a manner that non-temporal database application development is conventionally supported on a non-temporal database system. Tóm tắt: Như được nhận thức cho đến bây giờ, các khía cạnh thời gian của các fact ở khắp nơi trong thế giới thực tiễn. Ngày nay, việc hỗ trợ dữ liệu phụ thuộc thời gian đang được đưa dần vào các sản phẩm hệ quản trị CSDL thương mại. Tuy nhiên, phần hỗ trợ cố hữu hiện có cho dữ liệu phụ thuộc thời gian (kép) vẫn còn hạn chế và chưa phổ dụng cho người sử dụng CSDL. Điều này dẫn đến nhu cầu phát triển một hệ CSDL quan hệ đối tượng phụ thuộc thời gian kép. Kết quả sẽ là hệ CSDL quan hệ đối tượng phụ thuộc thời gian kép cho phép việc phát triển các ứng dụng CSDL phụ thuộc thời gian kép được hỗ trợ theo cách mà việc phát triển các ứng dụng CSDL không phụ thuộc thời gian được hỗ trợ trên hệ CSDL không phụ thuộc thời gian. Đề 2 – Phát triển một workbench cho siêu dữ liệu phụ thuộc thời gian của nhiều kiểu dữ liệu (Developing a unified temporal metadata workbench) Abstract: As generally bewared, metadata is data about data. It plays a very important role in handling other data from unstructured data to structured data. Thus, an effective management of metadata is necessary for application domains where metadata is required. Based on this fact, a unified temporal metadata workbench is developed in consideration on several popular metadata standards such as Dublin Core and MPEG-7. The temporal aspect and other domain-specific aspects of many various kinds of data are examined for metadata at both conceptual and logical levels. With the resulting metadata workbench, it is believed that metadata-related application development is greatly supported at the database instead of application level. In particular, such a metadata workbench can be utilized in developing temporal information-rich systems such as temporal multimedia data warehouses, temporal 3D medical data management systems, and information-rich virtual environments. Tóm tắt: Theo một cách tổng quát, siêu dữ liệu có thể được định nghĩa là dữ liệu về dữ liệu. Siêu dữ liệu đóng một vai trò rất quan trọng trong việc xử lý dữ liệu khác từ không có cấu trúc đến có cấu trúc. Do đó, quản lý siêu dữ liệu hiệu quả thì cần thiết cho các miền ứng dụng có yêu cầu về siêu dữ liệu. Điều này dẫn đến việc phát triển một workbench cho siêu dữ liệu phụ thuộc thời gian dựa trên một vài chuẩn siêu dữ liệu phổ biến chẳng hạn như Dublin Core và MPEG-7. Khía cạnh thời gian cũng như các khía cạnh cụ thể khác của các kiểu dữ liệu khác nhau trong một miền ứng dụng cụ thể sẽ được kiểm tra cho siêu dữ liệu ở mức ý niệm lẫn mức luận lý. Với kết quả là một workbench cho siêu dữ liệu, việc phát triển các ứng dụng phần nào có liên quan đến siêu dữ liệu sẽ được hỗ trợ nhiều ở mức CSDL thay vì ở mức ứng dụng. Cụ thể hơn, một workbench như thế cho siêu dữ liệu có thể được tận dụng trong việc phát triển các hệ thống giàu thông tin phụ thuộc thời gian chẳng hạn như các kho dữ liệu đa phương tiện phụ thuộc thời gian, các hệ thống quản lý dữ liệu y học 3 chiều phụ thuộc thời gian, và các môi trường ảo giàu thông tin. Đề 3 – Thiết kế ngôn ngữ CSDL phụ thuộc thời gian: khảo sát, đánh giá, và các hướng mới (Temporal database language design: a survey, evaluations, and new trends) Abstract: Within the long history of temporal database research, the investigation into temporal database languages is very much. It is illustrated by several temporal extensions to relational algebra/calculus, nested relational algebra/calculus, QUEL, SQL, and OQL. Each temporal extension focuses on a specific set of different aspects of a temporal database language to deal with temporal data. Thus, a survey and evaluations on the design of the existing temporal database languages are helpful to examine how much the requirements for the invention of a temporal database language are satisfied. Also, it will result in what should be researched next for a new temporal database language that can handle data with regard to time as much as possible. Tóm tắt: Trong lịch sử lâu dài của lĩnh vực nghiên cứu CSDL phụ thuộc thời gian, các ngôn ngữ CSDL phụ thuộc thời gian được đầu tư phát triển rất nhiều. Điều này được minh họa bởi nhiều mở rộng về thời gian của đại số/số học quan hệ, đại số/số học quan hệ lồng, QUEL, SQL, và OQL. Mỗi phần mở rộng tập trung vào một tập các khía cạnh cụ thể của một ngôn ngữ CSDL phụ thuộc thời gian cho việc xử lí dữ liệu phụ thuộc thời gian. Do đó, việc khảo sát và đánh giá thiết kế của các ngôn ngữ CSDL phụ thuộc thời gian hiện có thì rất có ích cho việc kiểm tra các yêu cầu về sự phát minh ra một ngôn ngữ CSDL phụ thuộc thời gian mới được đáp ứng nhiều như thế nào. Hơn thế nữa, việc khảo sát và đánh giá đó sẽ là tiền đề cho các hướng nghiên cứu tiếp một ngôn ngữ CSDL phụ thuộc thời gian mới có thể xử lý dữ liệu theo khía cạnh thời gian nhiều như có thể. GVHD: TS. Thoại Nam Đề 1: (1 sinh viên) Nguyễn Hữu Tường Vinh Nghiên cứu và phát triển giải thuật truyền dữ liệu nhóm trên mạng Internet. Mạng Internet phát triển kéo theo các ứng dụng trên nó phát triển. Hiện tại một số ứng dụng như TV-online, Video conference đòi hỏi kỹ thuật truyền đa điểm (theo nhóm). Tuy nhiên do đặc thù phức tạp, không đồng nhất trên mạng Internet nên các giải pháp truyền theo nhóm cấp mạng đều không/khó triển khai. Đề tài tập trung tìm lời giải truyền theo nhóm ở cấp ứng dụng. Yêu cầu trong phần “chuyên đề“: − Tìm hiểu về truyền theo nhóm cấp ứng dụng. − Tham khảo giải thuật N-tree. − Tham khảo nghi thức XCAST. − Đề xuất hướng giải quyết. Đề 2: (1 sinh viên) Định thời hướng tiết kiệm năng lượng. Một vấn đề nan giải cho các hệ thống máy tính cụm là việc sử dụng năng lượng điện hợp lý. Do hệ thống máy tính cụm có hàng trăm/ngàn nút và không phải lúc nào cũng cần đến tất cả các nút đều hoạt động. Một giải thuật định thời/lập lịch thông minh sẽ giúp sắp xếp công việc tập trung vào một số lượng nút tối thiểu nhưng vẫn đảm bảo các ràng buộc của ứng dụng và như vậy giúp giảm thiểu việc tiêu thụ điện năng do các nút không tải được tắt. Yêu cầu trong phần “chuyên đề“: − Tìm hiểu về định thời. − Tham khảo các giải thuật định thời liên quan. − Đề xuất giải pháp. Đề 3: (1 sinh viên) Nghiên cứu và xây dựng giải thuật định thời trên lưới VN-Grid. VN-Grid là một lưới tính toán đang được nghiên cứu và triển khai trên mạng liên kết một số đại học tại TP.HCM. Đề tài tập trung nghiên cứu giải thuật định thời phù hợp cho đặc thù của VN- Grid. Nhiệm vụ trong chuyên đề là: − Tìm hiểu lưới tính toán. − Tìm hiểu về VN-Grid. − Đề xuất hướng giải thuật. GVHD: TS. Đinh Đức Anh Vũ Đề 1: Nghiên cứu và xây dựng phương pháp hiện thực vi mạch bất đồng bộ trên FPGA HV: Phạm Quốc Cường Đề 2: Nghiên cứu và hiện thực PDA đơn giản trên DE2 HV: Nguyễn Thành Trung Đề 3: Nghiên cứu và xây dựng ứng dụng trên ARM HV: Phan Đình Khôi GVHD: TS. Trần Văn Hoài Đề 1: Xây dựng động cơ mô phỏng phục vụ cho quá trình mô phỏng trong giao thông. (Đã có sinh viên nhận) Mục tiêu của đề tài: Để xác định một quy hoạch giao thông, một cách điều khiển giao thông, … có hợp lý hay không là một nhu cầu có thật, nhất là ở Việt Nam. Mục tiệu chính của đề tài là hướng đến xây dựng một công cụ giúp các nhà mô hình có thể mô phỏng hoạt động của các thành phần trên mạng giao thông. Đề tài này nhắm đến 2 mục tiêu: • Tìm hiểu các phương pháp hiện có trên thế giới và tìm ra một cách tiếp cận để mô phỏng mạng giao thông ở Việt Nam. • Xây dựng một chương trình thể hiện khả năng có thể phát triển thành một công cụ mô phỏng trợ giúp các nhà mô hình. Yêu cầu của đề tài: • Số lượng sinh viên: 1. Đề 2: Phát triển một công cụ cho phép mô tả những luật cơ bản trong giao thông trợ giúp cho quá trình mô phỏng. (Đã có sinh viên nhận) Mục tiêu của đề tài: Trong một động cơ mô phỏng dựa trên time-step, sự chuyển trạng thái của hệ thống sẽ được thực hiện dựa trên những luật khác nhau (ví dụ điều khiển đèn tín hiệu, luật giao thông, luật mô tả hành vi, luật vật lý…). Việc xây dựng một công cụ tổng quát để mô tả các luật trên một cách dễ dàng, chính xác là một nhu cầu rất quan trọng khi xây dựng công cụ mô phỏng. Đó cũng là mục tiêu chính của đề tài. Yêu cầu của đề tài: • Số lượng sinh viên: 1. Đề 3: Xây dựng một hạ tầng Grid hỗ trợ tối ưu tổ hợp dùng các phương pháp chính xác. (Đã có sinh viên nhận) Mục tiêu của đề tài: Nhiều bài toán tổ hợp trong thực tế có yêu cầu tài nguyên tính toán rất lớn. Hơn nữa, để viết một chương trình có thể giải bài toán theo cách tiếp cận toán học là rất khó khăn, nhất là những người làm ứng dụng, đó là chưa kể đến làmthế nào để triển khai tính toán trên một môi trường tính toán lớn. Mục tiêu của đề tài là xây dựng hạ tầng Grid hỗ trợ điều giảm thiểu những khó khăn kể trên cho người dùng. Đề 4: Xây dựng một công cụ mô tả workflow trên Grid phục vụ cho tìm kiếm dựa trên meta- heuristics. Mục tiêu của đề tài: Nhóm nghiên cứu thuộc dự án EDAGrid đã phát triển một công cụ hỗ trợ định nghĩa một workflow gồm các nút tìm kiếm dựa trên 3 meta-heuristic cơ bản (Hill climbing, Simulated Annealing, Tabu Search). Mục tiêu của đề tài gồm 2 yêu cầu chính: - Bổ sung khả năng tích hợp một nút sử dụng phương pháp tìm kiếm dựa trên dân số (population- based heuristics). - Hoàn thiện các cú pháp để mô tả workflow linh hoạt hơn. GVHD: TS. Lê Ngọc Minh Đề 1. Thiết kế và hiện thực giải thuật định tuyến (routing) hữu hiệu trong mạng cảm biến không dây (wireless sensor network) Yêu cầu: biết hay sẵn sàng học lập trình Linux device driver Đề 2. Thiết kế và hiện thực actor tính toán hình học trong Ptolemy II để mô hình và mô phỏng chuyển động của robot có va chạm Yêu cầu: có khả năng tư duy toán học tốt, lập trình Java Đề 3. Ray tracing trong thời gian thực Yêu cầu: cấu trúc dữ liệu, Computer Graphics, lập trình trên nền Linux Giảng viên hướng dẫn: - PGS. TS. Phan Thị Tươi - NCS.Nguyễn Chánh Thành Đề tài 1 : Phát triển cơ chế xếp hạng truy vấn và kết quả tìm kiếm trong hệ thống truy xuất thông tin tiếng Việt. Yêu cầu về đề tài - Khảo sát các giải pháp lập chỉ mục hướng ngữ nghĩa - Đề xuất một giải pháp cải tiến cho lập chỉ mục hướng ngữ nghĩa cho các nguồn tri thức có sẵn (Wiki, WordNet, TREC, …) - Ứng dụng xây dựng cơ chế lập chỉ mục cho tài liệu tiếng Anh và tiếng Việt phục vụ cho hệ thống VIRS tiếng Việt trực tuyến. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: - Liên hệ với giáo viên hướng dẫn - Website: o http://kmi.open.ac.uk/technologies/semsearch/ o http://www.cs.umd.edu/projects/plus/SHOE/ o http://www.swse.org/publications.php Đề tài 2 : Phát triển cơ chế rút trích quan hệ ngữ nghĩa cho dữ liệu tiếng Việt và tiếng Anh. Yêu cầu về đề tài - Khảo sát các cơ chế rút trích dữ liệu và quan hệ ngữ nghĩa cùng cơ chế lưu trữ. - Phân tích cấu trúc của các nguồn tri thức có sẵn liên quan giải pháp rút trích (Wiki, WordNet, TREC, ...) - Ứng dụng xây dựng cơ chế khai thác dữ liệu để huấn luyện cơ sở tri thức tiếng Việt VKB. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: - Liên hệ với giáo viên hướng dẫn - Website: o http://www.gabormelli.com/rkb.cgi/Semantic_Relation_Extraction_Algorit hm o http://www.gabormelli.com/rkb.cgi/Research_Publications o http://www.gabormelli.com/rkb.cgi/Research_References o Bài báo “Automatic Extraction of Hierarchical Relations from Text” o Bài báo “A Multilingual/Multimedia Lexicon Model for Ontologies” Đề tài 3 : Phát triển mô hình truy xuất thông tin tiếng Việt ứng dụng trong thư viện số. Yêu cầu về đề tài - Khảo sát các mô hình truy xuất thông tin. - Ứng dụng xây dựng ứng dụng mẫu cho hệ thống VIRS. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: - Liên hệ với giáo viên hướng dẫn - Tài liệu: o Bài báo “Semantic Wikipedia” o Bài báo “Applying Semantic Web Technology in a Digital Library” Giảng viên hướng dẫn: - PGS.TS. Phan Thị Tươi - NCS.Nguyễn Quang Châu Đề tài 4 : Nghiên cứu và xây dựng cơ chế Q&A tiếng Việt trực tuyến Yêu cầu về đề tài - Tìm hiểu về các hệ thống Q&A - Phân tích ứng dụng và tính năng của nó - Ứng dụng xây dựng cơ chế cho hệ thống Q&A tiếng Việt trực tuyến. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: Liên hệ với giáo viên hướng dẫn Đề tài 5 : Nghiên cứu và xây dựng Ontology phục vụ cho hệ thống Q&A tiếng Việt. Yêu cầu về đề tài - Tìm hiểu về các hệ thống Q&A - Phân tích cấu trúc và tính năng của nó - Ứng dụng xây dựng và khai thác Ontology phụ vụ cho hệ thống Q&A tiếng Việt trực tuyến. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: Liên hệ với giáo viên hướng dẫn Đề tài 6 : Biểu diễn tri thức cho hệ thống Q&A. Yêu cầu về đề tài - Tìm hiểu về các hệ thống Q&A và cách biểu diễn tri thức - Phân tích cấu trúc của các nguồn tri thức có sẳn (Wiki, WordNet,..) - Ứng dụng xây dựng cơ chế biểu diễn trung gian phục vụ cho hệ thống Q&A tiếng Việt trực tuyến. Yêu cầu về kỹ thuật: - Hiện thực trên Web và App Tài liệu tham khảo: Liên hệ với giáo viên hướng dẫn
DMCA.com Protection Status Copyright by webtailieu.net