Một số vấn đề và phương pháp học tậpvà nghiên cứu khoa học
Học là việc chuyển tri thức con người đã biết thành tri thức của các cá nhân hoặc tổ chức.Đại học: học các tri thức chung của nghề; Thạc sĩ: học các tri thức chuyên sâu của nghề. Thạc sĩ là người tinh thông nghề nghiệp (master, étude approfondie).
Phần 1
Về việc học cao học và nghiên cứu khoa học
Một số vấn đề và phương pháp (from talks at HCMUT 2007, ICT-Hanoi 2007, and some writings)
học tập và nghiên cứu khoa học
Hồ Tú Bảo
Japan Advanced Institute Vietnamese Academy
of Science and Technology of Science and Technology
1 2
Bản chất của đào tạo sau đại học Bản chất của đào tạo thạc sĩ là học
Bản chất của đào tạo thạc sĩ Bản chất của đào tạo Chương trình thạc sĩ phổ Chương trình thạc sĩ
là học tiến sĩ là nghiên cứu biến trên thế giới phổ biến của ta
Học là việc chuyển tri thức con Nghiên cứu là việc tìm Học hai năm với tín chỉ Phần lớn thời gian cho các
người đã biết thành tri thức của và tạo ra các tri thức môn học trên lớp (khoảng
Năm đầu chủ yếu học các
20 môn)
các cá nhân hoặc tổ chức. mới và có ý nghĩa bởi môn cần thiết (khoảng 10
Chưa dùng hệ tín chỉ
Đại học: học các tri thức chung các cá nhân hoặc tổ môn, phần lớn tự chọn)
chức. Ít thời gian cho rèn luyện
của nghề; Thạc sĩ: học các tri Năm thứ hai chủ yếu cho việc và làm luận văn
thức chuyên sâu của nghề. rèn luyện
Tiến sĩ là người biết Ít rèn khả năng tự học
seminar, reading, hoạt động
Thạc sĩ là người tinh thông làm nghiên cứu, và Tiêu chí và cách đánh giá
của lab
nghề nghiệp (master, étude chủ yếu làm việc chưa thích hợp (luôn
làm đề tài nghiên cứu, viết và yêu cầu cái mới)?
approfondie). nghiên cứu.
bảo vệ luận văn.
3 4
Bản chất của đào tạo tiến sĩ là nghiên cứu Some Ph.D. thesis
(Tạp chí Tia Sáng, 18.10.2007)
Đòi hỏi cơ bản Xa điều kiện của Bộ GD-ĐT: “Nhận thức của công chức hành chính về việc sắp xếp
Biết xác định được vấn đề 01 bài báo tạp chí quốc tế, một lại bộ máy của cơ quan chuyên môn trực thuộc Ủy ban
nghiên cứu có ý nghĩa vài bai hội nghị quốc tế nhân dân cấp tỉnh, thành phố”
Biết giải quyết vấn đề 01 bài báo tạp chí trong nước
Biết viết bài và trình bày. “Nhận thức của thanh niên nông thôn về chất lượng
Rất nhiều luận án làm Thách thức lớn!1995-2004: cuộc sống gia đình hiện nay”
ứng dụng thay vì nghiên 5259 GS & PGS
“Nghiên cứu nhu cầu điện ảnh của sinh viên”
cứu cơ bản hay ứng 3236 (800) bài tạp chí quốc tế
“Phát huy vai trò của tri thức ngành y tế Việt
dụng
Nam trong công cuộc đổi mới”.
Kết quả chủ yếu công
bố ở các tạp chí hay hội “Lịch sử phát triển giáo dục–đào tạo ở An giang
nghị trong nước. (1975 – 2000)”
(http://vietnamnet.vn/khoahoc/vande/2006/01/532815) 5 http://www.hed.edu.vn/TrangChu/LuanAnTienSi/TomTatNhungDiemMoi/ 6
Chương trình và sách giáo khoa ICT Chương trình và sách giáo khoa ICT
Toàn bộ những
thứ liên quan Phát triển và bảo trì “Sinh viên không chỉ cần học những thứ hiện nay đã được biết,
Khoa học Kỹ nghệ
đến tính toán, từ
phần mềm
các hệ thống phần mà cần cả cách làm sao giữ cho kiến thức của mình được cập
cấu trúc máy tính máy tính mềm, cho chúng tin
đến các hệ thống (computer (software cậy và hiệu quả nhật. Các công cụ dựa trên công nghệ để thu thập tri thức cần
thông minh, science) engineering) phải trở thành những yếu tố trung tâm của giáo dục cho họ, và
người máy, đến
thuật toán và lý chương trình cần được xây dựng để sinh viên học cách học” *
thuyết tính toán. Công nghệ (a) Tất cả mọi
Kỹ nghệ hệ thống Công nghệ thứ
thông tin (b) Công nghệ Khả năng tự học là cốt yếu
máy tính thông tin Information
information
(computer (information (information
máy tính để
vận hành và
technology
systems
technology
trong ICT
(Công nghệ
engineering) systems technology) phát triển các thông tin) (Công nghệ hệ
Phụ thuộc chương trình, thầy
thống thông tin)
Thiết kế và xây technology) hệ thống
dựng các hệ thông tin của và trò.
máy tính, các hệ
thống dựa trên Gắn giải pháp của CNTT vào các quá trình kinh doanh, tổ chức (chú computer computer software
tác nghiệp qua việc xây dựng các hệ thống thông tin trọng phần engineering science engineering
máy tính (Kỹ nghệ
(Kỹ nghệ (Khoa học
(hardware) của tổ chức (chú trọng phần thông tin) công nghệ)
máy tính) máy tính) phần mềm)
Computing Curriculum 2005 (IEEE & ACM)
CC 2005: http://www.computer.org/portal/cms_docs_ieeecs/ieeecs/education/cc2001/CC2005-March06Final.pdf * “Peril and Promise: Higher Education in Developing Countries”, World Bank & UNESCO
Before 1990s, in North America: computer science, electrical engineering, and information systems 7 8
Khoa học và Công nghệ Nghiên cứu cơ bản, nghiên cứu ứng
dụng và ứng dụng?
Khoa học là việc khảo sát các hiện tượng tự nhiên và xã
hội để tìm tri thức mới. Nghiên cứu cơ bản: Tìm tri Ứng dụng: Dùng tri thức đã
Công nghệ là cách dùng các tri thức khoa học và vật liệu thức mới cho các nghiên biết để giải quyết các vấn
để đạt mục tiêu làm sản phẩm (“technology is not about cứu cơ bản khác hay đề thực tế.
tools, it deals with how humans work”, Peter Drucker). nghiên cứu ứng dụng Trong ICT
Thay đổi khắp nơi ở Việt Nam trong các năm 1990s: khoa Gene finding Nghiên cứu cơ bản có thể
học khoa học & công nghệ (Viện KHVN Viện Mô hình ngôn ngữ tiếng Việt nhanh chóng chuyển vào
KH&CNVN, Bộ Khoa học và Công nghệ, etc.) Kernel methods nghiên cứu ứng dụng
Khoa học và công nghệ rất liên quan đến nhau nhưng là hai Nghiên cứu ứng dụng: Tìm Nghiên cứu ứng dụng có thể
thứ khác nhau. KH-CN đang được dùng lẫn vào nhau như nhanh chóng chuyển thành
một đơn vị của nhận thức (không luôn luôn tốt).
tri thức khoa học để giải sản phẩm
quyết các vấn đề thực tế Ứng dụng có khắp nơi
Việt Nam cần tỷ lệ khoa học IC và công nghệ IC bao nhiêu?
Dịch máy Anh-Việt
9
(http://vietnamnet.vn/khoahoc/vande/2006/01/532815) 10
Nghiên cứu cơ bản, nghiên cứu ứng Nghiên cứu cho nhu cầu ICT của
dụng và ứng dụng? Vietnam
“Trong khi không phải mọi đất nước đều cần tiến hành nghiên cứu Các lĩnh vực thiết yếu của ICT: như kỹ thuật mạng, công nghệ
cơ bản ở nhiều lĩnh vực khác nhau, mỗi đất nước cần phải xem xét phần mềm, an toàn thông tin, trí tuệ nhân tạo, v.v. công bố
các loại nghiên cứu khoa học và công nghệ có thể trực tiếp đóng quốc tế
góp vào sự phát triển của mình. Các lĩnh vực mới, thích hợp và triển vọng
... Có lẽ câu hỏi cần hỏi nhất là: đâu là mức tối thiểu các hoạt động Tin sinh học, công nghệ Web, các lọai dữ liệu phức tạp ...
khoa học và công nghệ cần phải có để đạt được các mục tiêu của thay vì các chủ đề đã quá quen thuộc như tập mờ, tập thô, cơ
quốc gia?” sở dữ liệu quan hệ, ...
Nghiên cứu cơ bản bao nhiêu phần trăm? Vào vấn đề gi? Lĩnh vực Các lĩnh vực cần cho nhu cầu ở Việt Nam và người Việt phải
nào? nên tập trung cho các nghiên cứu làm nền tảng cho nghiên cứu làm, như:
ứng dụng.
Hành chính điện tử, hạ tầng cơ sở ICT ... vs. thực tại ảo
Cần khuyến khích và tổ chức nghiên cứu công nghệ
Xử lý văn bản và tiếng nói tiếng Việt
Đề cao và ưu tiên cho số đông làm nghiên cứu ứng dụng.
Phát hiện đạo văn và cơ sở dữ liệu luận văn
“Peril and Promise: Higher Education in Developing Countries”, World Bank and UNESCO 11 12
Dự đoán gene gây bệnh và tin y-sinh Hạ tầng cơ sở cho xử lý tiếng nói và
học văn bản tiếng Việt
Gene
Gene Gene
Gene
Protein SP8.1
SP8.1
Protein Speech analysis tools
Protein Speech analysis tools
Protein
SP6.1
SP6.1 SP6.2
SP6.2 SP6.3
SP6.3
Gene Protein Complex disease
Corpora for
Corpora for Corpora for
Corpora for Corpora for
Corpora for
SP1 speech recognition
speech recognition Speech synthesis
Speech synthesis specific words
specific words
Protein 50 putative Apllicationoriented SP3
Gene Protein Protein disease genes systems based on English-Vietnamese
SP7.4
SP7.4
addition to Vietnamese speech SP7.3
SP7.3 translation system
E-V corpora of
E-V corpora of
recognition & synthesis Vietnamese tree bank
Vietnamese tree bank
3053 known aligned sentences
aligned sentences
Gene Gene
SP7.1
SP7.1 SP7.2
SP7.2
English-Vietnamese
English-Vietnamese Viet dictionary
Viet dictionary
dictionary
dictionary
SP2
SP4
Speech recognition SP8.2
SP8.2 SP8.3
SP8.3 IREST: Internet use
system with Vietnamese word
Vietnamese word
Vietnamese POS tagging support system
large vocabulary segmentation
segmentation Vietnamese POS tagging
Metabolomics 1400
Chemicals
SP8.4 SP8.5
SP8.5
SP8.4 Vietnamese
Vietnamese chunking Vietnamese
Vietnamese chunking syntax analyser
syntax analyser
Proteomics 100,000 Proteins
SP5
Vietnamese
spelling checker
Genomics 25,000 Genes
13
National project KC01-01/06-10 on “Vietnamese Language and Speech Processing” 14
Dịch máy Anh-Việt Hướng đến các công bố quốc tế
Nghiên cứu cần hướng đến công bố trên các tạp
chí và hội nghị quốc tế *
Cần khuyến khích và đề cao các nghiên cứu
chất lượng cao, và phân biệt giá trị khác nhau
của kết quả nghiên cứu (rất cạnh tranh)
Cần dạy và học phương pháp
nghiên cứu khoa học
Từng bước đạt mục tiêu trên
15 * ‘Văn hóa ngành’ trong tiêu chí đánh giá, http://www.tiasang.com.vn/news?id=1771 16
Hai loại ấn phẩm khoa học chính Computer science journal ranking (AI)
Premium: Artificial Intelligence, Artificial Intelligence Review, Computational
Tạp chí Linguistics, IEEE Trans on PAMI, Robotics and Automation, Image Processing, Journal of
AI Research, Neural Computation, Machine Learning, Intl Jnl of Computer Vision, etc.
Quốc tế: Google “computer science journal ranking”
Leading: ACM Trans. on Asian Language Information Processing, AI Magazine, Annals
Trong nước: of Mathematics and AI, Applied Artificial Intelligence, Applied Intelligence, Artificial
Intelligence in Medicine, IEEE Trans on Neural Networks, Speech and Audio Proc,
Hội nghị quốc tế Systems, Man, & Cybernetics, Part A & B, Intl Jnl on Artificial Intelligence Tools,
Conferences (hội nghị), symposiums, workshop, forums (hội Machine Translation, Neural Networks, Pattern Recognition, etc.
thảo), congress (đại hội) Reputable: Computer Processing of Chinese & Oriental Languages, Intl Jnl of Pattern
Recognition & AI, Computers and Artificial Intelligence, IEEE Transactions on Fuzzy
Quốc tế: Google “computer science conference ranking”
Systems, Journal of Intelligent and Fuzzy Systems, Knowledge Acquisition Jnl,
Trong nước: ICT, FAIR, etc. Knowledge-Based Systems, Pattern Recognition Letters, Jnl. of Japanese Soc. of AI,
Intelligent Data Analysis, etc.
Measures: Impact factor, citation Others: Canadian Artificial Intelligence, Journal of Advanced Robotics, Journal of
Artificial Intelligence in Education, Journal of Artificial Intelligence in Engineering,
Trong ICT, hội nghị tốt được đánh giá rất cao (khác với các Automation, and Manufacturing, Journal of Computational Acoustics, Journal of
ngành toán, lý, hóa, sinh học, etc. Computational Neuroscience, Journal of Computational Vision, etc.
Easy: WASET (World Academy of Science, Engineering and Technology) , WSEAS
17 18
Computer science conference ranking (AI) Số bài báo tạp chí quốc tế 10 năm
(“made in Vietnam” during 1995-2004)
Rank 1: IJCAI: Intl Joint Conf on AI, AAAI: American Association for AI National
Conference, ICML: Intl Conf on Machine Learning, UAI: Conference on Uncertainty in AI, Areas # papers Res. Institutions Universities Citation avg
UM: Intl Conf on User Modeling, NIPS: Neural Information Processing Systems, AGENTS: Mathematics 300 144 121 1.4
International Conference on Autonomous Agents [SIGKDD: ACM Knowledge Discovery Theoretical Physics 131 100 31 2.4
and Data Mining, ICDM: IEEE International Conference on Data Mining], etc. Experimental Physics 40 16 24 1.6
Technology 42 25 9 0.8
Rank 2: ECAI: European Conf on AI, ECML: European Conf on Machine Learning, GECCO:
ICT 38 19 11 1.3
Genetic and Evolutionary Computation Conference GP: Genetic Programming
Materials Science 36 9 27 1.8
Conference, IAAI: Innovative Applications of AI, ICIP: Intl Conf on Image Processing,
Medicine 36 28 8 2.3
ICPR: Intl Conf on Pattern Recognition, ICTAI: IEEE conference on Tools with AI, etc.
Chemistry 32 28 4 1.2
[COLING: Intl Conf on Computational Liguistics, PAKDD: Pacific-Asia Conf on Know.
Agriculture 23 15 8 1.7
Discovery & Data Mining, PKDD: European Conf on Principles and Practice of Knowledge
Polymer 19 14 5 1.1
Discovery in Databases], etc. Mechanics 17 15 1 2.6
Rank 3: PRICAI: Pacific Rim Intl Conf on AI, AusAI: Australian Joint Conf on AI, etc. Social science 14 12 2 0.2
Unranked Conferences: AAMAS: Intl Joint Conf on Autonomous Agents and Multiagent Environmental science 13 13 0 4.1
Systems, NFOVIS: IEEE Symp. on Information Visualization, VIS: IEEE Visualization, etc. Biology 10 9 1 1.3
Not Encouraged (due to dubious referee process): Intl Multiconferences in Computer Earth science 9 8 1 0.5
Science -- 14 joint int'l confs., SCI: World Multi confs on systemics, sybernetics and Pharmacy and drug 1 0 1 4
informatics , SSGRR: International conf on Advances in Infrastructure for e-B, e-Edu and Management science 1 1 0 0
e-Science and e-Medicine , IASTED conferences, CCCT: International Conference on Others 36
Computer, Communication and Control Technologies. Total 798
Source: Phạm Duy Hiển, http://vietnamnet.vn/khoahoc/vande/2006/01/532815/ (1995-2004: 3236)
19 Nguyễn Văn Tuấn: http://www.tiasang.com.vn/news?id=2166 (1996-2005: 3456) 20
So sánh Thailand & Vietnam Đem hội nghị quốc tế đến Vietnam
In 2001-2002
Thailand Vietnam Rate (TL/VN)
Rất ít người từ các nước đang phát triển tham dự
# Articles in inter. journals 3103 737 4/1
Made with foreigners (A) 1739 546 3/1
được các hội nghị khoa học quốc tế hàng đầu về ICT
# Citations (A) until 12.2006 13912 4681 3/1
(NIPS, ICML, KDD, IJCAI, …)
Made in the country (B) 1364 173 8/1
Lý do vì không có bài lọt vào các nơi này và không có
# Citations (B) until 12.2006 5324 323 16/1
Made by universities 1208 69 17/1
tiền để đi (thí dụ của IJCAI 2007 tại Ấn độ)
# Articles in Math & Physics 68 104 0.7/1 Câu hỏi là làm sao đem được nhiều hội nghị quốc tế tốt
In 2001-2002 đến Việt Nam (e.g., PAKDD’05, RIVF’07, RIVF’08,
Rate (Chula/ PRICAI’08, etc.)
Chulalongkorn VNU-HN VNU-HCM VNUHN+VNUHCM)
# Articles 302 25 8 9.15/1 Cần sự tham gia với nhiều cố gắng,
# Citations 948 63 13 12.47/1 chuẩn bị và đóng góp từ Việt Nam.
Articles in Math & Physics 15 21 7 0.53/1
Source: Phạm Duy Hiển, http://vietnamnet.vn/nhandinh/2007/01/649976/
21 22
Phần 2 Finding a research topic: first step
Xác định đề tài nghiên cứu “The difference between a trivial project and a
(Adapted from the lecture of/with Prof. Duong Nguyen Vu, HCMC, November 2007)
significant project is not the amount of work
required to carry it out, but the amount of thought
that you apply in the selection and definition of
your problem.”
David P. Beach & Torsten K.E. Alvager
Handbook for Scientific and Technical Research,
Prentice-Hall, 1992, p. 29
23 24
Formulating a problem Problem Formulation
The process of problem formulation implies a series First step in all research projects.
of reiterated actions: Generally, most difficult element of this process is the
starting point: original idea/topic.
Original problem
Decision on Usually, a research topic is suggested by the research
the “problem” director/supervisor: the topic is often chosen among the
Discussions:
modified problem
set of problems that has been actively investigated by
the group for a while.
Bibliographic
Even though, initial idea is usually vague or brut, and
∃ literature
Search or public ? necessitates improvements and/or developments.
For these reasons, this is the stage where experience,
creativity, originality, etc. are more than necessary.
Finalize problem
Research Planning
25 26
Research a Research Problem Refining a Research Topic
Topics that are too vague or imprecise require a
A Doctoral topic consists normally to: large quantity of work.
Develop a new theory, a new formalism, or Mathematically, a problem leading to more than
Contribute to an existing theory or formalism. one solution is called “ill-posed problem.”
A Master topic aims at
Problem Space Solution space
To master the knowledge and skill of an area in
the profession (to go to industry)
To train for experience of doing research (if going
to doctor course) Constraints
27 28
Hypothesis Results of a Hypothesis
Hypothesis expresses the elements of a research Hypothesis providing experimentations for a theory,
problem. through an affirmation or an
invalidation/disqualification of the specific predictions
Therefore, the hypotheses define the set of experiments
to be conducted during the research. established from this theory, must be tested in one of
4 ways:
In practice, a research topic contains more than one
unknown. For an extended scope of the theory,
For the limits of the applicability of the theory,
During the scientific or technologic research process, the For an improved exactitude of the theory,
researcher drives for the clarification of this unknown with
For the validation of the basic assumptions of the theory.
irrefutable evidences or proofs.
It is important that these hypotheses be well-posed.
29 30
Hypothesis Validating a Theory Hypothesis Validating a Theory
Test for improving the exactitude of the theory,
Test for an extended scope:
Theories are often a generalization of observed facts, via
A theory is often applicable to sole certain restricted objective measurements issued from heuristics analysis.
situations or conditions. The theory can become more
Generalization and Application are not always bijective.
“powerful” if it is demonstrated to be applicable to
other instances. Exactitude of a theory is always desired.
In the contrary, it reinforces the limits of the Test for validating or invalidating a basic assumption,
applicability of the theory. Is a baseline assumption correct? Why?
Test for the limits of the applicability: A theory could become ridiculous if its basic assumptions
E.g., Einstein’s theory of relativity doesn’t falsify doesn’t have any scientific value or are not convincing vis-
Newton’s mechanic. It only describes the limits to à-vis scientific community.
which the theory is applicable. Scientific “Warfare”!!
31 32
Identifying a Research Topic Review of the Literature
Several ways in which researchers often gain some insight
Literature reviews help researcher limit the scope of their
into their topic when beginning:
inquiry. They convey the importance of studying a topic to
Draft a brief title for the study: initial hypothesis or “working title;” readers.
Tracking evolution of hypothesis or working title.
Literature review is an integral part of the decision/selection of a
Another strategy for topic development is to pose the topic as a
brief question (interrogative form of hypothesis). research topic.
Newtonian approach - Practical recommendation: At this point, researchers also need to consider whether the topic can
and should be investigated.
Write down “My study is about …” ; Avoid complex and erudite
(uyên bác) language. Must identify an initial topic of research (by the researcher instead of
the advisor).
Consider a title no longer than 12 words, eliminate most articles
and prepositions, and make sure that it includes the focus of the Literature review relates a study to the larger on-going dialogue in the
key topic of the study. literature about a topic, filling in gaps and extending prior theories.
Wordings in “hypothesis” or “working title” must be defined Provides a framework for establishing the importance of the study as
Process of defining the terms leads to literature review. well as a benchmark for comparing the results of a study with other
findings.
33 34
Bibliographic Research Steps in Conducting a Literature Review
Bibliographic Search is necessary to inquire the literature, “A literature review for a proposal or a research study means
where is found public domain knowledge, about related works locating and summarizing the studies about the topic.”
to dress up the horizon describing similar studies over time. Step 1: Begin by identifying keywords useful in locating materials.
It is important to note that a crucial ingredient in research is that These keywords may emerge in identifying a topic.
the knowledge to be uncovered from the study must be new or Step 2: Searching the materials in library databases with identified
original. keywords.
A study whose results are a priori known in public domain, and Step 3: Trying to locate about 50 reports and articles (or books)
that are only beneficial to one person or a small group of related to research topic. Setting priority on journal and conference
persons, will not be qualified as a research. articles.
Several researches have been interrupted in their initial phases Step 4: Proof reading the selected documents with care on the
for diverse reasons, but a large portion is stopped because their abstracts and core results to obtain a sense of whether the
research topics were not sufficiently “convincing.” It’s not document will make a useful contribution to your understanding of
unusual to evolve the research topic to findings from the the literature.
literature.
35 36
Steps in Conducting a Literature Review Using the Internet
Step 5: For each selected document, write maximum 10 lines to describe
what you have understood from your reading, e.g. your understanding
about its contribution to the related research topic. The Internet is not a library.
Step 6: Designing a “literature map,” a visual picture of the research Books and journals in a library have editors and
literature on the topic. This map provides a useful organizing device for
positioning your research within the larger body of the literature on the publishers.
topic. Anyone can put anything on the internet.
Step 7: At the same time with (6), beginning to draft summaries of the
most relevant articles using the results in (5). These summaries are Must pay attention to the credibility of the source
combined into the final literature review for the research proposal. Make (sponsored by institutions, reputable private
sure to include precise references.
organizations, governmental agencies, etc).
Step 8: Discussing with peers and supervisors about your research;
either reiterate the process or finally, assemble the literature review in Must be able to separate the wheat from the chaff of
which the literature is organized or structured by its addressed concepts. the internet (phân biệt cái hay cái dở).
Ending with a summary of major themes found before suggesting further
needed research along the lines of your research topic.
37 38
Guidelines for Evaluating Information (1) Guidelines for Evaluating Information (2)
Ref. Elizabeth Kirk (2002) - Johns Hopkins University Library Web page
CONNECTION TO THE LITERATURE
www.library.jhu.edu/elp/useit/evaluate/index.html
Are there references to other works in the field?
AUTHORSHIP Are the appropriate theories discussed?
Is the author a well-known authority? Are controversies acknowledged?
If not, is the author’s work cited approvingly by a known authority?
If not, can you find bibliographical information that would validate the VERIFIABILITY
author’s credentials?
Is there information that would allow you to verify the methodology?
PUBLISHING BODY
Who sponsors the web site? CURRENCY
Is the site linked to a respected organization? Information that exists Is there a date on the document that would allow you to evaluate the
only on a personal website should be considered highly suspect. timeliness of the information?
POINT OF VIEW SEARCH ENGINE
Does the organization sponsoring the website have a point of view?
How the search engine determines the order of hits?
Note: Information provided by corporations should be considered
advertisements. Some search engines sell space to advertisers. How does the search
Be especially wary of information provided by advocacy groups. engine you see determine the order of information listed?
39 40
Estimating Feasibility (1) Estimating Feasibility (2)
If the chance of success or failure of an investigation Availability of Basic Data: do we have access to
could be anticipated as precise as possible at the basic data that would be needed?
research definition phase, then useless efforts could
Familiarization with raw data,
be saved.
Data Sources,
A research problem shall be evaluated, for its Data Collection Method,
feasibility, under the following angles:
Requirement for Specific Equipments,
Investigation domains: is the research topic the
development of a thought, an idea, or a mixture of both? Operating Specific Equipments.
What are the associated scientific domains? Do we have
enough knowledge to evaluate it? Qualification: what are the primary and secondary
Research Problem: Can we illustrate the topic by a simple scientific or technological fields that would be
description (with short and concise wordings) under the needed in the search for the solutions? Are we
form of a question? capable to perform research in these fields?
41 42
Decision Criteria Decision Criteria
Primary Criterion: Advanced Decisional Criterion:
Personal Interests: research topic must stimulate Timing : Is the subject “hot?”
imagination, creativity. The researcher must “be Originality: Has it been treated before?
in.” Solidity: Is the research proposal complete? Is there
Size of the study: research topic must be any contradiction?
manageable. Utility: What is the scope of the study? Is it useful?
For which audience? Probable application domains?
Competence / qualification of the «research
team» Morality: is there any moral or ethical issues?
Feasibility: What are the associated constraints?
Potentiality for original contribution.
Human Resources? Time?
Mastering of the domains related to the research Financial Resources? Cost?
topic. Availability of initial data?
43 44
Research Proposal Phần 3
Contents of a research proposal:
Trình bày và giới thiệu kết quả
Characteristics of the research; Objectives and
Context. nghiên cứu:
(use decision criteria to establish skeleton) Papers, Talks, and Chats
Contents and Organization:
(from tutorial of Prof. Marie desJardins (University of Maryland)
Information to be highlighted, keywords
ICML/KDD 2003
Executive Summary,
Introductory Notes,
Major elements of the Proposal,
Deliveries and Annexes.
Financial Proposal
45 46
Research isn’t just research Networking
Who cares what you do, if you never tell them? Meet people! It helps to have an objective:
Find out what research they’re currently working on
You’ll need to present your ideas in various forms and
venues: Tell them what you’re currently working on
Find an area of common interest
Networking with colleagues at UMBC and elsewhere
Learn what their visions/future directions are
Writing and submitting papers to workshops, conferences,
and journals Suggest a new direction for research or topic for a class
Presenting papers at workshops and conferences What’s in this interaction for you?
Putting together a website that highlights your interests and What’s in it for them?
research activities
If you know two friends, and they know two friends,
…oh, and these things also provide useful experience and they know two friends… Pretty soon you know
for job interviews, not to mention valuable job skills… everybody!
47 48
Networking II Writing and submitting papers
You need to be prepared to summarize your For a master’s thesis, you should aim to have at least
one “good” conference paper by the time you
research graduate
For a thesis topic, you should have a 1-minute, For a doctoral dissertation, you should aim for a
5-minute, and 15-minute presentation already couple of good conference papers and a journal
thought through paper
The same goes for other projects you’ve been Writing these papers is great practice for the thesis
working on itself… (and you can reuse the material!)
Be able to distinguish between your original Where to submit?
Look at publication lists of people doing research related to
contributions, your advisor’s contributions, and yours, and see where they publish
ideas drawn from previous research Publish at the conferences that have the most interesting
Practice with other students! papers
49 50
Writing papers: Strategy Writing papers: Design
First, decide where you plan to submit the paper Abstract –summarizes the research contributions, not the paper
(i.e., it shouldn’t be an outline of the paper)
You may not finish in time, but having a deadline is always
Introduction/motivation – what you’ve done and why the reader
helpful
should care, plus an outline of the paper
care
Two to four months away is a good planning horizon
Technical sections – one or more sections summarizing the
Next, decide what you will say research ideas you’ve developed
What are the key ideas? Have you developed them yet? Experiments/results/analysis – one or more sections presenting
What are the key results? Have you designed and run the experimental results and/or supporting proofs
experiments yet? Have you analyzed the data? Future work – summary of where you’re headed next and open
questions still to be answered
What is the key related work? Have you read the relevant
background material? Can you give a good summary of it? Conclusions – reminder of what you’ve said and why it’s important
Related work – sometimes comes after introduction, sometimes
Now get started on the work you need to do to fill in the
before conclusions (depends to some extent on whether you’re
missing holes! (You can write in parallel…) building on previous research, or dismissing it as irrelevant)
51 52
Writing papers: Tactics Authorship
Top-down design (outline) is very helpful Who should be an author?
Anyone who contributed significantly to the conceptual
Bulleted lists can help you get past writer’s block
development or writing of the paper
Unless you’re a really talented/experienced writer, you should use
Not necessarily people who provided feedback, implemented
these tools before you start writing prose
code, or ran experiments
Neatness counts! Check spelling, grammar, consistency of What order should the authors be listed in?
fonts and notation before showing it to anyone for review
If some authors contributed more of the conceptual development
If they’re concentrating on your typos, they might miss what’s and/or did most/all of the writing, they should be listed first
interesting about the content
If the contribution was equal or the authors worked as a team, the
Leave time for reviews! authors should be listed in alphabetical order
Fellow students, collaborators, advisors, … Sometimes the note “The authors are listed in alphabetical order”
A paper is only done when it’s submitted... and usually not even is explicitly included
then.
53 54
Giving talks Giving talks II
Know how long you have
Know who your audience is
How long is the talk? Are questions included?
Don’t waste time on basics if you’re talking to an
A good heuristic is 2-3 minutes per slide
audience in your field
If you have too many slides, you’ll skip some or—worse—rush
desperately to finish. Avoid this temptation!! Even for these people, you need to be sure
Almost by definition, you never have time to say everything you’re explaining each new concept clearly
about your topic, so don’t worry about skipping some things! On the other hand, you’ll lose people in a
Unless you’re very experienced giving talks, you should practice general audience if you don’t give the necessary
your timing:
background
A couple of times on your own to get the general flow
At least one dry run to work out the kinks
In any case, the most important thing is to
A run-through on your own the night before the talk
emphasize what you’ve done and why they
should care!
55 56
Giving talks III Preparing slides
Know what you want to say Don’t just read your slides!
Just giving a project summary is not interesting to most people Use the minimum amount of text necessary
You should give enough detail to get your interesting ideas Use examples
across (and to show that you’ve actually solved, but not enough Use a readable, simple, yet elegant format
to lose your audience
Use color to emphasize important points, but avoid
They want to hear what you did that was cool and why they the excessive use of color
should care
“Hiding” bullets like this is annoying (but sometimes
Preferably, they’ll hear the above two points at the beginning of effective), but…
the talk, over the course of the talk, and at the end of the talk Abuse of animation is a cardinal sin!
If they’re intrigued, they’ll ask questions or read your paper
Don’t fidget, and…
Whatever you do, don’t just read your slides!
Don’t just read your slides!
57 58
How to give a bad talk Some useful resources
Advice from Dave Patterson, summarized by Mark Hill
Writing:
1. Thou shalt not be neat
Lynn DuPre, Bugs in Writing
2. Thou shalt not waste space
3. Thou shalt not covet brevity Strunk & White, Elements of Style
4. Thou shalt cover thy naked slides Giving talks:
5. Thou shalt not write large Mark Hill, “Oral presentation advice”
6. Thou shalt not use color Patrick Winston, “Some lecturing heuristics”
7. Thou shalt not illustrate Simon L. Peyton Jones et al., “How to give a
8. Thou shalt not make eye contact good research talk”
9. Thou shalt not skip slides in a long talk Dave Patterson, “How to have a bad career in
10. Thou shalt not practice research/academia”
59 60
Phần 4 English pronunciation
Một vài kinh nghiệm cá nhân Usually do not pronounce vowel
(from what I have discussed with students from Vietnam) Examples
book vs. books
Text mining vs “tech” mining
Adapter [a-da-pu-ta]
She asks me if I can fly to the moon
61 62
Research proposal (typically in Japan) If I need to give an advice
Objectives To be self-confident
What to do clearly
Its significance
Background and research context
Who are doing similar research, related research?
What are approaches to solve the problems?
Your critical view on the related work
Methodology and plan
What could be the key idea of the solution?
63 64