目录
- 定冠词/不定冠词的使用 a an the
- 句子不要太长
- 在段落开始直接陈述中心思想
- 不要在段落开头直接使用时间状语从句
- 将重要的主语放在最最开始以表示强调
- which/that所引导的定语从句的指代不明
- Respectively的使用
- 有关in this paper/study
- 数字
- ‘Figure’ and ‘Table’
- ‘such as’ and ‘etc.’
- 其他惯用法:单复数、固定搭配等
- 个人在头论文过程中遇到的一些副词的使用
- 一些提升逼格的词组
- 总结
本文总结了中国学生写作英文科技论文时常见的表达错误。(一些本文内没有提到的特定用法、搭配等也会不定期更新。)
定冠词/不定冠词的使用 a an the
一般来说,关于冠词的错误有三类:
- 需要时省略(这个情况是非常多的)。
- 在不需要的地方使用。
- 用错。
比如:
回忆一下初中时学过的语法,the在下述情况下需要添加:
- 表示特指,说话人双方都知道的事物。
- 表示独一无二的事物,原理和第一条差不多,比如the sun,the moon。
- 用于单数名词之前表示类别,比如,the phone,表示所有电话。
- 用于形容词之前表示类别,比如,the old。
- 用于序数词或者最高级之前,the first,the best,通常可以省略。
- 用于表示乐器,the piano。
- 用于姓氏的复数前,表示XXX一家子。比如,The Greens。
- 表示年代,比如,the fifties。
- 用于江河湖海之前,the Yellow River。
- 由普通名词构成的专有名词,比如the Tree Street。 而在NLP中,一些专有名词,比如BERT,CNN似乎都可以不加the。
本文也给出了相应的冠词选择流程:
句子不要太长
在英语中,主要观点和论点通常是在单独的句子中写的。可以通过将每句话的主题限制在一两个来避免长句子。一般来说,超过60单词的句子便是长句子了。另一个经常见到的超长问题是作者想要给出大量的数据,通常是参数值,并将这些信息放入一个长段落大小的句子中。这种情况下,最好使用一个列表代替:
在段落开始直接陈述中心思想
中国作者常以目的、理由、例子和条件作为引言,为主要话题作铺垫。然而,这就降低了中心思想的重要性。把中心思想放在句子的开头可以使章节的逻辑更加清晰。比如:
当然,在人工智能领域的相应写作似乎并没有那么严格,只需要在章节的开头点名主题即可。比如,在描述Related work时最好给出总结:In this section, we summarize some relevant work, including language models, …, and … 而不是一开始就直接进入 subsection描述language model。
而且,期刊与会议的要求不尽相同,期刊的要求更为严格,需要给出很清晰的总结性描述,而会议多数情况都要求篇幅,因此一些不必要的总结往往被省略。
不要在段落开头直接使用时间状语从句
这个很好理解,给出一个例子即可:
将重要的主语放在最最开始以表示强调
which/that所引导的定语从句的指代不明
which所指的先行词(名词或代词)不明确,导致混淆。
对于限定性定语从句:A shop should keep a stock of those goods which sell best. 需要额外注意which引领的时态,尤其是一般现在时的第三人称单数的问题。对于非限定性定语从句,which往往指代前一个句子:Internet is so interesting,which makes all possible happen。
常见的就是这两种了。对于时间状语从句的代替暂且不表。
Respectively的使用
通常在句末,为了强调几个相对应的表达的顺序。比如下述例子,表示两个list的一一对应:
位置错误:
有关in this paper/study
in this paper/study经常出现过度使用的现象,一般来说,只有两个地方用得到:
- 在引言和结论部分强调论文的内容。
- 在论文的正文部分,引用了作者在其他期刊文章的工作。
还有一种较为微妙的错误,就是in this paper以及in this study的混淆(这个我之前都没注意到过…)。study是作者所做的工作,paper是作品呈现的方式,也是读者所持有/阅读的内容,作者也可以使用其他短语,如“in this research”和“this paper present”。但是,阐述具体的研究内容需要使用 in this study:
数字
使用阿拉伯数字本身并不是一个错误,但是不应该用在句子的开头:
此外,阿拉伯数字不要被过度使用。比如,不应使用阿拉伯数字提供一般信息,但是可以提供数据阐述:
‘Figure’ and ‘Table’
这个举一个例子即可:
不过对于latex的用户来说,很少会出现这种错误。
‘such as’ and ‘etc.’
这俩都表示’等等’,因此一起使用是错误的。它们表示将给出一个不完整的列表,不应该在给出完整列表时使用。
其他惯用法:单复数、固定搭配等
有些单词有相同的单数和复数形式,不需要加s就可以变成复数。另外,注意一些不规则的复数的变化,比如index–indices。
另外,举了一些不合理的固定搭配:
不要使用by this way这种说法,使用by doing this,using this method代替。
不要以’How to…'作为句子的开始(话说这种表达我在好多会议论文里都见过):
the results are shown in Figure 2而不是the results are showed as
Figure 2。注意shown才是被动语态中该使用的过去分词。
永远不要写Obviously!好多新手都会犯这样的错误(包括我),一定要使用客观的语言去描述,不要带有感情、程度倾向的词。
不要过度使用that is to say这种一个意思多次表达的形式,除非是非常必要的解释。
永远不要在文章中出现too,这是口头的表达方式,用also。
个人在头论文过程中遇到的一些副词的使用
Specifically和Specially。这两个都表示“明确地;具体地;特意;专门地;具体来说;确切地说”的含义,但是后者比较不正式,因此审稿人会建议使用前者。
Thus和So:
也就是说,表示强烈因果关系的论文写作上下文中,还是使用Thus来得专业。
一些提升逼格的词组
is due to以及is attributed to。这个似乎比较抽象,后者看起来逼格更高一些,但是实际上这俩是都对的。比如审稿人对这句话
The improvement of LP-MTC compared with Bert-MLM is due to the use of label templates, which increases the input token length
给出了如下的修改建议:
is due to the use of --> is attributed to the use of (avoid repeating ‘due to’ in consecutive sentences).
总结
牢记上述要点,结合一些翻译、语法纠错软件,专业的英文润色并不是必须的。