Articles
为什么同一篇论文改了几句话,iThenticate 结果变化很大?
同一篇论文只修改少量文字,iThenticate 结果也可能明显变化。原因可能和匹配来源、文本切分、过滤设置和文件格式有关。
只改几句话,分数却跳了,确实会让人困惑
不少作者遇到过这种情况:第一次 iThenticate查重 是 12%,修改了几句话后再查,结果变成 17%;或者删掉一段参考文献说明,分数反而没降多少。看起来很奇怪,但这种变化并不一定说明系统不稳定。相似度报告不是简单按字数加减,它涉及文本如何被切分、如何匹配来源、哪些内容被过滤。
有时你改掉一段文字,系统会重新找到另一个更接近的来源;有时你删掉某些句子后,剩余匹配在全文中的占比反而变高。百分比是相对值,不是原始匹配字数,所以小修改也可能带来明显变化。
分母变化会影响百分比
相似度是按整篇文本比例呈现的。如果你删掉了不少非匹配内容,匹配内容的比例可能反而上升。举个简单例子,原来全文较长,匹配段落占比不高;后来删掉了很多不匹配的说明,剩下的匹配段落占全文比例变大,分数就可能上去。
这也是为什么不建议为了降分盲目删内容。删掉不相关内容未必能降低风险,反而可能让剩下的高亮更集中。真正应该处理的是高风险匹配本身,而不是只对总字数动手。
匹配来源可能会重新排序
iThenticate 报告里的 Top Sources 不是固定不变的。你改写某个段落后,原本匹配的来源弱了,另一个来源可能变得更明显。报告会根据当前文本重新计算来源匹配,这就会让你感觉“我明明改了,怎么还有新问题出来”。其实不是新问题凭空出现,而是原来被其他匹配遮住了。
所以每次修改后,不要只看总分升降,也要看高亮位置有没有变化。分数升一点,但高风险连续段落消失了,可能是好事;分数降了,但单一来源仍然很高,未必安全。
文件格式和过滤设置也会造成差异
如果第一次用 Word,第二次用 PDF,或者一次排除了参考文献,一次没有排除,结果当然可能不同。甚至同一个文件导出方式不同,文本提取顺序也可能变化。尤其是有表格、脚注、图注、复杂公式的论文,文件解析会影响报告呈现。
为了减少误差,建议修改前后使用同一种文件格式、同一套过滤设置、同一个稿件范围。做 iThenticate检测 时,稳定流程比反复换版本更重要。你要比较的是修改效果,而不是把格式变量也混进去。