為更好覆蓋植物學各個領域的詞匯,作者選取9個主流植物學期刊10年內所發(fā)表的開放獲取的論文內容為原始數據,包括Nature Plants、Plant Cell、New Phytologist、PlantPhysiology、Plant Biotechnology J、Plant Journal、Plant Cell Environment及Horticulture Research,因為這些期刊只有部分內容是開放獲取的,無法開放獲取的我們抓取摘要部分文字,為更全面覆蓋更多高頻詞匯,作者選取開放獲取期刊Frontiersin PlantScience以增加本高頻詞匯的準確性,來自以上9個植物學期刊共有36105篇,其中來自Frontiers in PlantScience的文章共有8823篇。通過技術手段獲得詞匯共計20余萬,其中包括一些組合詞匯、大量縮寫及同一詞根的不同時態(tài)等,而且多數具有極低的頻率,因此通過對不同頻率的單詞進行一個評估,作者選取出現頻次高于3000的為基準,頻次為3000的概念為,您每讀10篇文獻(包括摘要),其中一篇里有這個詞匯,其實這個概率已經很低,換個角度理解,如果您掌握了這個頻率的單詞,閱讀文獻將不存在任何障礙。