一千萬個為什麽

搜索

R在DataFrame列中高效查找值

我有一個大的R數據幀,我需要根據兩列$ start和$ end多次查找行。我想,典型的解決方案是O(N):

data[data$start <= start & data$end >= end, 1]

我寧願排序至少一個列並進行更有效的O(log(N))查找。有哪些內置R方法可以利用數據框中的排序進行查找?

最佳答案

我意識到這是一個老問題。只是想為那些在R中搜索快速查找的人提供一個鏈接。

Lookup performance in R - Joseph Adler. I find it to be quite comprehensive for my needs. He advocates the double bracket notation ([[) and provides time comparisons for multiple alternatives.

轉載註明原文: R在DataFrame列中高效查找值