Pertanyaan Bagaimana menemukan jika angka-angka tersebut terus menerus di R?


Saya memiliki berbagai nilai

c(1,2,3,4,5,8,9,10,13,14,15)

Dan saya ingin mencari rentang di mana angka-angka menjadi terputus. Yang saya inginkan adalah ini sebagai output:

(1,5)
(8,10)
(13,15)

Saya perlu mencari titik istirahat.

Saya harus melakukannya di R.


5
2018-04-15 22:05


asal


Jawaban:


Sesuatu seperti ini?

x <- c(1:5, 8:10, 13:15) # example data
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range)
# [[1]]
# [1] 1 5
# 
# [[2]]
# [1]  8 10
# 
# [[3]]
# [1] 13 15

Contoh lain:

x <- c(1, 5, 10, 11:14, 20:21, 23)
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range))
# [[1]]
# [1] 1 1
#
# [[2]]
# [1] 5 5
#
# [[3]]
# [1] 10 14
#
# [[4]]
# [1] 20 21
#
# [[5]]
# [1] 23 23

5
2018-04-15 22:14



x <- c(1:5, 8:10, 13:15)    
rr <- rle(x - seq_along(x))
rr$values <- seq_along(rr$values)
s <- split(x, inverse.rle(rr))
s
# $`1`
# [1] 1 2 3 4 5
# 
# $`2`
# [1]  8  9 10
# 
# $`3`
# [1] 13 14 15

## And then to get *literally* what you asked for:
cat(paste0("(", gsub(":", ",", sapply(s, deparse)), ")"), sep="\n")
# (1,5)
# (8,10)
# (13,15)

4
2018-04-15 22:27



Saya menerbitkan seqle yang akan melakukan ini untuk Anda dalam satu baris. Anda dapat memuat paket cgwtools atau cari SO untuk kode, karena sudah diposting beberapa kali.


1
2018-04-16 00:21



Dengan asumsi bahwa Anda tidak peduli tentang keluaran yang tepat dan mencari min dan maks dari setiap rentang, Anda dapat menggunakan diff / cumsum / range sebagai berikut:

x  <- c(1:5, 8:10, 13:15)
x. <- c(0, cumsum( diff(x)-1 ) ) 

lapply( split(x, x.), range )

0
2018-04-15 22:42