คำถามในหัวข้อ 'dplyr'
ความถี่สัมพัทธ์ / สัดส่วนด้วย dplyr
สมมติว่าฉันต้องการคำนวณสัดส่วนของค่าต่างๆ ภายในแต่ละกลุ่ม ตัวอย่างเช่น การใช้ข้อมูล mtcars ฉันจะคำนวณความถี่ สัมพัทธ์ ของจำนวน เกียร์ ด้วย am (อัตโนมัติ/แมนนวล) ในครั้งเดียวได้อย่างไร กับ dplyr ?
library(dplyr)
data(mtcars)
mtcars <-...
191341 มุมมอง
schedule
19.01.2024
สตริงอักขระเป็นอาร์กิวเมนต์ฟังก์ชัน r
ฉันกำลังทำงานกับ dplyr และสร้างโค้ดเพื่อคำนวณข้อมูลใหม่ที่ถูกลงจุดด้วย ggplot
ฉันต้องการสร้างฟังก์ชันด้วยโค้ดนี้ ควรใช้ชื่อของคอลัมน์ของกรอบข้อมูลที่ถูกจัดการโดย dplyr อย่างไรก็ตาม การพยายามทำงานกับชื่อคอลัมน์ไม่ได้ผล...
5589 มุมมอง
schedule
25.12.2023
กรองกรอบข้อมูลตามชื่อคอลัมน์อักขระ (เป็น dplyr)
ฉันมีกรอบข้อมูลและต้องการกรองด้วยวิธีใดวิธีหนึ่งจากสองวิธี โดยคอลัมน์ "นี้" หรือคอลัมน์ "นั่น" ฉันต้องการที่จะอ้างถึงชื่อคอลัมน์เป็นตัวแปร ฉันจะอ้างถึงชื่อคอลัมน์ด้วยตัวแปรได้อย่างไร (ใน dplyr หากสร้างความแตกต่าง)
library(dplyr)
df <-...
37630 มุมมอง
schedule
29.12.2023
R: วิธีกรอง/ซับเซ็ตลำดับวันที่
ฉันมีข้อมูลนี้: (สมบูรณ์สำหรับเดือนธันวาคม)
date sessions
1 2014-12-01 1932
2 2014-12-02 1828
3 2014-12-03 2349
4 2014-12-04 8192
5 2014-12-05 3188
6 2014-12-06 3277
และจำเป็นต้องตั้งค่าย่อย/กรองสิ่งนี้ เช่น ตั้งแต่...
91399 มุมมอง
schedule
03.12.2023
ใช้ฟังก์ชันใน groupby พร้อมชื่อคอลัมน์ตัวแปรใน R โดยใช้ dplyr [ซ้ำกัน]
ฉันมีดาต้าเฟรม:
df <- data.frame(Category = c(rep("A", 3), rep("B", 3)), Value = rnorm(6))
df
Category Value
1 A -0.94968814
2 A 2.56687061
3 A -0.15665153
4 B -0.47647105
5 B 0.83015076
6 B...
1305 มุมมอง
schedule
18.01.2024
วิธีง่ายๆ ในการเพิ่มการสังเกตไปยัง dataframe ที่มีอยู่?
ฉันมี dataframe ที่มีอยู่ซึ่งฉันต้องการเพิ่มการสังเกตที่อัปเดต ฉันสามารถระบุการสังเกตที่อัปเดตเหล่านี้ได้ด้วย ID และตัวแปรจุดเวลา ฉันได้ลองลบการสังเกตที่ล้าสมัยออกจาก dataframe ที่มีอยู่แล้วลองใช้ฟังก์ชัน merge() เพื่อผสานกับ dataframe...
912 มุมมอง
schedule
04.11.2023
ฉันสามารถสร้างหลายคอลัมน์จากกลุ่มเดียวโดยการกลายพันธุ์ได้หรือไม่
ฉันต้องการจัดกลุ่ม dataframe ของฉันในคอลัมน์ใดคอลัมน์หนึ่ง จากนั้นใช้ฟังก์ชันกับข้อมูลที่จัดกลุ่มซึ่งส่งคืนหลายคอลัมน์ โดยยกตัวอย่าง ให้พิจารณาสิ่งต่อไปนี้
Names = append(rep('Mark',10),rep('Joe',10))
Spend = rnorm(length(Names),50,0.5)
df <-...
298 มุมมอง
schedule
08.11.2023
การเปลี่ยนค่าตัวแปรให้เป็นชื่อคอลัมน์ ตัวระบุซ้ำสำหรับแถวใน tidyr::spread
ฉันกำลังทำงานกับไฟล์ผู้มีสิทธิเลือกตั้งที่ยุ่งเหยิง พิจารณา tibble ต่อไปนี้:
library(dplyr)
library(tidyr)
dat <- tibble(
id = factor(c("A","B","C","D","E")),
demographic_info1 = round(rnorm(5),2),
demographic_info2 =...
565 มุมมอง
schedule
05.01.2024
สเปรดส่งคืนข้อผิดพลาดตัวระบุที่ซ้ำกันแม้ว่าจะมีแถวที่ไม่ซ้ำรวมอยู่ด้วยก็ตาม
ฉันมีดาต้าเฟรมต่อไปนี้:
location asset_status count row
<chr> <chr> <dbl> <int>
1 location1 Owned 1 1
2 location1 Available 1 2
3 location1 Owned 1 3...
54 มุมมอง
schedule
13.12.2023
dplyr แทนที่ค่าในหลายตัวแปร
ฉันต้องเปลี่ยน non-4 เป็น 80 ในสูบ, เกียร์, คอลัมคาร์บ ฉันลองทำสิ่งต่อไปนี้แล้ว แต่มันไม่ทำงาน
mtcars %>% mutate_at(vars(cyl, gear, carb), replace(which(.!=4), 80))
มันแสดงข้อผิดพลาดต่อไปนี้:
Error in replace(which(. != 4), 80) :...
3543 มุมมอง
schedule
27.11.2023
Dplyr คำนวณค่าเฉลี่ยและความแปรปรวนโดยไม่มีข้อมูลทั้งหมด
ฉันมีชุดข้อมูลที่เริ่มต้นดังนี้:
set.seed(50)
n <- 20
s_num <- c(10,20,30)
counts <- c(0,1,2,3,4)
strata <- sample(s_num, n, replace=T)
sites <- seq(1, n, by=1)
observed <- sample(counts, n, replace=T)
df <-...
2663 มุมมอง
schedule
04.12.2023
ฉันจะกำหนดช่วงเวลาวันที่ / เวลาระหว่างการจัดกลุ่มตัวแปรที่มีความยาวต่างกันโดยใช้ tidyverse ได้อย่างไร
ในชุดข้อมูลของฉัน ID สามารถปรากฏได้หนึ่งครั้ง สองครั้ง หรือสามครั้งขึ้นไป ฉันกำลังพยายามหาช่วงเวลาระหว่างแต่ละกรณีที่แตกต่างกันเหล่านี้ เช่น อะไรคือช่วงเวลาระหว่างการปรากฏตัวครั้งแรกและครั้งที่สองของ ID "AA"...
29 มุมมอง
schedule
30.10.2023
`dplyr::summarise` ไม่ยอมรับฟังก์ชันภายนอก
ฉันมีชุดข้อมูลดังต่อไปนี้:
dataset=structure(list(var1 = c(28.5627505742013, 22.8311421908438, 95.2216156944633,
43.9405107684433, 97.11211245507, 48.4108281508088, 77.1804554760456,
27.1229329891503, 69.5863061584532, 87.2112890332937), var2 =...
85 มุมมอง
schedule
10.11.2023
การรวมชุดของคอลัมน์เฟรมข้อมูล
อาจจะเป็นเรื่องง่ายๆ
ฉันมี data.frame ประเภทนี้:
df <- data.frame(sp1.name = c("sp1.n1",NA,"sp1.n3",NA), sp1.id = c("sp1.id1","sp1.id2",NA,NA),
sp2.name = c(NA,NA,"sp2.n3",NA), sp2.id = c(NA,NA,NA,"sp2.id4"),...
57 มุมมอง
schedule
06.12.2023
จัดกลุ่มตามและค้นหาหมายเลขที่ใกล้ที่สุด
ข้อมูลมีให้ที่ด้านล่างของหน้า ฉันมี 2 เฟรมข้อมูล df1 และ df2
df1:
ticker Price
<chr> <dbl>
SPY 200.00
AAPL 100.00
df2:
ticker expiration strike
<chr> <dbl> <dbl>
SPY 0621 180...
139 มุมมอง
schedule
18.01.2024
R: การล้าหลังวัตถุ xts โดยโหลด dplyr
ขณะนี้ฉันกำลังทำงานกับโค้ดบางตัวที่ต้องใช้ทั้งฟังก์ชัน transpose จาก dplyr และฟังก์ชัน lag สำหรับ xts
lagging xts ทำงานได้ดีด้วยตัวมันเอง แต่เมื่อโหลด dplyr มันทำให้ฉันมีข้อผิดพลาดตัวห้อยอยู่นอกขอบเขต ฉันจะแก้ไขสิ่งนี้ได้อย่างไร??...
126 มุมมอง
schedule
14.01.2024
เพิ่ม 1 ให้กับมูลค่าเมื่ออันดับเพิ่มขึ้น
ฉันกำลังทำงานกับข้อมูลจัดอันดับที่จัดกลุ่มซึ่งมีละติจูดและลองจิจูด ฉันต้องการเพิ่ม 0.00075 ลงในเขตข้อมูลละติจูดทุกครั้งที่อันดับเพิ่มขึ้น 1
ด้านล่างนี้เป็นหนึ่งใน 5,000 กลุ่มและไม่ทราบว่าชั้นวางสูงสุดจะเป็นเท่าใด ดังนั้นฉันจึงต้องการสิ่งนี้ภายใน...
50 มุมมอง
schedule
27.10.2023
จะทราบความแตกต่างระหว่างตัวแปรและความล่าช้าโดยพิจารณาจากวันที่ของเดือนต่อกลุ่มได้อย่างไร
โดยพื้นฐานแล้ว ฉันมีชุดข้อมูลที่มีตัวแปรระบุกลุ่ม วันที่ และค่าของตัวแปร ฉันจำเป็นต้องหาผลต่างระหว่างมูลค่ากับมูลค่าสิ้นปีก่อนหน้าต่อกลุ่ม เนื่องจากข้อมูลมีความสมดุล ฉันจึงพยายามทำเช่นนั้นด้วย dplyr::lag โดยแทรกความล่าช้าตามเดือนของการสังเกต:...
111 มุมมอง
schedule
24.11.2023
การใส่ NA ด้วย LOCF แบบมีเงื่อนไข
ฉันได้อัปเดตปัญหาใหม่ที่แตกต่าง คราวนี้ฉันต้องการรับคอลัมน์ Oxy2 จาก Oxy
ID Oxy Y Oxy2
1 NA 2010 NA
1 0 2011 0
1 NA 2012 NA
1 1 2013 1
1 NA 2014 1
1 NA 2015 1
1 -1 2016 1
2 0 2011 0
2 NA 2012 NA
2 1 2013...
244 มุมมอง
schedule
08.12.2023
คำนวณความยาวกลางคืนเป็น r
มือใหม่กำลังมองหาความช่วยเหลือ
ฉันกำลังพยายามคำนวณระยะเวลากลางคืนสำหรับวันที่ที่กำหนดในหน่วย r แต่ฉันประสบปัญหาในการคำนวณ เพื่อให้เป็นไปตามบริบท ข้อมูลการสำรวจจะได้รับระหว่างพระอาทิตย์ตก (-30 นาที) ถึงพระอาทิตย์ขึ้น (+30 นาที)...
237 มุมมอง
schedule
15.01.2024