คำถามในหัวข้อ 'dplyr'

ความถี่สัมพัทธ์ / สัดส่วนด้วย dplyr
สมมติว่าฉันต้องการคำนวณสัดส่วนของค่าต่างๆ ภายในแต่ละกลุ่ม ตัวอย่างเช่น การใช้ข้อมูล mtcars ฉันจะคำนวณความถี่ สัมพัทธ์ ของจำนวน เกียร์ ด้วย am (อัตโนมัติ/แมนนวล) ในครั้งเดียวได้อย่างไร กับ dplyr ? library(dplyr) data(mtcars) mtcars <-...
191341 มุมมอง
schedule 19.01.2024

สตริงอักขระเป็นอาร์กิวเมนต์ฟังก์ชัน r
ฉันกำลังทำงานกับ dplyr และสร้างโค้ดเพื่อคำนวณข้อมูลใหม่ที่ถูกลงจุดด้วย ggplot ฉันต้องการสร้างฟังก์ชันด้วยโค้ดนี้ ควรใช้ชื่อของคอลัมน์ของกรอบข้อมูลที่ถูกจัดการโดย dplyr อย่างไรก็ตาม การพยายามทำงานกับชื่อคอลัมน์ไม่ได้ผล...
5589 มุมมอง
schedule 25.12.2023

กรองกรอบข้อมูลตามชื่อคอลัมน์อักขระ (เป็น dplyr)
ฉันมีกรอบข้อมูลและต้องการกรองด้วยวิธีใดวิธีหนึ่งจากสองวิธี โดยคอลัมน์ "นี้" หรือคอลัมน์ "นั่น" ฉันต้องการที่จะอ้างถึงชื่อคอลัมน์เป็นตัวแปร ฉันจะอ้างถึงชื่อคอลัมน์ด้วยตัวแปรได้อย่างไร (ใน dplyr หากสร้างความแตกต่าง) library(dplyr) df <-...
37630 มุมมอง
schedule 29.12.2023

R: วิธีกรอง/ซับเซ็ตลำดับวันที่
ฉันมีข้อมูลนี้: (สมบูรณ์สำหรับเดือนธันวาคม) date sessions 1 2014-12-01 1932 2 2014-12-02 1828 3 2014-12-03 2349 4 2014-12-04 8192 5 2014-12-05 3188 6 2014-12-06 3277 และจำเป็นต้องตั้งค่าย่อย/กรองสิ่งนี้ เช่น ตั้งแต่...
91399 มุมมอง
schedule 03.12.2023

ใช้ฟังก์ชันใน groupby พร้อมชื่อคอลัมน์ตัวแปรใน R โดยใช้ dplyr [ซ้ำกัน]
ฉันมีดาต้าเฟรม: df <- data.frame(Category = c(rep("A", 3), rep("B", 3)), Value = rnorm(6)) df Category Value 1 A -0.94968814 2 A 2.56687061 3 A -0.15665153 4 B -0.47647105 5 B 0.83015076 6 B...
1305 มุมมอง
schedule 18.01.2024

วิธีง่ายๆ ในการเพิ่มการสังเกตไปยัง dataframe ที่มีอยู่?
ฉันมี dataframe ที่มีอยู่ซึ่งฉันต้องการเพิ่มการสังเกตที่อัปเดต ฉันสามารถระบุการสังเกตที่อัปเดตเหล่านี้ได้ด้วย ID และตัวแปรจุดเวลา ฉันได้ลองลบการสังเกตที่ล้าสมัยออกจาก dataframe ที่มีอยู่แล้วลองใช้ฟังก์ชัน merge() เพื่อผสานกับ dataframe...
912 มุมมอง
schedule 04.11.2023

ฉันสามารถสร้างหลายคอลัมน์จากกลุ่มเดียวโดยการกลายพันธุ์ได้หรือไม่
ฉันต้องการจัดกลุ่ม dataframe ของฉันในคอลัมน์ใดคอลัมน์หนึ่ง จากนั้นใช้ฟังก์ชันกับข้อมูลที่จัดกลุ่มซึ่งส่งคืนหลายคอลัมน์ โดยยกตัวอย่าง ให้พิจารณาสิ่งต่อไปนี้ Names = append(rep('Mark',10),rep('Joe',10)) Spend = rnorm(length(Names),50,0.5) df <-...
298 มุมมอง
schedule 08.11.2023

การเปลี่ยนค่าตัวแปรให้เป็นชื่อคอลัมน์ ตัวระบุซ้ำสำหรับแถวใน tidyr::spread
ฉันกำลังทำงานกับไฟล์ผู้มีสิทธิเลือกตั้งที่ยุ่งเหยิง พิจารณา tibble ต่อไปนี้: library(dplyr) library(tidyr) dat <- tibble( id = factor(c("A","B","C","D","E")), demographic_info1 = round(rnorm(5),2), demographic_info2 =...
565 มุมมอง
schedule 05.01.2024

สเปรดส่งคืนข้อผิดพลาดตัวระบุที่ซ้ำกันแม้ว่าจะมีแถวที่ไม่ซ้ำรวมอยู่ด้วยก็ตาม
ฉันมีดาต้าเฟรมต่อไปนี้: location asset_status count row <chr> <chr> <dbl> <int> 1 location1 Owned 1 1 2 location1 Available 1 2 3 location1 Owned 1 3...
54 มุมมอง
schedule 13.12.2023

dplyr แทนที่ค่าในหลายตัวแปร
ฉันต้องเปลี่ยน non-4 เป็น 80 ในสูบ, เกียร์, คอลัมคาร์บ ฉันลองทำสิ่งต่อไปนี้แล้ว แต่มันไม่ทำงาน mtcars %>% mutate_at(vars(cyl, gear, carb), replace(which(.!=4), 80)) มันแสดงข้อผิดพลาดต่อไปนี้: Error in replace(which(. != 4), 80) :...
3543 มุมมอง
schedule 27.11.2023

Dplyr คำนวณค่าเฉลี่ยและความแปรปรวนโดยไม่มีข้อมูลทั้งหมด
ฉันมีชุดข้อมูลที่เริ่มต้นดังนี้: set.seed(50) n <- 20 s_num <- c(10,20,30) counts <- c(0,1,2,3,4) strata <- sample(s_num, n, replace=T) sites <- seq(1, n, by=1) observed <- sample(counts, n, replace=T) df <-...
2663 มุมมอง
schedule 04.12.2023

ฉันจะกำหนดช่วงเวลาวันที่ / เวลาระหว่างการจัดกลุ่มตัวแปรที่มีความยาวต่างกันโดยใช้ tidyverse ได้อย่างไร
ในชุดข้อมูลของฉัน ID สามารถปรากฏได้หนึ่งครั้ง สองครั้ง หรือสามครั้งขึ้นไป ฉันกำลังพยายามหาช่วงเวลาระหว่างแต่ละกรณีที่แตกต่างกันเหล่านี้ เช่น อะไรคือช่วงเวลาระหว่างการปรากฏตัวครั้งแรกและครั้งที่สองของ ID "AA"...
29 มุมมอง
schedule 30.10.2023

`dplyr::summarise` ไม่ยอมรับฟังก์ชันภายนอก
ฉันมีชุดข้อมูลดังต่อไปนี้: dataset=structure(list(var1 = c(28.5627505742013, 22.8311421908438, 95.2216156944633, 43.9405107684433, 97.11211245507, 48.4108281508088, 77.1804554760456, 27.1229329891503, 69.5863061584532, 87.2112890332937), var2 =...
85 มุมมอง
schedule 10.11.2023

การรวมชุดของคอลัมน์เฟรมข้อมูล
อาจจะเป็นเรื่องง่ายๆ ฉันมี data.frame ประเภทนี้: df <- data.frame(sp1.name = c("sp1.n1",NA,"sp1.n3",NA), sp1.id = c("sp1.id1","sp1.id2",NA,NA), sp2.name = c(NA,NA,"sp2.n3",NA), sp2.id = c(NA,NA,NA,"sp2.id4"),...
57 มุมมอง
schedule 06.12.2023

จัดกลุ่มตามและค้นหาหมายเลขที่ใกล้ที่สุด
ข้อมูลมีให้ที่ด้านล่างของหน้า ฉันมี 2 เฟรมข้อมูล df1 และ df2 df1: ticker Price <chr> <dbl> SPY 200.00 AAPL 100.00 df2: ticker expiration strike <chr> <dbl> <dbl> SPY 0621 180...
139 มุมมอง
schedule 18.01.2024

R: การล้าหลังวัตถุ xts โดยโหลด dplyr
ขณะนี้ฉันกำลังทำงานกับโค้ดบางตัวที่ต้องใช้ทั้งฟังก์ชัน transpose จาก dplyr และฟังก์ชัน lag สำหรับ xts lagging xts ทำงานได้ดีด้วยตัวมันเอง แต่เมื่อโหลด dplyr มันทำให้ฉันมีข้อผิดพลาดตัวห้อยอยู่นอกขอบเขต ฉันจะแก้ไขสิ่งนี้ได้อย่างไร??...
126 มุมมอง
schedule 14.01.2024

เพิ่ม 1 ให้กับมูลค่าเมื่ออันดับเพิ่มขึ้น
ฉันกำลังทำงานกับข้อมูลจัดอันดับที่จัดกลุ่มซึ่งมีละติจูดและลองจิจูด ฉันต้องการเพิ่ม 0.00075 ลงในเขตข้อมูลละติจูดทุกครั้งที่อันดับเพิ่มขึ้น 1 ด้านล่างนี้เป็นหนึ่งใน 5,000 กลุ่มและไม่ทราบว่าชั้นวางสูงสุดจะเป็นเท่าใด ดังนั้นฉันจึงต้องการสิ่งนี้ภายใน...
50 มุมมอง
schedule 27.10.2023

จะทราบความแตกต่างระหว่างตัวแปรและความล่าช้าโดยพิจารณาจากวันที่ของเดือนต่อกลุ่มได้อย่างไร
โดยพื้นฐานแล้ว ฉันมีชุดข้อมูลที่มีตัวแปรระบุกลุ่ม วันที่ และค่าของตัวแปร ฉันจำเป็นต้องหาผลต่างระหว่างมูลค่ากับมูลค่าสิ้นปีก่อนหน้าต่อกลุ่ม เนื่องจากข้อมูลมีความสมดุล ฉันจึงพยายามทำเช่นนั้นด้วย dplyr::lag โดยแทรกความล่าช้าตามเดือนของการสังเกต:...
111 มุมมอง
schedule 24.11.2023

การใส่ NA ด้วย LOCF แบบมีเงื่อนไข
ฉันได้อัปเดตปัญหาใหม่ที่แตกต่าง คราวนี้ฉันต้องการรับคอลัมน์ Oxy2 จาก Oxy ID Oxy Y Oxy2 1 NA 2010 NA 1 0 2011 0 1 NA 2012 NA 1 1 2013 1 1 NA 2014 1 1 NA 2015 1 1 -1 2016 1 2 0 2011 0 2 NA 2012 NA 2 1 2013...
244 มุมมอง
schedule 08.12.2023

คำนวณความยาวกลางคืนเป็น r
มือใหม่กำลังมองหาความช่วยเหลือ ฉันกำลังพยายามคำนวณระยะเวลากลางคืนสำหรับวันที่ที่กำหนดในหน่วย r แต่ฉันประสบปัญหาในการคำนวณ เพื่อให้เป็นไปตามบริบท ข้อมูลการสำรวจจะได้รับระหว่างพระอาทิตย์ตก (-30 นาที) ถึงพระอาทิตย์ขึ้น (+30 นาที)...
237 มุมมอง
schedule 15.01.2024