สิ่งตีพิมพ์ในหัวข้อ 'pandas'


ตัวอย่าง Python Pandas 23 อันที่จะช่วยคุณประหยัดเวลา
หากคุณต้องการประหยัดเวลาด้วยโค้ด Python Pandas ลองดูตัวอย่างข้อมูล 23 รายการที่จะช่วยให้คุณได้รับประโยชน์สูงสุดจากข้อมูลของคุณ Python ได้กลายเป็นภาษาการเขียนโปรแกรมที่ได้รับความนิยมมากที่สุดในโลกและมีความหลากหลายมาก Pandas เป็นไลบรารี Python ที่ใช้สำหรับการวิเคราะห์ข้อมูล โดยมีวิธีการที่หลากหลายสำหรับการวิเคราะห์ข้อมูลและมีอินเทอร์เฟซระดับสูงสำหรับกรอบข้อมูล...

ML / การเรียนรู้ภายใต้การดูแล / การจำแนกประเภท KNN [K-เพื่อนบ้านที่ใกล้ที่สุด]
การเรียนรู้ของเครื่องและการวิเคราะห์ข้อมูลด้วย Python[18] วิธีเพื่อนบ้านที่ใกล้ที่สุดวัดระยะทาง โครงสร้างด้านหลังคือระยะแบบยุคลิด import pandas as pd import matplotlib.pyplot as plt original_data=pd.read_csv("C:/Users/Şebnem\Desktop/tutorials/cancer_data.csv") data=original_data.copy() M=data[data["diagnosis"]=="M"] B=data[data["diagnosis"]=="B"] plt.scatter(M.radius_mean,M.texture_mean,color="red",label="malignant..

อธิบายเกี่ยวกับ Pandas Internals
การอธิบายโมเดลข้อมูลแพนด้าและข้อดี การแนะนำ pandas ช่วยให้คุณสามารถเลือกระหว่างอาร์เรย์ประเภทต่างๆ เพื่อแสดงข้อมูลของ dataframe ของคุณได้ ในอดีต dataframes ส่วนใหญ่ได้รับการสนับสนุนโดยอาร์เรย์ NumPy pandas 2.0 แนะนำตัวเลือกในการใช้อาร์เรย์ PyArrow เป็นรูปแบบการจัดเก็บข้อมูล นอกจากนี้ ยังมีชั้นกลางระหว่างอาร์เรย์เหล่านี้กับ dataframe ของคุณ Block และ BlockManager เราจะมาดูกันว่าเลเยอร์นี้ประสานอาร์เรย์ต่างๆ อย่างไร โดยพื้นฐานแล้วมีอะไรอยู่เบื้องหลัง pd.DataFrame()..

แพนด้ารับหุ่นจำลอง
แบบสำรวจด่วนเกี่ยวกับการเข้ารหัสแบบ One-Hot ด้วย Pandas ใน Python3 การแนะนำ: ในบทความนี้ เราจะแนะนำคุณเกี่ยวกับแนวคิดของการเข้ารหัสแบบร้อนแรงโดยใช้ Pandas ซึ่งเป็นไลบรารีการจัดการข้อมูลยอดนิยมใน Python โดยเฉพาะ เราจะใช้ฟังก์ชัน get_dummies() เพื่อสร้างตัวแปรจำลองสำหรับข้อมูลหมวดหมู่ใน 'bikeshare.csv'...

Pandas สำหรับการวิเคราะห์ข้อมูลข้อความ: การใช้ str Accessor เพื่อทำความสะอาดและจัดการข้อมูลข้อความ
ข้อมูลข้อความเป็นข้อมูลประเภทหนึ่งที่ใช้บ่อยที่สุดในการวิเคราะห์ข้อมูลและการเรียนรู้ของเครื่อง อย่างไรก็ตาม ข้อมูลข้อความมักจะยุ่งเหยิงและต้องมีการทำความสะอาดและการประมวลผลล่วงหน้าก่อนจึงจะสามารถวิเคราะห์ได้อย่างมีประสิทธิภาพ Pandas ซึ่งเป็นไลบรารีการวิเคราะห์ข้อมูลที่ทรงพลังใน Python มอบตัวเข้าถึง str ที่สะดวกสบายเพื่อช่วยคุณล้างและจัดการข้อมูลข้อความ

ศิลปะแห่งการทำความสะอาดข้อมูลรูปแบบที่ไม่ถูกต้องด้วย Pandas
ข้อมูลคือเชื้อเพลิงที่ขับเคลื่อนกลไกการเรียนรู้ของเครื่องจักร ด้วยเหตุนี้ จึงจำเป็นอย่างยิ่งที่จะต้องมีข้อมูลที่สะอาดและจัดรูปแบบก่อนที่จะใช้อัลกอริธึมการเรียนรู้ของเครื่องใดๆ โชคดีที่ Pandas ซึ่งเป็นไลบรารีโอเพ่นซอร์สยอดนิยมสำหรับการจัดการและวิเคราะห์ข้อมูล ทำให้ง่ายต่อการล้างข้อมูลในรูปแบบที่ไม่ถูกต้อง ในบทความนี้ เราจะหารือเกี่ยวกับกระบวนการล้างข้อมูลที่มีรูปแบบไม่ถูกต้องด้วย Pandas ขั้นตอนแรกของการล้างข้อมูลคือการระบุรูปแบบที่ไม่ถูกต้อง ซึ่งอาจรวมถึงประเภทข้อมูลที่ไม่ถูกต้อง..

คำถามในหัวข้อ 'pandas'

การแก้ไขชุดย่อยของแถวใน dataframe ของ pandas
สมมติว่าฉันมี DataFrame แพนด้าที่มีสองคอลัมน์ A และ B ฉันต้องการแก้ไข DataFrame นี้ (หรือสร้างสำเนา) เพื่อให้ B อยู่เสมอ NaN ทุกครั้งที่ A เป็น 0 ฉันจะบรรลุเป้าหมายนั้นได้อย่างไร ฉันลองทำสิ่งต่อไปนี้ df['A'==0]['B'] = np.nan และ...
157480 มุมมอง
schedule 26.11.2023

วิธีดำเนินการรวมภายในหรือภายนอกของ DataFrames กับ Pandas บนเกณฑ์ที่ไม่ง่าย
รับสอง dataframes ดังนี้: >>> import pandas as pd >>> df_a = pd.DataFrame([{"a": 1, "b": 4}, {"a": 2, "b": 5}, {"a": 3, "b": 6}]) >>> df_b = pd.DataFrame([{"c": 2, "d": 7}, {"c": 3, "d": 8}]) >>> df_a a b 0...
12827 มุมมอง
schedule 26.11.2023

การสร้างสถิติสรุปจากตัวนับปริมาณการเข้าชมที่มีการประทับเวลา
ฉันกำลังรวบรวมข้อมูลการจราจรเพื่อการใช้งานพิเศษที่มีข้อมูลการจราจรประมาณ ทุก ๆ 10 นาที (แต่ไม่แม่นยำ) ค่าการประทับเวลาของตัวนับการจราจร เช่น: 11:45 100 11:56 110 12:05 120 12:18 130 ... นี่คือข้อมูลที่ฉันมีและฉันไม่สามารถปรับปรุงสิ่งนั้นได้...
423 มุมมอง
schedule 14.12.2023

การซิงโครไนซ์ข้อมูลใน Python (หรือ Excel)
ฉันใช้ Python บ่อยครั้ง (และ Excel เป็นครั้งคราว) เพื่อประมวลผลและเปรียบเทียบข้อมูลการทดสอบระหว่างการทดลองหลายครั้ง ในบางกรณีข้อมูลอาจไม่ตรงกันซึ่งทำให้การเปรียบเทียบโดยตรงทำได้ยาก ตัวอย่างเช่น ข้อกำหนดการทดสอบทั่วไปจะเป็นดังนี้: 1) Stabilize...
1332 มุมมอง
schedule 04.01.2024

วิธีใช้วัตถุ python pandas groupby หรือ .DataFrameGroupBy เพื่อสร้างรายการชุดค่าผสมที่ไม่ซ้ำใคร
มีวิธีที่มีประสิทธิภาพมากกว่าในการใช้วัตถุ pandas groupby หรือ pandas.core.groupby.DataFrameGroupBy เพื่อสร้างรายการ ซีรีส์ หรือ dataframe ที่ไม่ซ้ำใคร โดยที่ฉันต้องการชุดค่าผสมที่ไม่ซ้ำกันของ 2 คอลัมน์จาก N คอลัมน์ เช่น หากฉันมีคอลัมน์: วันที่ ชื่อ...
2272 มุมมอง
schedule 26.12.2023

การแปลง pandas.tslib.Timestamp เป็น datetime python
ฉันมีอนุกรมเวลา df ฉันแยกดัชนีแล้วและต้องการแปลงแต่ละรายการเป็น datetime คุณจะทำอย่างนั้นได้อย่างไร? ฉันพยายามใช้ pandas.to_datetime(x) แต่มันไม่แปลงเมื่อฉันตรวจสอบหลังจากใช้ type()
80358 มุมมอง
schedule 04.12.2023

Python pandas to_sql 'ต่อท้าย'
ฉันกำลังพยายามส่งข้อมูลรายเดือนไปยังฐานข้อมูล MySQL โดยใช้คำสั่ง pandas to_sql ของ Python โปรแกรมของฉันรันข้อมูลครั้งละหนึ่งเดือน และฉันต้องการผนวกข้อมูลใหม่เข้ากับฐานข้อมูลที่มีอยู่ อย่างไรก็ตาม Python ให้ข้อผิดพลาดแก่ฉัน:...
10634 มุมมอง
schedule 10.11.2023

'gcc' ล้มเหลวระหว่างการสร้างแพนด้าบน AWS Elastic Beanstalk
รับข้อผิดพลาดต่อไปนี้เมื่อพยายามติดตั้ง Pandas (0.16.0) ซึ่งอยู่ในไฟล์ needs.txt ของฉันบนอินสแตนซ์ AWS Elastic Beanstalk EC2: building 'pandas.msgpack' extension gcc -pthread -fno-strict-aliasing -O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2...
4876 มุมมอง

เกิดข้อผิดพลาดในการคัดลอกออบเจ็กต์คอมโพสิตที่ประกอบด้วย pandas.DataFrame เป็นส่วนใหญ่
ฉันพยายามใช้ องค์ประกอบ กับ pandas.DataFrame ด้วยวิธีต่อไปนี้ แต่มันทำให้ฉันมีข้อผิดพลาดเมื่อฉันพยายามคัดลอกวัตถุ import numpy as np import pandas as pd import copy class Foo(object): """ Foo is composed mostly of a pd.DataFrame, and...
653 มุมมอง
schedule 17.12.2023

รวมคอลัมน์และสร้างคอลัมน์ใหม่ด้วยนุ่น
ฉันมี dataframe แพนด้าที่มีคอลัมน์ต่อไปนี้: ชื่อผลิตภัณฑ์ จำนวนผลิตภัณฑ์ที่ขายในนิวยอร์ก (สมมติว่า 100) จำนวนผลิตภัณฑ์ที่ขายในแคลิฟอร์เนีย (สมมติว่า 50) ดูเหมือนว่านี้: Product New York California Widget01 100 50...
790 มุมมอง
schedule 17.01.2024

เปลี่ยนค่าหากบรรลุเงื่อนไขบางอย่างติดต่อกันใน Pandas
ฉันจะเปลี่ยนค่าของค่า DataFrame บางค่าเฉพาะในกรณีที่ตรงตามเงื่อนไขบางประการ n จำนวนครั้งติดต่อกัน ตัวอย่าง: df = pd.DataFrame(np.random.randn(15, 3)) df.iloc[4:8,0]=40 df.iloc[12,0]=-40 df.iloc[10:12,1]=-40 ซึ่งให้ DF นี้แก่ฉัน:...
1035 มุมมอง
schedule 02.01.2024

pandas hasnan() บน Series ให้ "TypeError: วัตถุ 'numpy.bool_' ไม่สามารถเรียกได้
ในการทดสอบของฉัน ฉันมีเมธอด check_nulls เพื่อตรวจสอบคอลัมน์เฉพาะเพื่อหาค่าว่าง def check_nulls(self, name, column_list): """ Ensure that the table given has no nulls in any of the listed columns @param name the name of the...
971 มุมมอง
schedule 03.01.2024

ValueError: การตั้งค่าองค์ประกอบอาร์เรย์ด้วยลำดับ สำหรับแพนด้า
ฉันมี Pandas dataframe เรียกว่า output ปัญหาพื้นฐานคือ ฉันต้องการตั้งค่าแถว คอลัมน์ใน dataframe เป็นรายการโดยใช้ฟังก์ชัน ix และได้รับ ValueError: setting an array element with a sequence. ความเข้าใจของฉันคือองค์ประกอบ dataframe...
23955 มุมมอง
schedule 13.12.2023

ความเท่าเทียมกันของ Pandas DataFrame - การกำหนดหมายเลขดัชนี
การกำหนดหมายเลขดัชนีมีความสำคัญในการทดสอบความเท่าเทียมกันของดาต้าเฟรมหรือไม่ ฉันมี 2 dataframe ที่เหมือนกันซึ่งมีข้อมูลและคอลัมน์เหมือนกันทุกประการ ข้อแตกต่างเพียงอย่างเดียวคือหมายเลขดัชนีสำหรับแต่ละแถวแตกต่างกัน และวิธีการเท่ากับจะส่งกลับค่าเท็จ...
1844 มุมมอง
schedule 17.01.2024

Pandas: การจัดทำดัชนีบูลีนด้วยไวยากรณ์ 'รายการในรายการ'
สมมติว่าฉันมี DataFrame พร้อมคอลัมน์ชื่อ col1 หากฉันต้องการได้แถวทั้งหมดโดยที่ col1 == 'a' ฉันสามารถทำได้ด้วย: df[df.col1 == ‘a’] ถ้าฉันต้องการแถวที่ col1 คือ 'a' หรือ 'b' ฉันสามารถทำได้: df[(df.col1 == ‘a’) | (df.col1 == ‘b’)]...
3218 มุมมอง
schedule 05.01.2024

การแปลงและการสร้างคอลัมน์ใน data frame โดยใช้ python
ฉันกำลังสร้างสคริปต์หลามที่คำนวณสถิติ d' โดยใช้ข้อมูลจากไฟล์ CSV แต่ข้อมูลใน CSV จำเป็นต้องได้รับการจัดการเพื่อให้สามารถคำนวณ d' ได้ คำถามของฉัน: ฉันต้องใช้โค้ดใดในการแปลงข้อมูลใน data frame ที่สร้างจาก csv รายละเอียด:...
59 มุมมอง
schedule 17.01.2024

จัดเรียงสตริงในคอลัมน์และพิมพ์กราฟ
ฉันมีดาต้าเฟรม แต่สตริงทั้งหมดซ้ำกัน และเมื่อฉันลองพิมพ์กราฟ มันมีคอลัมน์ที่ซ้ำกัน ฉันพยายามลบมัน แต่กราฟของฉันก็พิมพ์ไม่ถูกต้อง CSV ของฉัน ที่นี่ ดาต้าเฟรม common_users : used_at common users pair of websites 0...
123 มุมมอง
schedule 22.01.2024

การดำเนินการบน dataframe ของ pandas ระหว่างค่าของคอลัมน์/แถวที่ระบุ
ใหม่สำหรับแพนด้า ฉันพยายามจัดการการดำเนินการ dataframe บางอย่างกับ pandas โดยที่ฉันมี 4 คอลัมน์บน dataframe แบบหลายดัชนี และที่ที่ฉันต้องการคอลัมน์พิเศษโดยที่ค่าในคอลัมน์นั้นจะเท่ากับค่าในหนึ่งแถวหารด้วย แถวเฉพาะ ในตัวอย่างของฉันด้านล่าง...
1476 มุมมอง
schedule 27.10.2023

python pandas groupby และลบคอลัมน์ออกจากกลุ่มต่างๆ
ฉันมีดาต้าเฟรม df1 pid stat h1 h2 h3 h4 h5 h6 ... h20 1 a 3.2 3.5 6.2 7.1 1.2 2.3 ... 3.2 1 b 3.3 1.5 4.2 7.7 4.2...
799 มุมมอง
schedule 10.12.2023

สร้างดาต้าเฟรมจากคู่ค่าที่ไม่ซ้ำโดยการกรองหลายคอลัมน์
ฉันต้องการกรองค่าในหลายคอลัมน์เพื่อสร้าง dataframes สำหรับชุดค่าผสมที่ไม่ซ้ำ ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม นี่คือรหัสของฉันที่ล้มเหลว (ระบุ dataframe df): dd = defaultdict(dict) #create blank default dictionary values_col1 =...
462 มุมมอง
schedule 10.12.2023